总而言之一句话——学习数据挖掘,不是为了炫的,而是为了用的!
数据挖掘技术在零售、保险、电信、电力等行业的运用已经显示出巨大的商业价值并逐步向其他行业渗透,数据挖掘是新型的商业分析处理技术,它是从大型数据仓库中发现并提取隐藏在其中的信息的一种新技术,帮助决策者寻找数据间潜在的关联,发现被忽略的因素,它不仅是面向特定数据库的简单检索查询调用,而且要求对这些数据进行微观、中观乃至宏观的统计、分析、综合和推理,以指导实际问题的求解,企图发现事件间的相互关联,甚至利用已有的数据对未来的活动进行预测,这些信息和因素对预测趋势和决策行为是至关重要的,随着信息化进程的不断推进,企业信息化工作发展迅速,各种辅助管理软件(ERP、CRM、SCM、PDM等)在企业中都得到了广泛的应用,而这些辅助软件的核心就是数据库技术,随着数据库技术的发展,数据仓库、数据集市的建立,企业存储有大量的管理资料、客户资料和生产资料,如何从中提取出隐藏在其中的信息,帮助决策者进行决策,是企业面临的问题。
为此,本贴汇集了一些数据挖掘分析在企业中应用的帖子,供大家参考:
首先,我们应当知道,数据挖掘在商业应用中的角色概览——
1. 基于数据挖掘的企业竞争力的提升
2. 利用客户信息和数据挖掘技术为企业创造利润
3. 云时代的企业应用数据挖掘
4. 数据挖掘在企业中应用的四种途径
接下来,我们还要了解数据挖掘怎样解决问题——
1. DEA数据包络分析模型在企业数据分析中的应用
2. 智能优化算法及其应用
3. 水晶易表经典案例赏析
4. matlab金融数据挖掘与应用,非常实用的
5. 用户行为分析与数据挖掘模型研究与应用
6. 支付宝数据平台技术及应用
7. 数据挖掘在华夏银行CRM中的应用研究
对于这两年炒的火热的云计算,咱们也了解一下——
1. 云计算在中国的发展路线图
2. 预测:云计算领域的5大变革
3. 浅谈云计算与数据中心计算
4. 云计算回归商业应用
5. 云计算与数据存储结合的难点分析
最后呢,我们对数据挖掘在商业应用中的基本步骤做个归纳——
一、选择适当的商务问题,并将商务问题转换为数据挖掘任务
任何分析都是基于现实需要产生的,企业要进行数据挖掘肯定是碰到了业务上无法理解的问题,比如书中就给出了我认为很实际的几个问题
1、即使找出10000个最有可能在10月流失的高端移动电话客户,以便在九月开始举办电话营销活动。
2、在德州,针对快餐店的谷类食品,找出西班牙和非西班牙购物者的购物种类的差别,从而更好的指导西班牙语的广告营销活动。
3、通过发现最佳客户的共同点来指导扩充计划,并且定位于能发现相似客户的新市场
4、在公司数据仓库的客户之间建立模型,识别高价值客户,从而能够有针对性的将有关信息传递给适当的客户
5、预测后几个月的债务回收预期程度,以便设法制定一个计划。
这些例子体现了数据挖掘致力解决的问题的多样化,在提出这些问题后,首先要做的就是把这些问题转化成数据挖掘任务,包括
分类
估计
预测
关联规则
聚类
二、识别和收集能转化成可操作信息的数据并转化成客户特征数据
三、探索原始数据和准备模型开发环境
四、建模
五、试验并测量试验结果
在模型大规模应用之前要先进性小范围的试验来验证模型的效果如何
比如测定一个响应模型的效果,可以通过追踪四个不同群组的响应来完成
1、群体A 由数据挖掘模型选择的高响应客户,并接受促销服务
2、群体B 随机选择的客户,接受相同促销服务
3、群体C 随机选择的客户 不接受促销服务
4、群体D 由模型选择的高响应客户,不接受促销服务
如果模型识别响应客户的能力强的话,群体A的响应率应高于群体B,群体D高于群体C。如果服务是有效的,群体B的响应率会高于群体C ,A高于D。如果群体A和D或B与C有相似的响应率,说明促销服务没什么效果
比如一家银行使用模型挑选那些可能通过直接邮寄活动开设投资账户的客户。经过试验,通过模型挑选的人,不管是否收到促销材料,开设投资账户的比例确实高于其他客户,即客户A、D高于B、C,这说明模型是有效的。如果进一步表明,A和D的比例近似,则说明邮寄促销材料的促销方式没什么用(可能是因为这种促销方式被银行大规模的广告促销方式给掩盖了吧)。在实际应用中,也可以去掉C组,只采用三组进行测试
如果模型效果好,就可以将模型进行大规模应用了。