10个案例玩转数据挖掘
SPSS Modeler数据挖掘实务应用培训
培训时间: 2014年11月13-16日(4天)@北京 授课安排: (1) 授课方式:中文多媒体互动式授课方式 (2) 授课时间:上午9:00-12:00,下午13:30-16:30(16:30-17:00答疑) (3) 所有软件:SPSS Modeler 邀请函下载: 数据挖掘班邀请函 访问码:9822 |
讲师介绍:
李御玺 (Yue-Shi Lee),国立台湾大学计算机工程博士,铭传大学计算机工程学系教授兼系主任暨所长,铭传大学数据挖掘中心主任,厦门大学数据挖掘中心顾问,中国人民大学数据挖掘中心顾问。其研究领域专注于数据仓库、数据挖掘、与文本挖掘。
在其相关研究领域已发表超过260篇以上的研究论文,同时也是国科会与教育部多个相关研究计划的主持人。服务过的客户包括:中国工商局、中信银行、台新银行、联邦银行、新光银行、 新竹国际商业银行(现已并入渣打银行)、第一银行、永丰银行、远东银行、美商大都会人寿、嘉义基督教医院、台湾微软、零售业如赫莲娜(Helena Rubinstein)化妆品公司、特立和乐(HOLA)公司、航空公司如东方航空公司、中华航空公司、汽车行业如福特(Ford)汽车公司;政府行业如国税局等。
数据挖掘简介:
数据挖掘(Data Mining)运用分类(Classification)、预测(Prediction)、聚类(Clustering)、关联规则(Association Rule)、序列型样(Sequential Pattern)、时间序列(Time Series)及统计方法(Statistical Method)从庞大且纷杂的数据中,找出隐藏、未知且对企业经营有帮助的信息,是精准营销的核心,近年来受到相当广泛的关注,并应用于各种领域的实务中。银行业(Banking)藉由数据挖掘发掘潜在有资金需求的中小企业户(Small-Medium Enterprise),进行信贷营销(Credit Marketing),以及侦测客户的信用风险(Credit Risk)。医疗业(Health Care)藉由数据挖掘侦测病患罹患心脏病(Heart Disease)的机率及罹患糖尿病(Diabetes)的可能性。零售业(Retail)则藉由数据挖掘预测促销活动(Promotion)的成效以及每日的销售量,并评估客户对产品的喜好。电信业(Telecommunication)藉由数据挖掘预测客户流失(Customer Churn)的机率以及何种措施最能将客户挽留(Customer Retention)。保险业(Insurance)则藉由数据挖掘评估车贷(Car Loan)客户会来理赔的可能性,以做为其保费高低的依据。有鉴于此,本培训的目的就是要针对数据挖掘模型的建构方法,以13个实务案例进行实际操作,并做广泛且深入的探讨,有效建构企业营运获利的新模式,使企业利润最大化。主要的对象为企业主管、营销经理人、数据库管理者、高校及科研机构师生。
课程大纲:
案例1:
评估新车设计(汽车业):某汽车制造商开发两种新车(汽车及卡车)的原型。在将新车型引入至产品系列之前,制造商想知道竞争对手已经上市的车辆中,哪些与这两款产品的原型最为相似,以确定这两种新车将与哪些车型展开竞争。此案例将采用K最近邻居(K Nearest Neighbor; KNN)来建模。
案例2:
电信客户流失(电信业):某电信服务提供商非常关注客户流失到竞争对手的数量。假如服务使用的数据可以用来预测哪些客户有可能被转移到另一个供货商,则此供货商可提供客制化的优惠,以尽可能留住客户。此案例将采用二元罗吉斯回归(Binomial Logistic Regression)来预测客户的流失。
案例3:
药物治疗(医疗业):某医学研究中心收集许多患有某疾病的病患数据,并记录哪一种药物对病患是有疗效的(总共有五种针对此疾病的药物)。此案例将采用决策树 C5.0(Decision Tree C5.0)找出,哪种药物适用于哪一种类型的病人。
案例4:
预测贷款逾期者(银行业):某银行希望根据客户过去的贷款数据,利用贝式网络(Bayesian Network)来建模,以便用模型来预测新的贷款者,核贷后会逾期的机率,以做为银行是否核贷的依据,或提供给客户其他类型的贷款产品。
案例5:
电信客户分类(电信业):某电信服务提供商透过客户使用服务的方式,将客户分为四类人。此案例的目的是想根据人口统计数据,利用多元罗吉斯回归(Multinomial Logistic Regression)来找出这四类人的特征,并发掘这四类人的潜在新客户。
案例6:
细胞样本分类(医疗业):某医学研究中心收集癌症病患的细胞样本特征数据,以便进行研究。原始的数据中显示良性样本与恶性样本间的许多特征有显著的差异。此案例的目的是想利用支持向量机(Support Vector Machine)来建模,以便用模型来提早发现某样本是良性还是恶性的样本。
案例7:
零售业销售促销(零售业):此案例的目的是想根据零售产品过去的促销记录,利用神经网络及回归树(Neural Network & Regression Tree)来预测未来的销售成效。
案例8:
预测带宽使用率(通讯业):某全国宽带网络供货商的分析师需进行客户使用网络流量的预估,以便预测带宽的使用。全国网络的使用是全国各局域网络使用的加总,因此分析师需逐一对每个区域市场进行带宽使用的预测。此案例的目的是想利用简单的时间序列模型(Simple Time Series Model)来预测每个区域市场下三个月的带宽使用量。
案例9:
预测型录商品的销售(零售业):某型录公司希望根据过去10年的销售记录,来预测男装生产线每月的销售。此案例的目的是想利用两个时间序列模型-指数平滑(Exponential Smoothing)和ARIMA来解决这个问题。
案例10:
购物篮分析(零售业):此案例的目的是想根据会员卡所记录的客户的个人信息及每次购买商品的数据,利用关联模型(Apriori)和决策树C5.0(Decision Tree C5.0)来发掘购买类似商品的客群,以及客群的特征(例如,年龄、收入、等)。
T:配套资料:
课程配套讲义、数据及视频
学费及培训优惠
学费: 4500元(含税、培训费、资料费、配套视频)
学生3000元(培训费、资料费、配套视频)
证书费用:400元,可以申请《数据分析师》证书(工业和信息化部教育与考试中心颁发)
优惠方案:
(1)2人同时报名,9.5折优惠
(2)3人及以上同时报名9折优惠,5人以上8折优惠
(3)论坛课程老学员9折优惠 以上优惠不累计
差旅及食宿费用自理
汇款方式:支持在线支付,银行汇款等多种方式,详情请查看:
http://baoming.pinggu.org/paycenter.aspx
报名流程及咨询
1.提交报名信息:http://www.peixun.net/view/62_join.html
2.确认报名信息>>发预习资料
3.申请证书学员,提交照片等申请材料。结课后当天参加考试,通过者颁发证书
4.开课前一周发送培训教室路线图,培训现场领取发票
联系方式
曹老师
电话: 18010116775
010-68472925
QQ:2881989717
邮箱: tr.service@pinggu.org