对数据挖掘情有独钟,一心想要学习精通;
用SAS? R? Python?不会不想不愿编码肿么破?
幸运的小编在11月13-16号参加了李御玺老师的数据挖掘课程!
李老师的课程有什么好? 不用编码,点点鼠标,分分钟搞定数据挖掘。
SPSS MODELER就是这样,简单的操作;干净的界面;专业的数据挖掘软件!
...
这门课,是技术、也是艺术。
用幽默的授课方式,给你不一样的数据挖掘感观!
用强悍的行业经验,教你不寻常的数据挖掘技巧!
数据挖掘基础+进阶+十个行业案例,让铭传大学教授李御玺老师--带你玩转数据挖掘!
培训时间 2015年7月11-12日;7月18-19日(远程直播) 2015年7月23-26日(现场面授)
培训地点 北京
培训费用 现场费用: 4500 / 3000元 (全日制本科生及研究生)
远程费用: 2800/2200元 (全日制本科生及研究生)
授课安排 上午9:00-12:00;下午1:30-4:30;答疑4:30-5:00
小班授课,限报20人
◆学员对象:
(1)从事数据分析相关工作的各企业人员;
(2)从事数据挖掘和统计分析等相关领域教学的高校教师;
(3)有志于从事金融数据挖掘、商业数据挖掘分析工作和数据挖掘理论研究的学生;
(4)有志于学习数据挖掘技术和软件的社会各界人士。
◆授课讲师:
李御玺 (Yue-Shi Lee),国立台湾大学计算机工程博士,铭传大学计算机工程学系教授兼系主任暨所长,铭传大学数据挖掘中心主任,厦门大学数据挖掘中心顾问,中国人民大学数据挖掘中心顾问。其研究领域专注于数据仓库、数据挖掘、与文本挖掘。
在其相关研究领域已发表超过260篇以上的研究论文,同时也是国科会与教育部多个相关研究计划的主持人。服务过的客户包括:中国工商局、中信银行、台新银行、联邦银行、新光银行、 新竹国际商业银行(现已并入渣打银行)、第一银行、永丰银行、远东银行、美商大都会人寿、嘉义基督教医院、台湾微软、零售业如赫莲娜(Helena Rubinstein)化妆品公司、特立和乐(HOLA)公司、航空公司如东方航空公司、中华航空公司、汽车行业如福特(Ford)汽车公司;政府行业如国税局等。
◆课程目标:
本课程采用SPSS MODELER 实现数据挖掘功能,具有简单易学、功能强大、专业等特点。让您的数据挖掘分析变得如此简单、便捷!
本课程系统介绍数据挖掘理论和软件操作以及实际数据的案例分析,为学员奠定扎实的数据挖掘理论基础和实际的分析能力。
本课程理论结合实际,更偏重于实际应用。通过对十个各个行业的数据挖掘案例分析,并详细讲解软件的操作和结果的解释。
◆课程内容:
第一部分: 大數據時代(The Era of Big Data)
1. 大数据的起源
2. 大数据与智能手机、感知装置、物联网、社群媒体及云计算的关系
3. 大数据应用的成功案例
4. 大数据的未来趋势
5. 大数据时代的思维变革
6. 社群大数据的应用
7. 移动大数据的应用
8. 文本数据下的舆情分析
9. 大数据的迷思(大数据还是大错误)
第二部分: 数据挖掘基础(Basic Concept)
1. 大数据的核心关键技术-数据挖掘
2. 数据挖掘的发展历程
3. 数据挖掘的进行步骤
4. 数据挖掘的产业标准(CRISP DM & SEMMA)
5. 基本数据挖掘技术简介(查询工具、统计技术、可视化技术、K-最近邻技术、…)
6. 进阶数据挖掘技术简介(分类、预测、关联规则、序列型样、聚类、…)
7. 数据挖掘的绩效评估及顾客数优化
8. 问题导向式数据挖掘分析流程
9. 大数据如何取得?如何开始进行企业的数据挖掘项目?
10. 数据挖掘的未来趋势
SPSS Modeler实作: 评估新车设计案例
第三部分: 数据挖掘技术(Data Mining Techniques)及实务建模(Practical Models)
1. 数据前处理(Data Preprocessing)
*字段的选择:多重数据源的整合
*数据的清洗:数据质量报告(Data Quality Report)的制作、空值(Missing Value)、错误值(Wrong Value)及离群值(Outlier)的侦测及处理方式
*字段的扩充:外部数据的整并及内部数据的统整
*数据的编码:
(1) 数据正规化(Data Normalization)技术
(2) 数据一般化(Generalization)技术
(3) 数据离散化(Data Discretization)技术
(4) 数据连续性指派(Continuousness Arbitrary)技术
(5) 记录精简(Record Reduction)技术
(6) 域值精简(Value Reduction)技术
(7) 字段精简(Attribute Reduction)技术
*如何将原始数据依母体目标字段上的比例分成训练及测试数据集
SPSS Modeler实作:
(1) 药物治疗案例
(2) 电信客户流失案例
(3) 自动数据准备
2. 关键字段/变量发掘技术
*數值型关键变量发掘
*類別型关键变量发掘
*利用统计检定(Statistical Test)的方法发掘关键变量
*利用机器学习(Machine Learning)方法发掘关键变量
*变量共线性(Collinear)问题
SPSS Modeler实作: 银行信用风险评估之进件评分卡(Application Scorecard)案例
3. 分类技术(Classification Techniques) – 贝氏网络 (Bayes Net)
*简单贝氏网络(Naive Bayes)原理
*机率为0的处理方式
*空值(Missing Value)的处理
*数值型字段的处理
*进阶贝氏网络原理(TAN, Markov Blanket)
*分類模型效能的評估方式(Gain Chart, Lift Chart, Profit Chart, Confusion Matrix, Precision, Recall, F-Measure, …)
SPSS Modeler实作: 银行目标客户营销(Target Marketing)案例
4. 预测技术(Prediction Techniques) – 线性回归 (Linear Regression)
*简单线性回归(Simple Linear Regression)原理
*复回归(Multiple Linear Regression)原理
*皮尔森相关系数(Pearson Correlation Coefficient)
*预测模型效能的评估方式(Scatter Plot, Mean Absolute Error, Mean Squared Error, R2, …)
SPSS Modeler实作:汽车油耗预测案例
5. 分类及预测技术 (Classification & Prediction Techniques) – 决策树 (Decision Tree)
*分类树(Classification Tree)原理(ID3, C4.5, C5.0, CART, CHAID, …)
*分类字段的选择方法(Information Gain, Gain Ratio, Gini Index, Chi-Square, …)
*分类树与分类规则(Classification Rules)之差异
*数值型字段的处理
*空值(Missing Value)的处理
*分类的修剪(Tree Pruning):避免Overfitting的问题
*回归树(Regression Tree)原理(CART, …)
*回归树进阶:Model Tree (M5)
SPSS Modeler实作:电信产品跨销售(Cross-Selling)案例
6. 分类及预测技术 (Classification & Prediction Techniques) – 类神经网络 (Neural Network)
*倒传递类神经网络(Backpropagation Neural Network)原理
*数值型字段的一般化(Generalization)处理
*类别型字段的摊平(Flattening)处理
*倒传递类神经网络的权重调整
*倒传递类神经网络与罗吉斯回归, 线性回归, 非线性回归间的关系
*倒传递类神经网络如何处理分类的问题
*倒传递类神经网络如何处理预测的问题
SPSS Modeler实作:
(1) 细胞样本分类案例
(2) 零售促銷案例
7. 分类技术 (Classification Techniques) –罗吉斯回归 (Logistic Regression)
*罗吉斯回归 (Logistic Regression)原理
*数值型字段的一般化(Generalization)处理
*类别型字段的摊平(Flattening)处理
*罗吉斯回归的权重调整
*罗吉斯回归的字段选择方式(Forward, Backward, Stepwise, …)
SPSS Modeler实作:
(1) 电信客户分类(不同套餐选择)案例
(2) 电信客户流失案例
8. 预测技术(Prediction Techniques) – 时间序列 (Time Series)
*时间序列原理
*时间序列方法:时间序列法(Time Series Method)及因果预测法(Causal Method)
*时间序列類型:平稳 (Stationary)及非平稳(Non- Stationary)的时间序列
*时间序列方法進階:指數平滑法(Exponential Smoothing)
*时间序列方法進階:ARIMA (Autoregressive Integrated Moving Average)
SPSS Modeler实作:
(1) 全国网络带宽使用预测案例
(2) 男装销售金额预测案例
9. 聚类技术(Clustering Techniques) – K-Means, Kohonen SOM, Two-Step
*聚类原理
*距离的计算方法:Simple Matching Coefficient, Jaccard Coefficient, City Block Distance, Euclidean Distance
*聚类方法的分类:Exclusive Clustering & Non-Exclusive (Overlapping) Clustering
*Exclusive Clustering方法的分类:Hierarchical Methods & Partitioning Methods
*Partitioning Methods原理:K-Means, Kohonen SOM, Two-Step
SPSS Modeler实作:银行客户聚类(Customer Segmentation)及营销活动设计案例
10. 关联规则及序列型样技术(Association Rules & Sequential Patterns Techniques) – Apriori & AprioriAll
*关联规则及序列型样原理
*支持度(Support)及信赖度(Confidence)的计算方式
*关联规则方法:Apriori原理
*产品相关性分析
*虚拟产品(Virtual Items)于关联规则上的应用
*大数据下的关联规则挖掘
*序列型样方法:AprioriAll原理
SPSS Modeler实作:
(1) 零售购物篮分析案例
(2) 零售向上销售(Up-Selling)案例
T:配套资料:
课程配套独家讲义、数据及同步录制视频
远程费用:2800/2200(凭学生证优惠)
证书费用:另收400元,可以申请《数据分析师》证书(工业和信息化部教育与考试中心颁发)
优惠方案:
(1)2人同时报名,9.5折优惠
(2)3人及以上同时报名9折优惠,5人以上8折优惠
(3)论坛现场课程老学员9折优惠 以上优惠不累计
差旅及食宿费用自理
汇款方式:支持在线支付,银行汇款等多种方式,详情请查看:
http://baoming.pinggu.org/paycenter.aspx
报名流程及咨询:
1.提交报名信息:http://www.peixun.net/view/331_join.html
2.确认报名信息>>发预习资料;
3.申请证书学员,提交照片等申请材料,完成课时学习者即可申请;
4.开课前一周发送培训教室路线图,培训现场领取发票;
咨询方式:
座机: (010)68456523
QQ:2881989712
手机:13718534278(张老师)
18010116775 (曹老师)