请选择 进入手机版 | 继续访问电脑版
楼主: littlelianglian
2978 3

[工商管理] 十个案例玩转数据挖掘——远程教学 [推广有奖]

贵宾

学术权威

72%

还不是VIP/贵宾

-

威望
3
论坛币
497776 个
通用积分
9293.7569
学术水平
355 点
热心指数
303 点
信用等级
328 点
经验
105005 点
帖子
3169
精华
16
在线时间
3268 小时
注册时间
2013-9-4
最后登录
2023-12-23

一级伯乐勋章 初级学术勋章 初级信用勋章

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

《十个案例玩转数据挖掘》远程课程



培训形式       远程授课,随报随学

培训费用       2500元

授课时间       连续两个周末




◆学员对象:
(1)从事数据分析相关工作的各企业人员;

(2)从事数据挖掘和统计分析等相关领域教学的高校教师;
(3)有志于从事金融数据挖掘、商业数据挖掘分析工作和数据挖掘理论研究的学生;

(4)有志于学习数据挖掘技术和软件的社会各界人士。


◆授课讲师:

李御玺 (Yue-Shi Lee),国立台湾大学计算机工程博士,铭传大学计算机工程学系教授兼系主任暨所长,铭传大学数据挖掘中心主任,厦门大学数据挖掘中心顾问,中国人民大学数据挖掘中心顾问。其研究领域专注于数据仓库、数据挖掘、与文本挖掘。      


在其相关研究领域已发表超过260篇以上的研究论文,同时也是国科会与教育部多个相关研究计划的主持人。服务过的客户包括:中国工商局、中信银行、台新银行、联邦银行、新光银行、 新竹国际商业银行(现已并入渣打银行)、第一银行、永丰银行、远东银行、美商大都会人寿、嘉义基督教医院、台湾微软、零售业如赫莲娜(Helena Rubinstein)化妆品公司、特立和乐(HOLA)公司、航空公司如东方航空公司、中华航空公司、汽车行业如福特(Ford)汽车公司;政府行业如国税局等。


◆课程目标:

本课程采用SPSS MODELER  实现数据挖掘功能,具有简单易学、功能强大、专业等特点。让您的数据挖掘分析变得如此简单、便捷!
本课程系统介绍数据挖掘理论和软件操作以及实际数据的案例分析,为学员奠定扎实的数据挖掘理论基础和实际的分析能力。

本课程理论结合实际,更偏重于实际应用。通过对十个各个行业的数据挖掘案例分析,并详细讲解软件的操作和结果的解释。



◆课程内容:


第一部分: 大數據時代(The Era of Big Data)


1. 大数据的起源

2. 大数据与智能手机、感知装置、物联网、社群媒体及云计算的关系

3. 大数据应用的成功案例

4. 大数据的未来趋势

5. 大数据时代的思维变革

6. 社群大数据的应用

7. 移动大数据的应用

8. 文本数据下的舆情分析

9. 大数据的迷思(大数据还是大错误)


第二部分: 数据挖掘基础(Basic Concept)


1. 大数据的核心关键技术-数据挖掘

2. 数据挖掘的发展历程

3. 数据挖掘的进行步骤

4. 数据挖掘的产业标准(CRISP DM & SEMMA)

5. 基本数据挖掘技术简介(查询工具、统计技术、可视化技术、K-最近邻技术、…)

6. 进阶数据挖掘技术简介(分类、预测、关联规则、序列型样、聚类、…)

7. 数据挖掘的绩效评估及顾客数优化

8. 问题导向式数据挖掘分析流程

9. 大数据如何取得?如何开始进行企业的数据挖掘项目?

10. 数据挖掘的未来趋势


SPSS Modeler实作: 评估新车设计案例



第三部分: 数据挖掘技术(Data Mining Techniques)及实务建模(Practical Models)


1.  数据前处理(Data Preprocessing)

*字段的选择:多重数据源的整合

*数据的清洗:数据质量报告(Data Quality Report)的制作、空值(Missing Value)、错误值(Wrong Value)及离群值(Outlier)的侦测及处理方式

*字段的扩充:外部数据的整并及内部数据的统整

*数据的编码:

  (1)   数据正规化(Data Normalization)技术

  (2)   数据一般化(Generalization)技术

  (3)   数据离散化(Data Discretization)技术

  (4)   数据连续性指派(Continuousness Arbitrary)技术

  (5)   记录精简(Record Reduction)技术

  (6)   域值精简(Value Reduction)技术

  (7)    字段精简(Attribute Reduction)技术

*如何将原始数据依母体目标字段上的比例分成训练及测试数据集


SPSS Modeler实作:

(1) 药物治疗案例

(2) 电信客户流失案例

(3) 自动数据准备



2. 关键字段/变量发掘技术

*數值型关键变量发掘

*類別型关键变量发掘

*利用统计检定(Statistical Test)的方法发掘关键变量

*利用机器学习(Machine Learning)方法发掘关键变量

*变量共线性(Collinear)问题


SPSS Modeler实作: 银行信用风险评估之进件评分卡(Application Scorecard)案例



3. 分类技术(Classification Techniques) – 贝氏网络 (Bayes Net)

*简单贝氏网络(Naive Bayes)原理

*机率为0的处理方式

*空值(Missing Value)的处理

*数值型字段的处理

*进阶贝氏网络原理(TAN, Markov Blanket)

*分類模型效能的評估方式(Gain Chart, Lift Chart, Profit Chart, Confusion Matrix, Precision, Recall, F-Measure, …)


SPSS Modeler实作: 银行目标客户营销(Target Marketing)案例



4. 预测技术(Prediction Techniques) – 线性回归 (Linear Regression)

*简单线性回归(Simple Linear Regression)原理

*复回归(Multiple Linear Regression)原理

*皮尔森相关系数(Pearson Correlation Coefficient)

*预测模型效能的评估方式(Scatter Plot, Mean Absolute Error, Mean Squared Error, R2, …)


SPSS Modeler实作:汽车油耗预测案例



5.  分类及预测技术 (Classification & Prediction Techniques) – 决策树 (Decision Tree)

*分类树(Classification Tree)原理(ID3, C4.5, C5.0, CART, CHAID, …)

*分类字段的选择方法(Information Gain, Gain Ratio, Gini Index, Chi-Square, …)

*分类树与分类规则(Classification Rules)之差异

*数值型字段的处理

*空值(Missing Value)的处理

*分类的修剪(Tree Pruning):避免Overfitting的问题

*回归树(Regression Tree)原理(CART, …)

*回归树进阶:Model Tree (M5)


SPSS Modeler实作:电信产品跨销售(Cross-Selling)案例



6.  分类及预测技术 (Classification & Prediction Techniques) – 类神经网络 (Neural Network)

*倒传递类神经网络(Backpropagation Neural Network)原理

*数值型字段的一般化(Generalization)处理

*类别型字段的摊平(Flattening)处理

*倒传递类神经网络的权重调整

*倒传递类神经网络与罗吉斯回归, 线性回归, 非线性回归间的关系

*倒传递类神经网络如何处理分类的问题

*倒传递类神经网络如何处理预测的问题


SPSS Modeler实作:

(1) 细胞样本分类案例

(2) 零售促銷案例



7.        分类技术 (Classification Techniques) –罗吉斯回归 (Logistic Regression)

*罗吉斯回归 (Logistic Regression)原理

*数值型字段的一般化(Generalization)处理

*类别型字段的摊平(Flattening)处理

*罗吉斯回归的权重调整

*罗吉斯回归的字段选择方式(Forward, Backward, Stepwise, …)


SPSS Modeler实作:

(1) 电信客户分类(不同套餐选择)案例

(2) 电信客户流失案例



8.  预测技术(Prediction Techniques) – 时间序列 (Time Series)

*时间序列原理

*时间序列方法:时间序列法(Time Series Method)及因果预测法(Causal Method)

*时间序列類型:平稳 (Stationary)及非平稳(Non- Stationary)的时间序列

*时间序列方法進階:指數平滑法(Exponential Smoothing)

*时间序列方法進階:ARIMA (Autoregressive Integrated Moving Average)


SPSS Modeler实作:

(1) 全国网络带宽使用预测案例

(2) 男装销售金额预测案例



9. 聚类技术(Clustering Techniques) – K-Means, Kohonen SOM, Two-Step

*聚类原理

*距离的计算方法:Simple Matching Coefficient, Jaccard Coefficient, City Block Distance, Euclidean Distance

*聚类方法的分类:Exclusive Clustering & Non-Exclusive (Overlapping) Clustering

*Exclusive Clustering方法的分类:Hierarchical Methods & Partitioning Methods

*Partitioning Methods原理:K-Means, Kohonen SOM, Two-Step


SPSS Modeler实作:银行客户聚类(Customer Segmentation)及营销活动设计案例



10. 关联规则及序列型样技术(Association Rules & Sequential Patterns Techniques) – Apriori & AprioriAll

*关联规则及序列型样原理

*支持度(Support)及信赖度(Confidence)的计算方式

*关联规则方法:Apriori原理

*产品相关性分析

*虚拟产品(Virtual Items)于关联规则上的应用

*大数据下的关联规则挖掘

*序列型样方法:AprioriAll原理


SPSS Modeler实作:

(1) 零售购物篮分析案例

(2) 零售向上销售(Up-Selling)案例




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据挖掘 远程教学 SPSS Modeler Partitioning Segmentation 台湾大学 厦门大学 计算机工程 高校教师 工程学




CDA数据分析交流群 217748971

使用道具

lcskulluvil 发表于 2015-1-26 23:16:12 |显示全部楼层 |坛友微信交流群
it sounds good

使用道具

滕雪 发表于 2015-4-4 21:42:45 |显示全部楼层 |坛友微信交流群
略贵!!!

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-17 03:49