十个案例玩转数据挖掘——远程教学 - 学术资源/课程/会议/讲座

0关注
146
粉丝

贵宾

学术权威

72%

还不是VIP/贵宾

-

0%

威望: 3 级
论坛币: 497776 个
通用积分: 9293.7569
学术水平: 355 点
热心指数: 303 点
信用等级: 328 点
经验: 105005 点
帖子: 3169
精华: 16
在线时间: 3268 小时
注册时间: 2013-9-4
最后登录: 2023-12-23

littlelianglian 发表于 2015-1-26 10:37:39 |显示全部楼层 |坛友微信交流群

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

《十个案例玩转数据挖掘》远程课程

培训形式 远程授课，随报随学

培训费用 2500元

授课时间 连续两个周末

◆学员对象：
(1)从事数据分析相关工作的各企业人员；

(2)从事数据挖掘和统计分析等相关领域教学的高校教师；
(3)有志于从事金融数据挖掘、商业数据挖掘分析工作和数据挖掘理论研究的学生；

(4)有志于学习数据挖掘技术和软件的社会各界人士。

◆授课讲师：

李御玺 (Yue-Shi Lee),国立台湾大学计算机工程博士，铭传大学计算机工程学系教授兼系主任暨所长，铭传大学数据挖掘中心主任，厦门大学数据挖掘中心顾问，中国人民大学数据挖掘中心顾问。其研究领域专注于数据仓库、数据挖掘、与文本挖掘。

在其相关研究领域已发表超过260篇以上的研究论文,同时也是国科会与教育部多个相关研究计划的主持人。服务过的客户包括：中国工商局、中信银行、台新银行、联邦银行、新光银行、新竹国际商业银行(现已并入渣打银行)、第一银行、永丰银行、远东银行、美商大都会人寿、嘉义基督教医院、台湾微软、零售业如赫莲娜(Helena Rubinstein)化妆品公司、特立和乐(HOLA)公司、航空公司如东方航空公司、中华航空公司、汽车行业如福特(Ford)汽车公司；政府行业如国税局等。

◆课程目标：

本课程采用SPSS MODELER 实现数据挖掘功能，具有简单易学、功能强大、专业等特点。让您的数据挖掘分析变得如此简单、便捷！
本课程系统介绍数据挖掘理论和软件操作以及实际数据的案例分析，为学员奠定扎实的数据挖掘理论基础和实际的分析能力。
本课程理论结合实际，更偏重于实际应用。通过对十个各个行业的数据挖掘案例分析，并详细讲解软件的操作和结果的解释。

◆课程内容：

第一部分: 大數據時代(The Era of Big Data)

1. 大数据的起源

2. 大数据与智能手机、感知装置、物联网、社群媒体及云计算的关系

3. 大数据应用的成功案例

4. 大数据的未来趋势

5. 大数据时代的思维变革

6. 社群大数据的应用

7. 移动大数据的应用

8. 文本数据下的舆情分析

9. 大数据的迷思(大数据还是大错误)

第二部分: 数据挖掘基础(Basic Concept)

1. 大数据的核心关键技术-数据挖掘

2. 数据挖掘的发展历程

3. 数据挖掘的进行步骤

4. 数据挖掘的产业标准(CRISP DM & SEMMA)

5. 基本数据挖掘技术简介(查询工具、统计技术、可视化技术、K-最近邻技术、…)

6. 进阶数据挖掘技术简介(分类、预测、关联规则、序列型样、聚类、…)

7. 数据挖掘的绩效评估及顾客数优化

8. 问题导向式数据挖掘分析流程

9. 大数据如何取得？如何开始进行企业的数据挖掘项目？

10. 数据挖掘的未来趋势

SPSS Modeler实作: 评估新车设计案例

第三部分: 数据挖掘技术(Data Mining Techniques)及实务建模(Practical Models)

1. 数据前处理(Data Preprocessing)

*字段的选择：多重数据源的整合

*数据的清洗：数据质量报告(Data Quality Report)的制作、空值(Missing Value)、错误值(Wrong Value)及离群值(Outlier)的侦测及处理方式

*字段的扩充：外部数据的整并及内部数据的统整

*数据的编码：

(1) 数据正规化(Data Normalization)技术

(2) 数据一般化(Generalization)技术

(3) 数据离散化(Data Discretization)技术

(4) 数据连续性指派(Continuousness Arbitrary)技术

(5) 记录精简(Record Reduction)技术

(6) 域值精简(Value Reduction)技术

(7) 字段精简(Attribute Reduction)技术

*如何将原始数据依母体目标字段上的比例分成训练及测试数据集

SPSS Modeler实作:

(1) 药物治疗案例

(2) 电信客户流失案例

(3) 自动数据准备

2. 关键字段/变量发掘技术

*數值型关键变量发掘

*類別型关键变量发掘

*利用统计检定(Statistical Test)的方法发掘关键变量

*利用机器学习(Machine Learning)方法发掘关键变量

*变量共线性(Collinear)问题

SPSS Modeler实作: 银行信用风险评估之进件评分卡(Application Scorecard)案例

3. 分类技术(Classification Techniques) – 贝氏网络 (Bayes Net)

*简单贝氏网络(Naive Bayes)原理

*机率为0的处理方式

*空值(Missing Value)的处理

*数值型字段的处理

*进阶贝氏网络原理(TAN, Markov Blanket)

*分類模型效能的評估方式(Gain Chart, Lift Chart, Profit Chart, Confusion Matrix, Precision, Recall, F-Measure, …)

SPSS Modeler实作: 银行目标客户营销(Target Marketing)案例

4. 预测技术(Prediction Techniques) – 线性回归 (Linear Regression)

*简单线性回归(Simple Linear Regression)原理

*复回归(Multiple Linear Regression)原理

*皮尔森相关系数(Pearson Correlation Coefficient)

*预测模型效能的评估方式(Scatter Plot, Mean Absolute Error, Mean Squared Error, R2, …)

SPSS Modeler实作：汽车油耗预测案例

5. 分类及预测技术 (Classification & Prediction Techniques) – 决策树 (Decision Tree)

*分类树(Classification Tree)原理(ID3, C4.5, C5.0, CART, CHAID, …)

*分类字段的选择方法(Information Gain, Gain Ratio, Gini Index, Chi-Square, …)

*分类树与分类规则(Classification Rules)之差异

*数值型字段的处理

*空值(Missing Value)的处理

*分类的修剪(Tree Pruning)：避免Overfitting的问题

*回归树(Regression Tree)原理(CART, …)

*回归树进阶：Model Tree (M5)

SPSS Modeler实作：电信产品跨销售(Cross-Selling)案例

6. 分类及预测技术 (Classification & Prediction Techniques) – 类神经网络 (Neural Network)

*倒传递类神经网络(Backpropagation Neural Network)原理

*数值型字段的一般化(Generalization)处理

*类别型字段的摊平(Flattening)处理

*倒传递类神经网络的权重调整

*倒传递类神经网络与罗吉斯回归, 线性回归, 非线性回归间的关系

*倒传递类神经网络如何处理分类的问题

*倒传递类神经网络如何处理预测的问题

SPSS Modeler实作：

(1) 细胞样本分类案例

(2) 零售促銷案例

7. 分类技术 (Classification Techniques) –罗吉斯回归 (Logistic Regression)

*罗吉斯回归 (Logistic Regression)原理

*数值型字段的一般化(Generalization)处理

*类别型字段的摊平(Flattening)处理

*罗吉斯回归的权重调整

*罗吉斯回归的字段选择方式(Forward, Backward, Stepwise, …)

SPSS Modeler实作：

(1) 电信客户分类(不同套餐选择)案例

(2) 电信客户流失案例

8. 预测技术(Prediction Techniques) – 时间序列 (Time Series)

*时间序列原理

*时间序列方法：时间序列法(Time Series Method)及因果预测法(Causal Method)

*时间序列類型：平稳 (Stationary)及非平稳(Non- Stationary)的时间序列

*时间序列方法進階：指數平滑法(Exponential Smoothing)

*时间序列方法進階：ARIMA (Autoregressive Integrated Moving Average)

SPSS Modeler实作：

(1) 全国网络带宽使用预测案例

(2) 男装销售金额预测案例

9. 聚类技术(Clustering Techniques) – K-Means, Kohonen SOM, Two-Step

*聚类原理

*距离的计算方法：Simple Matching Coefficient, Jaccard Coefficient, City Block Distance, Euclidean Distance

*聚类方法的分类：Exclusive Clustering & Non-Exclusive (Overlapping) Clustering

*Exclusive Clustering方法的分类：Hierarchical Methods & Partitioning Methods

*Partitioning Methods原理：K-Means, Kohonen SOM, Two-Step

SPSS Modeler实作：银行客户聚类(Customer Segmentation)及营销活动设计案例

10. 关联规则及序列型样技术(Association Rules & Sequential Patterns Techniques) – Apriori & AprioriAll

*关联规则及序列型样原理

*支持度(Support)及信赖度(Confidence)的计算方式

*关联规则方法：Apriori原理

*产品相关性分析

*虚拟产品(Virtual Items)于关联规则上的应用

*大数据下的关联规则挖掘

*序列型样方法：AprioriAll原理

SPSS Modeler实作：

(1) 零售购物篮分析案例

(2) 零售向上销售(Up-Selling)案例

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

关键词：数据挖掘远程教学 SPSS Modeler Partitioning Segmentation 台湾大学厦门大学计算机工程高校教师工程学

[工商管理] 十个案例玩转数据挖掘——远程教学 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我拉你入群

相关帖子

一级伯乐勋章

初级学术勋章

初级信用勋章

本版微信群

[工商管理] 十个案例玩转数据挖掘——远程教学 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

相关帖子

一级伯乐勋章

初级学术勋章

初级信用勋章

本版微信群

扫码加我拉你入群