图书简介:
本书主要包括两部分内容:在数据挖掘部分,重点介绍了各种数据挖掘方法的基本原理及应用,包括回归分析、时间序列分析、因子分析、决策树分析、判别分析、聚类分析、人工神经网络、贝叶斯网络以及社交网络分析等;在文本挖掘部分,重点介绍了文本挖掘的节点,以及具体的实现过程。每一章都详细介绍了数据和文本挖掘的基本原理和分析过程,同时在实例中也介绍了SPSS Modeler中大部分节点的使用方法及应用步骤。
本书与同类书籍相比,安排了较多的实例,使读者能够边学边练,在短时间内就可以有一个较大的提高,方便读者熟悉SPSS Modeler的基本操作,并通过系统的案例使读者掌握应用技巧。
本书对于高校理工学科、经济金融学科及数量分析方面的学生,以及数据挖掘和分析方面的研究人员和从业人员等,具有很强的可读性、可操作性与可使用性,尤其适合商业销售、经济管理、社会研究和人文教育等行业的相关人员阅读。
目录
第1部分 数据挖掘篇
第1章 数据挖掘概述 3
1.1 什么是数据挖掘 3
1.1.1 数据挖掘的定义 4
1.1.2 数据挖掘的发展阶段 5
1.1.3 数据挖掘的技术特征 6
1.2 与传统技术的比较 8
1.2.1 数据挖掘和统计分析 8
1.2.2 数据挖掘和数据仓库 8
1.2.3 数据挖掘和OLAP 9
1.2.4 数据挖掘和Web挖掘 10
1.3 常用的数据挖掘软件 11
1.3.1 SAS EM 12
1.3.2 SPSS Modeler 13
1.3.3 Intelligent Miner 13
1.4 应用实例:目标客户分析 15
1.4.1 研究方法 15
1.4.2 数据分析 15
1.4.3 研究结论 26
第2章 SPSS Modeler软件概述 27
2.1 软件简介 27
2.1.1 软件发展 28
2.1.2 软件界面 30
2.1.3 软件特点 35
2.1.4 软件功能 37
2.1.5 软件算法 39
2.1.6 高级功能 41
2.1.7 软件安装 42
2.2 行业应用 50
2.2.1 通信行业 50
2.2.2 ZF行业 52
2.2.3 金融行业 53
2.2.4 制造行业 54
2.2.5 医药行业 56
2.2.6 教育科研 56
2.2.7 市场调研 57
2.2.8 连锁零售 57
2.3 数据挖掘流程 58
2.3.1 业务理解 58
2.3.2 数据理解 59
2.3.3 数据准备 60
2.3.4 建立模型 61
2.3.5 评估模型 61
2.3.6 应用模型 62
2.4 应用实例:药物效果研究 62
2.4.1 研究方法 63
2.4.2 数据分析 63
2.4.3 研究结论 69
第3章 SPSS Modeler基础操作 70
3.1 数据输入 70
3.1.1 数据库 71
3.1.2 可变文件 73
3.1.3 固定文件 75
3.1.4 SAS文件 76
3.1.5 Statistics文件 77
3.1.6 Excel文件 77
3.2 数据流操作 78
3.2.1 生成数据流 78
3.2.2 添加和删除节点 79
3.2.3 连接数据流 79
3.2.4 修改连接节点 80
3.2.5 执行数据流 81
3.3 图形制作 82
3.3.1 散点图 82
3.3.2 直方图 84
3.3.3 网络图 85
3.3.4 评估图 87
3.4 应用实例:产品销售预测 88
3.4.1 研究方法 88
3.4.2 数据分析 88
3.4.3 研究结论 99
第4章 回归分析 100
4.1 回归分析模型概述 100
4.1.1 模型定义 101
4.1.2 模型应用 102
4.1.3 建模步骤 103
4.1.4 注意事项 103
4.2 应用实例:客户流失因素分析 104