目录
第一章 引言 ... 8
1.1 什么激发数据挖掘?为什么它是重要的?.. 8
1.2 什么是数据挖掘? ... 10
1.3 数据挖掘——在何种数据上进行?.. 12
第二章数据仓库和数据挖掘的OLAP 技术.. 29
2.1 什么是数据仓库?... 29
2.2.1 操作数据库系统与数据仓库的区别.. 30
2.1.2 但是,为什么需要一个分离的数据仓库.. 31
2.2 多维数据模型... 32
2.3 数据仓库的系统结构.. 42
2.4 数据仓库实现... 46
2.5 数据方技术的进一步发展.. 54
2.6 由数据仓库到数据挖掘.. 58第三章数据预处理 ... 64
3.1 为什么要预处理数据? .. 64
3.2 数据清理 ... 66
3.3 数据集成和变换... 68
3.4 数据归约... 70
3.5 离散化和概念分层产生.. 79
第四章数据挖掘原语、语言和系统结构.. 87
4.1 数据挖掘原语:什么定义数据挖掘任务? .. 87
4.2 一种数据挖掘查询语言.. 95
4.3 基于数据挖掘查询语言设计图形用户界面.. 102
4.4 数据挖掘系统的结构.. 102第五章概念描述:特征与比较.. 107
5.1 什么是概念描述?.. 107
5.2 数据泛化和基于汇总的特征.. 108
5.3 解析特征: 属性相关性分析.. 115
5.4 挖掘类比较:区分不同的类.. 118
5.5 在大型数据库中挖掘描述统计度量.. 123
5.6 讨论... 128
5.7 总结... 129
第六章挖掘大型数据库中的关联规则.. 132
6.1 关联规则挖掘... 132
6.2 由事务数据库挖掘单维布尔关联规则.. 134
6.3 由事务数据库挖掘多层关联规则.. 143
6.4 由数据库和数据仓库挖掘多维关联规则.. 147
6.5 由关联挖掘到相关分析.. 151
6.6 基于限制的关联挖掘.. 152第七章分类和预测 ... 162
7.1 什么是分类?什么是预测? .. 162
7.2 关于分类和预测的问题.. 163
7.2.1 准备分类和预测数据.. 164
7.2.2 比较分类方法。.. 164
7.3 用判定树归纳分类.. 164
7.4 贝叶斯分类... 172
7.5 后向传播分类... 176
7.6 基于源于关联规则挖掘概念的分类.. 182
7.7 其它分类方法... 183
7.8 预测... 186
7.9 分类的准确性... 188
7.10 总结... 191
第八章聚类分析 ... 196
8.1 什么是聚类分析?.. 196
8.2 聚类分析中的数据类型.. 197
8.2.2 区间标度(Interval-Scaled)变量.. 198
8.2.3 二元变量(binary variable) .. 199
8.2.4 标称型、序数型和比例标度型变量.. 200
8.2.5 混合类型的变量.. 201
8.3 主要聚类方法的分类.. 201
8.4 划分方法(PARTITIONING METHODS) .. 202
8.5 层次方法 ... 206
8.6 基于密度的方法... 209


雷达卡



京公网安备 11010802022788号







