楼主: dell100
17297 74

【电子书】数据挖掘——概念、模型、方法和算法 [推广有奖]

  • 0关注
  • 0粉丝

初中生

52%

还不是VIP/贵宾

-

威望
0
论坛币
921 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
104 点
帖子
15
精华
0
在线时间
2 小时
注册时间
2005-4-22
最后登录
2015-9-9

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

【电子书】数据挖掘——概念、模型、方法和算法
Data Mining Concpts,Models,Methods,and Algorithms(数据挖掘——概念、模型、方法和算法)
作者:(美)Mehmed Kantardzic
译者:闪四清,陈茵,程雁
出版社:清华大学出版社

  作为一本教科书,本书全面讲述了数据挖掘的概念、模型、方法和算法。本书共包括13章和2个附录,全面、详细地讲述了从数据挖掘的基本概念到数据挖掘的整个过程,以及数据挖掘工具及其典型应用领域。 本收编写严谨、内容权威、结构合理、科学规范、语言流畅,特别适合作为高等院校数据挖掘课程的教科书,还适合作为数据挖掘研究人员必备的参考书。 我们被数据所包围着,这些数据是数值型或其他类型,它们都必须经过分析和处理,转换成通知、指导、回答或辅助决策和理解的信息。由于当今数据集的大小和复杂性的增加,就产生了数据挖掘这个新术语,它描述了间接的、自动化的数据分析技术,这些技术所利用的工具比分析人员过去做基本的数据分析所使用的工具更加复杂和尖端。 本书讨论了数据挖掘的原理,接着描述了一些具有代表性的艺术级的方法和算法。这些方法和算法起源于不同的学科,如统计学、机器学习、计算机图形学、数据库、信息检索、神经网络、模糊逻辑和进化计算。本书还提供了详细的算法,而且这些算法都带有必要的解释和图形示例。 本书提供了一个指南:在面对一个待挖掘的数据集(以及它们的伴随数据集)时,怎样和何时从成百上千种软件工具中选择特定的一种。本书允许分析人员用书中提供的方法和技术来创建和执行他们自己的数据挖掘实验。 本书强调选择合适的方法和数据分析软件,并根据实际情况选择相应的参数。只有在深入理解了参数的意义及其在所提供技术中的作用的情况下,才能作出这些非常重要的、定性的决策。数据挖掘是一个正在蓬勃发展的领域,本书提供了从大量可用的分析程序中进行选择所急需的指南。

目    录
第1章  数据挖掘的概念        1
1.1  概述        1
1.2  数据挖掘的起源        3
1.3  数据挖掘过程        5
1.3.1  陈述问题和阐明假设        5
1.3.2  数据收集        6
1.3.3  数据预处理        6
1.3.4  模型评估        7
1.3.5  解释模型和得出结论        7
1.4  大型数据集        8
1.5  数据仓库        12
1.6  本书的结构        14
1.7  复习题        15
1.8  参考书目        16

第2章  数据准备        17
2.1  原始数据的表述        17
2.2  原始数据的特性        20
2.3  原始数据的转换        22
2.4  丢失数据        24
2.5  时间相关数据        25
2.6  异常点分析        29
2.7  复习题        32
2.8  参考书目        33

第3章  数据归约        35
3.1  大型数据集的维度        35
3.2  特征归约        37
3.3  特征排列的熵度量        41
3.4  主成分分析        43
3.5  值归约        45
3.6  特征离散化:ChiMerge技术        48
3.7  案例归约        51
3.8  复习题        54
3.9  参考书目        55

第4章  从数据中学习        57
4.1  机器学习        58
4.2  统计学习原理        62
4.3  学习方法的类型        67
4.4  常见的学习任务        68
4.5  模型估计        72
4.6  复习题        76
4.7  参考书目        77

第5章  统计方法        78
5.1  统计推断        78
5.2  评测数据集的差异        80
5.3  贝叶斯定理        82
5.4  预测回归        84
5.5  方差分析        89
5.6  对数回归        92
5.7  对数-线性模型        93
5.8  线性判别分析        96
5.9  复习题        98
5.10  参考书目        99

第6章  聚类分析        101
6.1  聚类概念        101
6.2  相似度的度量        104
6.3  凝聚层次聚类        108
6.4  分区聚类        112
6.5  增量聚类        114
6.6  复习题        117
6.7  参考书目        119

第7章  决策树和决策规则        120
7.1  决策树        121
7.2  C4.5算法:生成一个决策树        122
7.3  未知属性值        128
7.4  修剪决策树        132
7.5  C4.5算法:生成决策规则        133
7.6  决策树和决策规则的局限性        136
7.7  关联分类方法        137
7.8  复习题        140
7.9  参考书目        142

第8章  关联规则        144
8.1  购物篮分析        144
8.2  APRIORI 算法        146
8.3  从频繁项集得到关联规则        148
8.4  提高APRIORI算法的效率        149
8.5  频繁模式增长方法(FP-增长方法)        151
8.6  多维关联规则挖掘        153
8.7  WEB挖掘        154
8.8  HITS和LOGSOM算法        156
8.9  挖掘路径遍历模式        161
8.10  文本挖掘        164
8.11  复习题        167
8.12  参考书目        169

第9章  人工神经网络        171
9.1  人工神经元的模型        172
9.2  人工神经网络的结构        176
9.3  学习过程        177
9.4  学习任务        181
9.5  多层感知机        183
9.6  竞争网络和竞争学习        189
9.7  复习题        193
9.8  参考书目        195

第10章  遗传算法        196
10.1  遗传算法的基本原理        197
10.2  用遗传算法进行优化        198
10.3  遗传算法的一个简单例证        203
10.4  图式(SCHEMATA)        208
10.5  旅行推销员问题        210
10.6  使用遗传算法的机器学习        212
10.7  复习题        216
10.8  参考书目        217

第11章  模糊集和模糊逻辑        219
11.1  模糊集        219
11.2  模糊集的运算        224
11.3  扩展原理和模糊关系        229
11.4  模糊逻辑和模糊推理系统        233
11.5  多因子评价        237
11.6  从数据中提取模糊模型        239
11.7  复习题        244
11.8  参考书目        246

第12章  可视化方法        247
12.1  感知和可视化        247
12.2  科学可视化和信息可视化        248
12.3  平行坐标        253
12.4  放射性可视化        256
12.5  KOHONEN自组织映射        258
12.6  数据挖掘的可视化系统        259
12.7  复习题        263
12.8  参考书目        264

第13章  参考书目        266
附录A  数据挖掘工具        281
附录B  数据挖掘应用        300


177768.rar (1.91 MB)


177769.rar (1.91 MB)
177770.rar (1.91 MB)
177771.rar (1.91 MB)
177772.rar (385.73 KB)

[此贴子已经被angelboy于2008-7-29 16:25:35编辑过]

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据挖掘 电子书 Data Mining Algorithms Algorithm 概念 数据 模型 电子书 算法

沙发
200317lym 发表于 2007-10-28 12:05:00 |只看作者 |坛友微信交流群
在哪里啊 ,什么都没有看见呢
己所不欲,勿施于人

使用道具

藤椅
zhudianqin 发表于 2007-10-31 09:47:00 |只看作者 |坛友微信交流群

哥哥在哪里啊

朱殿勤

使用道具

板凳
newfei188 发表于 2007-11-7 18:49:00 |只看作者 |坛友微信交流群
哥在哪里啊
目光要长远,视野要开阔,胸怀要若谷,胆量要过人;为人要真诚,做事要踏实,入世要自

使用道具

报纸
mingwoo 发表于 2007-11-8 10:06:00 |只看作者 |坛友微信交流群
哥在哪里啊
生,容易;活,容易;生活不容易!

使用道具

地板
hjp146 发表于 2007-12-2 11:54:00 |只看作者 |坛友微信交流群
哇..好东西哦..专著来的..谢谢楼主

使用道具

7
appleman009 发表于 2007-12-19 14:03:00 |只看作者 |坛友微信交流群
多谢楼主分享

使用道具

8
wentty 发表于 2007-12-30 22:14:00 |只看作者 |坛友微信交流群
在哪里呀,大哥。
厚积薄发;伺机而动。

使用道具

9
appleman009 发表于 2008-3-14 23:08:00 |只看作者 |坛友微信交流群

谢谢,

使用道具

10
ipnunu 发表于 2008-3-15 16:47:00 |只看作者 |坛友微信交流群
谢谢楼主!

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-28 16:48