楼主: wxg319
7156 21

一本评价较高的数据挖掘书,值得一看 [推广有奖]

  • 0关注
  • 0粉丝

博士生

0%

还不是VIP/贵宾

-

威望
0
论坛币
213 个
通用积分
8.8611
学术水平
1 点
热心指数
1 点
信用等级
1 点
经验
2639 点
帖子
70
精华
0
在线时间
359 小时
注册时间
2007-1-17
最后登录
2024-2-26

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
一本评价较高的数据挖掘方面书籍;
书的代码和示例都是Python;
以下是目录:

Preface                                                                 xiii
1 Introduction to Collective Intelligence                                  1
   What Is Collective Intelligence? 2
   What Is Machine Learning? 3
   Limits of Machine Learning 4
   Real-Life Examples 5
   Other Uses for Learning Algorithms 5
2 Making Recommendations                                           7
   Collaborative Filtering 7
   Collecting Preferences 8
   Finding Similar Users 9
   Recommending Items 15
   Matching Products 17
   Building a delicious Link Recommender 19
   Item-Based Filtering 22
   Using the MovieLens Dataset 25
   User-Based or Item-Based Filtering? 27
   Exercises 28
3 Discovering Groups                                                 29
   Supervised versus Unsupervised Learning 29
   Word Vectors 30
   Hierarchical Clustering 33
   Drawing the Dendrogram 38
   Column Clustering 40
   K-Means Clustering 42
   Clusters of Preferences 44
   Viewing Data in Two Dimensions 49
   Other Things to Cluster 53
   Exercises 53
4 Searching and Ranking                                              54
   What’s in a Search Engine? 54
   A Simple Crawler 56
   Building the Index 58
   Querying 63
   Content-Based Ranking 64
   Using Inbound Links 69
   Learning from Clicks 74
   Exercises 84
5 Optimization                                                       86
   Group Travel 87
   Representing Solutions 88
   The Cost Function 89
   Random Searching 91
   Hill Climbing 92
   Simulated Annealing 95
   Genetic Algorithms 97
   Real Flight Searches 101
   Optimizing for Preferences 106
   Network Visualization 110
   Other Possibilities 115
   Exercises 116
6 Document Filtering                                                117
   Filtering Spam 117
   Documents and Words 118
   Training the Classifier 119
   Calculating Probabilities 121
   A Na?ve Classifier 123
   The Fisher Method 127
   Persisting the Trained Classifiers 132
   Filtering Blog Feeds 134
   Improving Feature Detection 136
   Using Akismet 138
   Alternative Methods 139
   Exercises 140
7 Modeling with Decision Trees                                       142
   Predicting Signups 142
   Introducing Decision Trees 144
   Training the Tree 145
   Choosing the Best Split 147
   Recursive Tree Building 149
   Displaying the Tree 151
   Classifying New Observations 153
   Pruning the Tree 154
   Dealing with Missing Data 156
   Dealing with Numerical Outcomes 158
   Modeling Home Prices 158
   Modeling “Hotness” 161
   When to Use Decision Trees 164
   Exercises 165
8 Building Price Models                                              167
   Building a Sample Dataset 167
   k-Nearest Neighbors 169
   Weighted Neighbors 172
   Cross-Validation 176
   Heterogeneous Variables 178
   Optimizing the Scale 181
   Uneven Distributions 183
   Using Real Data—the eBay API 189
   When to Use k-Nearest Neighbors 195
   Exercises 196
9 Advanced Classification: Kernel Methods and SVMs                    197
   Matchmaker Dataset 197
   Difficulties with the Data 199
   Basic Linear Classification 202
   Categorical Features 205
   Scaling the Data 209
   Understanding Kernel Methods 211
   Support-Vector Machines 215
   Using LIBSVM 217
   Matching on Facebook 219
   Exercises 225
10 Finding Independent Features                                      226
   A Corpus of News 227
   Previous Approaches 231
   Non-Negative Matrix Factorization 232
   Displaying the Results 240
   Using Stock Market Data 243
   Exercises 248
11 Evolving Intelligence                                               250
   What Is Genetic Programming? 250
   Programs As Trees 253
   Creating the Initial Population 257
   Testing a Solution 259
   Mutating Programs 260
   Crossover 263
   Building the Environment 265
   A Simple Game 268
   Further Possibilities 273
   Exercises 276
12 Algorithm Summary                                               277
   Bayesian Classifier 277
   Decision Tree Classifier 281
   Neural Networks 285
   Support-Vector Machines 289
   k-Nearest Neighbors 293
   Clustering 296
   Multidimensional Scaling 300
   Non-Negative Matrix Factorization 302
   Optimization 304
A Third-Party Libraries                                               309
B Mathematical Formulas                                            316
Index                                                                  323
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据挖掘 值得一看 Intelligence Optimization introduction 数据 挖掘 评价

Programming[1].Collective.Intelligence(2007).pdf

3.3 MB

需要: 2 个论坛币  [购买]

沙发
yqdmu200602 发表于 2010-3-5 17:13:14 |只看作者 |坛友微信交流群
非常感谢哈!

使用道具

藤椅
751546030 发表于 2010-3-16 23:21:22 |只看作者 |坛友微信交流群
就是《集体智慧编程》了,中文翻译版早已经出版了。

使用道具

板凳
geckoliu 发表于 2010-3-17 19:36:13 |只看作者 |坛友微信交流群
不错的书,对新手上路有很大帮助

使用道具

报纸
yds520 发表于 2010-3-18 08:57:08 |只看作者 |坛友微信交流群
不错的书,对新手上路有很大帮助

使用道具

地板
chenxuan322 发表于 2010-4-5 20:45:22 |只看作者 |坛友微信交流群
谢谢楼主哈!

使用道具

7
whiteyang303 发表于 2010-4-12 11:21:51 |只看作者 |坛友微信交流群
好的我收了

使用道具

8
mixuer888 发表于 2011-1-27 15:00:51 |只看作者 |坛友微信交流群
好,正需要,谢谢

使用道具

9
huangyuangang 发表于 2011-2-12 14:31:28 |只看作者 |坛友微信交流群
非常感谢
谢谢

使用道具

10
saint13 发表于 2011-2-25 21:05:49 |只看作者 |坛友微信交流群
收        了
Interested in Datamining

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-1 01:32