数据挖掘书单_数据挖掘必读书籍_数据挖掘学习清单
我会按照基础到入门给出详细推荐,并且附上个人点评。同时尽量做到各个资料在内容上并不重复(即使内容上有重复,也会在难度上做出区分),希望可以以最直接的方式告诉大家应该怎么选择。
Ps:这是第一版学习指南,由于最近时间比较紧张,预计在第二版中会加入业务材料的推荐和更多的学习索引,欢迎关注。
#我的数据挖掘书单#1先验知识
由于统计学概率论甚至到机器学习会对数学基础有一定要求,所以这里给出一些先验知识的内容推荐,主要是矩阵方面。
1.1 课程
可汗学院公开课:线性代数课程
因为网易公开课有翻译,这里是中文字幕课程链接,这里真要给网易100个赞,字幕做得很好。
“可汗学院(Khan Academy),是由孟加拉裔美国人萨尔曼·可汗创立的一家教育性非营利组织,主旨在于利用网络影片进行免费授课,现有关于数学、历史、金融、物理、化学、生物、天文学等科目的内容,教学影片超过2000段,机构的使命是加快各年龄学生的学习速度。”
1.2 参考书籍
(1)线性代数 豆瓣评分7.3
(2)高等代数 豆瓣评分8.1
相比于线性代数,高等代数更加深入,一般线性代数为非数学专业所用,数学类专业一般学习高等代数。不过一般情况下,线性代数也足够使用了。
当然,在后续学习中有些算法也会用到微积分的知识,但是都比较基础,因此遇到不懂的时候直接查资料即可,就没有特定推荐材料了。
#我的数据挖掘书单#2 统计分析学习资料
2.1 统计学/概率课程
同样推荐可汗学院的统计学和概率课程,而且刚好这两门课程也被网易公开课进行了翻译:
(1) 可汗学院公开课:统计学
(2) 可汗学院公开课:概率
这两本课程总体不算太难,适合入门。个人觉得讲授还是蛮有特点的,粗暴直接,另外举的例子也是蛮有趣的。
2.2统计学/概率参考书
(1)统计学 豆瓣评分8.8
作者William Mendenhall / Terry Sincich
非常注重实用的统计学课程,偏应用,少数学证明,可读性比较强;
(2)统计学 豆瓣评分7.3
作者:贾俊平,何晓群,金勇进
(3)统计推断 豆瓣评分8.8,/英本原本9.2
作者:William Mendenhall / Terry Sincich
可以作为研究生所用教材,有深度,但是作者循序渐进,解释得非常漂亮
#我的数据挖掘书单#3机器学习资料
3.1机器学习课程
强烈推荐Andrew NG吴恩达的斯坦福机器学习课程,英文授课,但是已有完善的中文字幕,内容非常丰富且充实(20节),并且讲解得非常的好,如果你想学习机器学习,一定不能错过!
同时该课程配有课件讲义,同样建议大家在学习视频课程之余多看讲义和习题,虽然是英文,但是阅读上基本没有什么问题,就讲义本身也是非常的棒。
如果大家学习完Andrew NG的机器学习,还想通过其他课程触类旁通,相互借鉴的话,可以上Coursera上门搜索还有其他选择,例如台大的机器学习基础等等,但毫无疑问首推Andrew NG的课程;
另外现在国内也有越来越多的培训网站推出相关课程,大家有兴趣的可以自己搜搜,这里就不做推荐了;
3.2机器学习教材
(1)数据挖掘导论 豆瓣评分8.4,/英本原本8.8
作者: Pang-Ning Tan、Michael Steinbach、Vipin Kumar
(2)统计学习方法 豆瓣评分:8.9
作者:李航
(3)The Elements of Statistical Learning(统计学习基础)
豆瓣英本原版评分9.4 中文评分7.4
这本书被广大人民喜称为ESL,虽然书名是统计学习基础,但是此书一点都不基础,一点都不~另外此书还有一本专门的入门版本ISL(后面会介绍)
这本书涵盖了非常多的内容,讲解深入,有人评价说,“有了这本书就不需要其他机器学习教材”,虽然有点夸张,但是此书实际是机器学习的经典巨作,如果你真的希望好好研究机器学习,此书非常值得仔细研读,另外此书要求不低的统计理论和数学基础。
前面都是一些理论知识,但是数据科学里面实践应用又是另外一个重中之重,接下来谈一下借助工具进行实践应用的问题,由于Python还在整理当中,本次主要介绍SPSS与R语言:
#我的数据挖掘书单#4 SPSS学习资料
考虑到SPSS分为统计模块Statistics以及数据挖掘模块Modeler , 因此也分为两大块介绍
4.1SPSS统计分析资料
SPSS Statistics 市面上的书籍比较多,从我个人的角度,认为张文彤老师的系列足以让大家加深对统计体系的理解,同时也能很好掌握在实际的应用当中如何使用统计分析帮助我们完成任务,我认为掌握统计分析原理实战和SPSS操作,以下两本书足矣。
(1) SPSS统计分析基础教程 豆瓣评分8.4
(2)高等学校教材(SPSS统计分析高级教程)豆瓣评分7.7
另外张文彤老师也有对应视频课程 《张文彤SPSS初中级教程》以及《张文彤SPSS高级教程》
4.2 SPSS机器学习教程
(1)Modeler官方的帮助文档和Sample文件
(2) IBM SPSS数据分析与挖掘实战案例精粹 豆瓣评分9.3
作者:张文彤,钟云飞
非常详尽
5R语言学习资料
(1)R语言实战 豆瓣评分8.8
作者:Robert I.Kabacoff
(2)AnIntroduction to Statistical Learning(统计学习导论) 英本版豆瓣评分9.5,中文版7.6
作者:Trevor Hastie,Robert Tibshirani ,Jerome Friedman
此书被广大人民群众称为ISL,没错,就是上面ESL的入门版本。无论作为统计教材推荐还是R语言教材推荐都称得上5星的读物。ISL虽然是入门版本,但是绝对不是因为内容简单。深入浅出,内容详细,常常读完有种恍然大悟的感觉,同时能够结合R语言介绍,大大的加分。


雷达卡




京公网安备 11010802022788号







