楼主: ada89k
617 26

[CDA丛书讨论] 强烈推荐|20本数据分析师必看书单_数据分析师 [推广有奖]

回帖奖励 96 个论坛币 回复本帖可获得 2 个论坛币奖励! 每人限 1 次
  • 3关注
  • 5粉丝

内部工作人员

教授

69%

还不是VIP/贵宾

-

威望
0
论坛币
920 个
学术水平
30 点
热心指数
23 点
信用等级
3 点
经验
1157 点
帖子
723
精华
0
在线时间
378 小时
注册时间
2017-2-7
最后登录
2017-5-28

ada89k 发表于 2017-5-19 17:59:21 |显示全部楼层
本帖最后由 ada89k 于 2017-5-22 18:39 编辑

强烈推荐-                        

                        20本数据分析师必看书单


这份书单主要是作为数据分析师的入门级推荐,如果各位有更好的书籍欢迎在楼下留言。我不能保证全部看过,毕竟基础书没必要看几本,但我尽量做到客观。建议大家根据自己基础挑选,不要贪多。然后请大家多支持正版。


Excel


《谁说菜鸟不会数据分析》


620.jpg



知名度比较高的一套书,适合新手,优点是它和数据分析结合,而不是单纯地学习函数。学会函数适用的场景和过程比它本身更重要。


是否需要学习VBA是仁者见仁的答案。我个人不建议。Excel VBA的最大优势是适用性广,哪怕去其他行业其他职位,都离不开Excel,这时候它就是一个工作加分的亮点。但是在互联网行业,对数据分析师,VBA的性价比就不高了。


这里只推荐一本,因为我就翻过上面这本,还没全看…


数据可视化


数据可视化的书不多。市面上多以编程为主,面向新手和设计的教程寥寥无几。 如果只是了解图表,看Excel的书籍也管用。


621.jpg



内容很丰富,涉及可视化的方方面面,也囊括更类编程语言和设计软件:Python+JS+R+Excel。作者还有另外一本书《数据之美》。


可视化是一门侧重灵感的学科,有一种入门技巧是从他人设计中学习,从模仿开始,了解他人是如何设计的,这个网络上有大量的信息图可以参考。当然数据分析师更需要的是如何发现,别只学习展示。


英文足够好,可以看Edward Tufte的著作:《The Visual Display ofQuantitative Information》、《Envisioning Information》、《Beautiful Evidence》。他是数据可视化的领军人物,他的理念是反对为艺术效果而混淆或者简化数据。暂时没有中文版。


分析思维


《金字塔原理》


622.jpg



分析思维首推《金字塔原理》,金字塔原理有些人说它晦涩难懂,我认为是芭芭拉这个老太有骗稿费之嫌,本书包含了报告、写文、演讲等诸多内容。可以细看可以快看。另外还有一本同名案例集,有兴趣可以买。

另外麦肯锡相关的书籍还有《麦肯锡意识》《麦肯锡工具》《麦肯锡方法》等。


《深入浅出数据分析》


623.jpg



深入浅出系列是对新手非常友好的丛书,用生动但啰嗦的语言讲解案例。厚厚的一本书翻起来很快。本书涉及的基础概念比较广,包含一点统计学知识,学下来对数据分析思维会有一个大概了解。


《精益数据分析》


624.jpg



国外的精益系列一直以互联网创业作内容导向,本书也属于此类。如果是互联网行业相关,可以看看。它介绍了不同领域的指标,以及产品不同时期的侧重点。案例都是欧美,这部分做参考用。


接下来的几本,是兴趣向读物。《黑天鹅》能拓展思维,讲叙了不确定性。《思考的技术》,大前研一的著作,也是咨询类经典。如果对咨询向的分析感兴趣,还可以看BCG系列,或者刷CaseBook。《批判性思维》,则是教你如何形成理性思维。


SQL


数据库有很多种,常见有Oracle,MySQL,SQLServer等。我推荐学习MySQL,这是互联网公司的主流数据库。以后学习Hadoop生态时,MySQL也是最接近Hive语法的语言。


MySQL不需要专门看书学习,因为数据分析师以查询为主,不需要考虑数据性能、数据安全和架构的问题。使用搜索引擎能解决90%的问题,我就是w3cschool学的。


《MySQL必知必会》


625.jpg



如果真想买书看,可以看这本,适合新手向的学习,看基础概念和查询相关的章节即可。网络上大部分MySQL都是偏DBA的。


如果想深入,可以看《高性能MySQL》,对分析师没啥用。至于另外一个方向NoSQL,对入门者还是小众了些。


如果有余力,就学习正则表达式吧,清洗数据的工作就靠它了。


统计学


统计学是比较大的范围,分析师往后还需要学线性代数和矩阵、关系代数等。初学者不需要掌握所有公式定理的数学推导,懂得如何应用就行用。


《深入浅出统计学》


626.jpg



大概是最啰嗦的深入浅出系列,从卖橡皮鸭到赌博机的案例,囊括了常用的统计分析如假设检验、概率分布、描述统计、贝叶斯等。书本注重应用和趣味性,数学推理一般。


《商务与经济统计》


627.jpg



国外的经典教材,已经出到第十二版了。国外教材都有丰富有趣的案例,所以读起来会比国内的轻松不少。如果你还在读书,不妨买这本看一看。


名字既然有商务与经济,所以书中辅以了大量的相关案例。书内容很多,看起来不会快,适合细读。


《The Elements of Statistical Learning》


628.jpg

稍微有一些难度的英文书籍,属于进阶版统计学,国外很推崇。如果要往机器学习发展,这本书可以打下很好的基础。


以上书籍的难度是逐步递增的。统计学是机器学习的基础,是概率、矩阵等实际应用。现在已经有很多统计工具,Excel的分析工具库、传统行业的SPSS、SAS以及R、Python等,使用过程都不用计算推导,大学考试才会考,现在都是计算机解决,轻松不少。


业务知识


不同领域的业务知识都不一样,这里以互联网举例。


《增长黑客》


629.jpg



增长黑客的概念就是随着这本书的畅销传播开来。增长黑客在国内即是数据分析+运营/产品的复合型人才。这本书好的地方在于拓展思路,告诉我们数据能够做什么,尤其是连AB测试都不清楚的新人。


实际涉及的业务知识不多,我推荐,是希望新人能够了解数据驱动的概念,这本算是我走上数据化运营的启蒙读物了。


《从零开始做运营》


630.jpg



知乎亮哥的书籍,互联网所有的数据都是和运营相关的,如果是新手,就以此学习业务知识。如果已经工作很多,就略过吧。


《网站分析实战》


631.jpg



互联网不再是网站的天下,但是移动端依旧有Web,我们在朋友圈看到的所有H5活动、第三方内容等,都是依托网页实现。网站的数据分析依旧有存在空间,网站的数据指标还是能够指导我们运营

《数据挖掘与数据化运营实战》


632.jpg



这本书涉及了数据挖掘,但是比较浅,可以作为数据分析师视野的承上启下,了解数据化运营的高级应用。特点是以阿里的实际工作相结合,可又因为保密原则不够详尽。


《数据实践之美》


633.jpg



是各领域专家众筹完成的书本,比起传统的书籍,囊括范围更广。虽然没有深度讲解技术,但是各领域的案例都是一手资料,对业务的触类旁通理解有帮助。


业务知识我不再多推荐,以后我会通过公众号文章的形式讲解。因为从我看来,市面上也没有详尽介绍数据角度下的用户行为、产品运营的书籍,都是点到为止。这一块内容,尽量从工作中去学,收获才是最大的。


Python/R


欢迎来到数据分析的最后殿堂,Python和R都是大分支,基本是前面所有内容的实现。Python的学习以PY3为前提,毕竟2017年了,我实在想不出不用Python3的理由。


除了书籍,Python/R更多依靠博客和文档学习。Python的学习路径不陡峭,新手水平取决于查询能力,所以也请学会如何高效搜索。


《深入浅出Python》


634.jpg



还是深入浅出系列,完全适合零基础的新人。需要注意的是,编程学习不同于其他知识,如果计算机基础不稳固,在使用中会遇到各类问题。知其然不知其所以然,这是本书缺点:能掌握,但是Bug比较多。


《Python学习手册》


635.jpg



对于拥有编程基础的人,这本书系无巨细的有些啰嗦,不过对新人,可以避免不必要的坑。把它当作一本工具文档吧,当遇到不理解的内容随时翻阅。这是纸质书比电子书好的优势之一。


《利用Python进行数据分析》


636.jpg



非新手向的书籍,成书较早,部分内容比较老旧。虽然学习中不会有问题,但很多Pandas函数已经有更优雅的写法了,例如df.query。每段代码都敲打一遍,千万行的数据清洗基本不会有大问题了。


《Python Cookbook》


637.jpg



Python的进阶书,如果想要掌握更好的编程能力,这是一本经典,值得时时翻阅。注意,它更偏向程序员。


《R语言实战》


638.jpg



R语言的入门书籍,从数据读取到各类统计函数的使用。虽然没有涉及机器学习,依靠这本书入门R是绰绰有余了。


《统计学:从数据到结论》


639.jpg



这本书是将R语言和统计学结合的教材,可以利用这本书再复习一遍统计知识。缺点是书本后面的内容质量不如前部分。


到这里,入门书籍推荐完毕,当然好书不嫌多,例如《数学之美》、《集体智慧编程》、《统计学习方法》等,有兴趣不妨阅读。


上面的内容都吃透,不论是成为一名数据分析师,还是往后向机器学习、数据科学家、数据产品发展、都有了良好的基础。



希望你能沉下心阅读。



支持楼主:购买VIP购买贵宾 购买后,论坛将把您花费的资金全部奖励给楼主,以表示您对TA发好贴的支持
 
载入中......
stata SPSS
alvin2 发表于 2017-5-19 18:04:12 |显示全部楼层

回帖奖励 +2 个论坛币

已偏离的越来越远了
回复

使用道具 举报

huhuhuhu 发表于 2017-5-19 18:15:28 |显示全部楼层

回帖奖励 +2 个论坛币

谢谢分享
回复

使用道具 举报

smartlife 发表于 2017-5-19 19:52:45 |显示全部楼层

回帖奖励 +2 个论坛币

回复

使用道具 举报

KNaan 发表于 2017-5-20 10:37:44 |显示全部楼层

回帖奖励 +2 个论坛币

感谢分享
回复

使用道具 举报

灵魂独行! 发表于 2017-5-20 14:16:12 |显示全部楼层

回帖奖励 +2 个论坛币

谢谢楼主分享。
回复

使用道具 举报

tonytim 发表于 2017-5-20 14:24:46 |显示全部楼层

回帖奖励 +2 个论坛币

说的不错。
回复

使用道具 举报

Charlie·T 发表于 2017-5-20 16:54:10 |显示全部楼层

回帖奖励 +2 个论坛币

谢谢楼主分享!
回复

使用道具 举报

殺先生 发表于 2017-5-20 17:31:09 |显示全部楼层

回帖奖励 +2 个论坛币

感谢分享
回复

使用道具 举报

小小怪兽 发表于 2017-5-20 18:27:19 |显示全部楼层

回帖奖励 +2 个论坛币

谢谢分享
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 我要注册

论坛通告

加入经管之家俱乐部
无限扩大经管职场人脉圈!
每天抽选10位免费名额,现在就扫

  论坛VIP
  贵宾会员
  可免费加入



关闭 查看 »

GMT+8, 2017-5-28 22:52