搜索
人大经济论坛 附件下载

附件下载

所在主题:
文件名:  数据科学家养成手册.pdf
资料下载链接地址: https://bbs.pinggu.org/a-3289724.html
附件大小:
数据科学家养成手册
作者: 高扬
出版社: 电子工业出版社
出版年: 2017-5
内容简介· · · · · ·
作为认知科学的延伸,数据科学一方面应该越来越引起广大大数据工作者的重视,另一方面也要撩开自己的神秘面纱,以最为亲民的姿态和每位大数据工作者成为亲密无间的战友,为用科学的思维方式进行工作做好理论准备。《数据科学家养成手册》从众多先贤及科学家的轶事讲起,以逐步归纳和递进的脉络总结出科学及数据科学所应关注的要点,然后在生产的各个环节中对这些要点逐一进行讨论与落实,从更高、更广的视角回看科学及数据科学在各个生产环节的缩影。《数据科学家养成手册》并不以高深的数学理论研究作为目的,也不以某一种计算机语言编程作为主线脉络,而是在一个个看似孤立的故事与工程中不断拾遗,并试着从中悟出一些道理。
《数据科学家养成手册》适合大数据从业人员和对大数据相关知识感兴趣的人,初级和中级程序员、架构师及希望通过对数据的感知改进工作的人,产品经理、运营经理、数据分析师、数据库开发工程师等对数据分析工作敏感的人,以及所有对数据科学感兴趣并希望逐步深入了解数据科学知识体系的人阅读。
作者简介· · · · · ·
高扬,北京邮电大学计算机专业毕业,重庆工商大学管理科学与工程专业硕士研究生事业导师。10年以上IT行业工作经验,3年海外工作经验。2010年后一直专注于数据库、大数据、数据挖掘、机器学习、人工智能等相关领域的研究。曾在金山软件西山居任大数据架构师,负责大数据平台构架与搭建。现任欢聚时代资深大数据专家,负责大数据、深度学习等基础技术与理论研究和实际产品的结合。
目录· · · · · ·
认知篇
第1章什么是科学家 2
1.1从太阳东升西落开始 2
1.1.1农历 2
1.1.2公历 5
1.1.3小结 7
1.2阿基米德爱洗澡? 7
1.3托勒密的秘密 10
1.4牛顿为什么那么牛 11
1.4.1苹果和三大定律 11
1.4.2极限和微积分 12
1.5高斯——高,实在是高 15
1.6离经叛道的爱因斯坦 17
1.7本章小结 20
第2章什么是科学 23
2.1科学之科 23
2.2边界的迷茫 23
2.3科学之殇 26
2.4本章小结 27
第3章数据与数学 28
3.1什么是数据 28
3.2数学的奥妙 29
3.2.1《几何原本》 29
3.2.2《九章算术》 30
3.2.3高等数学 34
3.3本章小结 37
第4章数据科学的使命 38
4.1走近数据科学 38
4.1.1介质 38
4.1.2从信息到数据 41
4.1.3数据科学的本质 43
4.2万能的数据科学 44
4.2.1测量 44
4.2.2统计计算 47
4.2.3指标 52
4.3使命必达 53
4.3.1高效生产 53
4.3.2破除迷信 56
4.3.3目标一致与不一致 57
4.4本章小结 58
第5章矛盾的世界 59
5.1古希腊——学者高产的国度 59
5.2矛盾无处不在 61
5.3世界究竟是否可知 63
5.4薛定谔的“喵星人” 64
5.5本章小结 66
第6章实验和哲学 68
6.1朴素的认知方法 68
6.1.1眼见为实 69
6.1.2归纳与总结 70
6.2哲学靠谱吗 71
6.3数学的尽头是哲学 72
6.4本章小结 73
第7章辩证思维 74
7.1要不要辩证有多大区别 74
7.2谁对谁错 76
7.3做到客观不容易 77
7.4观念的存弭 79
7.5本章小结 82
分化篇
第8章统计学 86
8.1数理统计鼻祖—阿道夫·凯特勒 86
8.2统计就是统共合计 88
8.3数据来源 90
8.4抽样 91
8.5对照实验 91
8.6误差 94
8.6.1抽样误差 94
8.6.2非抽样误差 96
8.7概括性度量 97
8.7.1集中趋势度量 98
8.7.2离散程度度量 100
8.7.3小结 100
8.8概率与分布 100
8.8.1数学期望 102
8.8.2正态分布 103
8.8.3其他分布 106
8.9统计学与大数据 107
第9章信息论 109
9.1模拟信号 109
9.2信息量与信息熵 110
9.3香农公式 111
9.4数字信号 112
9.5编码与压缩 113
9.5.1无损压缩 114
9.5.2有损压缩 117
9.6本章小结 126
第10章混沌论 127
10.1洛伦兹在想什么 128
10.2罗伯特·梅的养鱼计划 129
10.3有限的大脑,无限的维 130
10.4谋杀上帝的拉普拉斯 132
10.5庞加莱不是省油的灯 134
10.6未知居然还能做预测 137
10.7本章小结 137
第11章算法学 139
11.1离散的世界 139
11.2成本的度量 142
11.3穷举法——暴力破解 143
11.4分治法——化繁为简 152
11.5回溯法——能省则省 154
11.6贪心法——局部最优 155
11.7迭代法——步步逼近 156
11.7.1牛顿法 157
11.7.2梯度下降法 158
11.7.3遗传算法 159
11.8机器学习——自动归纳 161
11.8.1非监督学习 162
11.8.2监督学习 164
11.8.3强化学习 176
11.9神经网络——深度学习 178
11.9.1神经元 178
11.9.2BP神经网络 180
11.9.3损失函数 181
11.9.4非线性分类 183
11.9.5激励函数 187
11.9.6卷积神经网络 189
11.9.7循环神经网络 191
11.9.8小结 194
11.10本章小结 195
实践篇
第12章数据采集 198
12.1数据的源头 198
12.2日志收集 199
12.2.1实时上传 200
12.2.2延时上传 203
12.2.3加密问题 204
12.2.4压缩问题 205
12.2.5连接方式 206
12.2.6消息格式 208
12.2.7维度分解 210
12.3这只是不靠谱的开始 211
12.4本章小结 212
第13章数据存储 213
13.1读写不对等 213
13.1.1读多写少 214
13.1.2读少写多 214
13.1.3读写都多 215
13.2进快还是出快 216
13.2.1最快写入 216
13.2.2读出最快 218
13.3文件还是数据库 218
13.4要不要支持事务 219
13.5表分区和索引 221
13.5.1表分区 222
13.5.2索引 222
13.6稳定最重要 225
13.7安全性和副本 226
13.7.1RAID 226
13.7.2软冗余 228
13.8本章小结 229
第14章数据统计 230
14.1此“统计”恐非彼“统计” 230
14.2要精确还是要简洁 234
14.3统计是万能的吗 235
14.4注意性能 237
14.5本章小结 238
第15章数据建模 239
15.1模型是宝贵的财富 240
15.2量化是关键 241
15.3该算法出马了 241
15.3.1统计学模型 242
15.3.2线性关系 243
15.3.3复杂的非线性关系 243
15.4算法的哲学 244
15.5本章小结 245
第16章数据可视化与分析 247
16.1看得见,摸得着 247
16.2颜色很重要 247
16.3别说布局没有用 249
16.3.1由上而下,由简而繁 249
16.3.2总-分,分-总,总-分-总 251
16.3.3毗邻吸引 252
16.4有图就别要表格 253
16.5分析的内涵 254
16.5.1相关性分析 255
16.5.2预测分析 256
16.5.3其他分析 257
16.6有趣的统计应用 257
16.6.1不规则图形的面积 258
16.6.2套出你的实话 258
16.6.3巧测圆周率 259
16.7仁者见仁,智者见智 260
16.8永恒的困惑 261
16.9本章小结 263
第17章数据决策 264
17.1决策就是“拍脑袋” 264
17.2哪里有物质,哪里就有数据 265
17.2.1目的的统一 265
17.2.2数据胜于雄辩 266
17.3这是风险博弈 267
17.3.1性价比优先 267
17.3.2小迭代至上 268
17.3.3不要“输不起” 268
17.3.4留得青山在 269
17.4本章小结 270
第18章案例分析 272
18.1K线图里的秘密 272
18.1.1什么是市场 273
18.1.2谁在控制价格 273
18.1.3货币价格的形成 276
18.1.4零和博弈 277
18.1.5涨跌都盈利 278
18.1.6价格的预测 279
18.1.7形态 280
18.1.8K线图周期 282
18.1.9造市商与点差 283
18.1.10科学分析 284
18.1.11小结 317
18.2数学能救命 317
18.2.1阴云下的大西洋 317
18.2.2护航船队的救星 318
18.2.3数学家的天下 324
18.2.4小结 324
18.3人人都能运筹帷幄 325
第19章与本书相关内容的问与答 326
后记 333
附录A 335
A.1VMware Workstation的安装 335
A.1.1VMware简介 335
A.1.2安装准备工作 335
A.2CentOS虚拟机的安装 338
A.2.1下载DVD镜像 338
A.2.2创建VMware虚拟机 338
A.3Ubuntu虚拟机的安装 344
A.4Python语言简介 350
A.4.1安装Python 350
A.4.2Hello Python 350
A.4.3行与缩进 350
A.4.4变量类型 351
A.4.5循环语句 352
A.4.6函数 353
A.4.7模块 354
A.4.8小结 354
A.5Scikit-learn库简介 355
A.6安装Theano 356
A.7安装Keras 356
A.8安装MySQL 357
A.9安装MySQL-Python驱动 358
A.10MT4平台简介 359
参考文献 363



    熟悉论坛请点击新手指南
下载说明
1、论坛支持迅雷和网际快车等p2p多线程软件下载,请在上面选择下载通道单击右健下载即可。
2、论坛会定期自动批量更新下载地址,所以请不要浪费时间盗链论坛资源,盗链地址会很快失效。
3、本站为非盈利性质的学术交流网站,鼓励和保护原创作品,拒绝未经版权人许可的上传行为。本站如接到版权人发出的合格侵权通知,将积极的采取必要措施;同时,本站也将在技术手段和能力范围内,履行版权保护的注意义务。
(如有侵权,欢迎举报)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

GMT+8, 2026-1-28 05:02