楼主: olympic
627 13

贝叶斯方法 概率编程与贝叶斯推断 中文版 [推广有奖]

  • 0关注
  • 4粉丝

教授

66%

还不是VIP/贵宾

-

威望
0
论坛币
6070 个
通用积分
4.0844
学术水平
45 点
热心指数
85 点
信用等级
26 点
经验
8539 点
帖子
1078
精华
0
在线时间
1965 小时
注册时间
2014-4-10
最后登录
2019-9-15

olympic 发表于 2019-6-10 08:22:38 |显示全部楼层
贝叶斯方法  概率编程与贝叶斯推断
贝叶斯方法 概率编程与贝叶斯推断 Bayesian Methods for Hackers 中文版,结合编程讲贝叶斯方法。







贝叶斯方法 概率编程与贝叶斯推断 Bayesian Methods for Hackers Probabilistic Prog.pdf

34.46 MB

贝叶斯方法 概率编程与贝叶斯推断

stata SPSS
olympic 发表于 2019-6-10 08:25:59 |显示全部楼层
内容提要:
本书基于PyMC语言以及一系列常用的Python数据分析框架,如NumPy、Scipy和Matplotlib,通过概率编程的方式,讲解了贝叶斯推断的原理和实现方法。该方法常常可以在避免引和人大量数学分析的前提下,有效地解决问题。书中使用的案例往往是工作中遇到的实际问题,有趣并且实用。作者的阐述也尽量避免宛长的数学分析,而让读者可以动手解决一个个的具体问题。通过对本书的学习,读者可以对贝叶斯思维、概率编程有较为深入的了解,为将来从事机器学习、数据分析相关的工作打下基础。本书适用于机器学习、贝叶斯推断、概率编程等相关领域的从业者和爱好者,也适合普通开发人员了解贝叶斯统计而使用。
回复

使用道具 举报

olympic 发表于 2019-6-10 08:26:18 |显示全部楼层

中文推荐序:
从20世纪80年代末到90年代,人工智能领域出现了3个最重要的进展:
深度神经网络、贝叶斯概率图模型和统计学习理论。从2010年以来,由于深度神经网络在语音和图像等应用领域的巨大成功,其重要性被学术界和工业界广泛接受和推崇。相对而言,同样具有巨大实用价值的贝叶斯学习远没有受到充分的重视。在这个背景下,本书的出版对于推动贝叶斯学习和推断的实践具有非常积极的意义。本书通过浅显易慌的方式介绍了各种典型贝叶斯机器学习算法,并结合具体应用给出代码示例,无论是对于在各个公司中工作的工程师,还是从事机器学习研究的学者,在实践方面都有很强的指导价值。我个人相信,在下一个10年里,工程师掌握贝叶斯学习和推断,就像今天掌握CIC++、Python等编程语言一样重要和普遍。
回复

使用道具 举报

olympic 发表于 2019-6-10 08:26:40 |显示全部楼层
原书序言:
贝叶斯方法是现代数据科学家运用的众多工具集中的一种,可以用来解决预测、分类、垃圾邮件检测、排序、推断等诸多问题。然而,目前大多数关于贝叶斯统计和推断的资料都注重于数学细节,而较少从更加实用的工程角度进行考虑。因此我很乐意将本书加入到丛书(Addison-Wesley数据分析丛书)里,带给实践者一本关于贝叶斯方法的必备书籍。
Cameron(本书作者)在该主题上的知识背景,以及他对采用切实可行的例子进行实验的专注,使得本书对于想要学习贝叶斯方法的数据科学家和普通程序员来说,都是一本非常好的和人门书籍。本书充满了实例、图表和可运行的Python代码,因此你能很容易地开始解决实际问题。如果你对数据科学、贝叶斯方法并不熟悉,或没有用Python执行过数据科学任务,本书将是一本帮你起步的无价之宝。
PaulDix
回复

使用道具 举报

olympic 发表于 2019-6-10 08:33:06 |显示全部楼层
前言
贝叶斯方法是一种常用的推断方法,然而对读者来说它通常隐藏在乏味的数学分析章节背后。关于贝叶斯推断的书通常包含两到三章关于概率论的内容,然后才会阐述什么是贝叶斯推断。不幸的是,由于大多数贝叶斯模型在数学上难以处理,这些书只会为读者展示简单、人造的例子。这会导致由叶斯推断给读者贸下“那又如何”的印象。实际上,这曾是我自己的先验观点。
最近贝叶斯方法在一些机器学习竞赛上取得了成功,让我决定再次研究这一主题。然而即便以我的数学功底,我也花了整整3天时间来阅读范例,并试图将它们汇总起来以便理解这一方法。那时并没有足够的文献将理论和实际结合起来。而让我产生理解偏差的正是由于没能将贝叶斯数学理论和概率编程实践结合起来。当然,如今读者已经无需再遭遇我当时的情景。本书就是为了填补这一空缺而编写的。
如果我们最终是要进行贝叶斯推断,那么一方面我们可以采用数学分析来实现这一目的,而另一方面,随着计算成本的下降,我们已经可以通过概率编程来完成这一任务。后一种方法更加有用,因为它避免了在每一步介入数学干预,而这也使得进行贝叶斯推断不再以通常很焚手的数学分析为前提。简而言之,后一种计算途径,是从问题起点经过小幅中间步骤到达问题终点,而前一种途径则大幅进,并通常最后远离目标。此外,如果没有深厚的数学功底,也根本无法完成前一种途径所需要的数学分析。
本书首先从计算和理解的角度,而后从数学分析的角度对贝叶斯推断进行了介绍。当然,作为一本入门书籍,本书将停久在人门阶段。对于受过数学训练的人来说,本书产生的疑问可通过其他偏重数学分析的书来解答。对于缺少数学背景的爱好者,或是仅对贝叶斯方法的实践而非数学理论感兴趣的读者来说,本书足以胜任且蕴含趣味。
选择PyMC作为概率编程语言有两方面原因。首先,在写本书之时,并没有集中的关于PyMC的说明和实例等资料。官方文档面向具有贝叶斯推断和概率编程背景知识的人。而我们希望本书可以鼓励各个层次的人了解PyMC。其次,随着近来用Python实现科学计算框架的流行及其核心进展,PyMC可能很快会成为核心组件之一。

PyMC的运行需要一些依赖库,包括NumPy以及可选的Scipy。为了不产生限制,本书的实例只依末PyMC、NumPy、SciPy和Matplotlib,本书内容安排如下。第1章介绍贝叶斯推断方法以及与其他推断方法的比较。我们会看到第一个贝叶斯模型,并对其进行建立和训练。第2章以实例为重点,讲述如何用PyMC构建模型。第3章介绍计算推断背后的一个强大算法一一马尔科夫链壹特卡洛,以及一些贝叶斯模型的调试技术。在第4章里,我们再次回到推断的样本最问题上,并解释为何样本量大小如此重要。第5章介绍强大的损失函数,它将在真实世界的问题与数学推断之问建立连接。我们将在第6章回顾贝叶斯先验 ,并通过启发式的方法找到先验的更优解。最后,我们在第7章探索如何将贝叶斯推断用于A/B测试。
本书用到的所有数据集都可以从这里获得: https://github.com/CamDavidsonPilon/Probabilistic-Programming-and-Bayesian-Methods-for-Hackers
回复

使用道具 举报

olympic 发表于 2019-6-10 08:36:34 |显示全部楼层
作者简介:
Cameron Davidson-Pilon,接触过数学在多个领域的应用——从基因和疾病的动态演化,到金融价格的随机模型。他对于开源社区主要的贡献包括这本书以及lifelines项目。Cameron成长于加拿大的安大略省圭尔夫市,而就读于滑铁卢大学以及莫斯科独立大学。如今他住在安大略省渥太华市,并在电商领军者Shopify工作。

回复

使用道具 举报

olympic 发表于 2019-6-10 08:36:51 |显示全部楼层
翻译者简介:
辛愿,浙江大学硕士毕业,腾讯公司基础研究高级工程师,舆情系统开发经理。曾在百度从事推荐系统、用户画像、数据采集等相关研究工作,拥有多项专利,组织过上海大数据技术沙龙。目前专注于文本挖掘、舆情分析、智能聊天机器人等相关领域。

钟黎,腾讯公司研究员。曾在中国科学院、微软亚洲研究院、IBM研究院(新加坡)从事图像处理、语音处理、机器学习等相关研究工作,拥有多项专利,目前聚焦在自然语言处理、深度学习和人工智能等相关领域。

欧阳婷,华南理工大学硕士毕业,腾讯公司后台策略工程师。在电信、互联网行业参与过推荐系统、资源优化、KPI预测、用户画像等相关项目,拥有多项专利,目前聚焦在欺诈检测、时序分析、业务安全等相关领域。

校对者简介:
余凯博士,地平线机器人技术创始人、CEO,国际杰出机器学习专家,中国人工智能学会副秘书长。余博士是前百度研究院执行院长,创建了百度深度学习研究院。他在百度所领导的团队在广告变现、搜索排序、语音识别、计算机视觉等领域做出杰出贡献,创纪录地连续三次获得公司高荣誉——“百度奖”。他还创建了中国公司自动驾驶项目,后发展为百度自动驾驶事业部。

岳亚丁博士,腾讯公司专家研究员,腾讯技术职级评委会基础研究岗位的负责委员。岳博士拥有19年在金融、电信、互联网行业的数据挖掘经验,主导或参与过用户画像、在线广告、推荐系统、CRM、欺诈检测、KPI预测等多种项目。他曾在微软(加拿大)从事行为定向广告的模型研发,另有11年的工程结构、海洋水文气象的力学研究及应用的工作经历。
回复

使用道具 举报

olympic 发表于 2019-6-10 08:38:31 |显示全部楼层
目录
第1章 贝叶斯推断的哲学 1
1.1 引言 1
1.1.1 贝叶斯思维 1
1.1.2 贝叶斯推断在实践中的运用 3
1.1.3 频率派的模型是错误的吗? 4
1.1.4 关于大数据 4
1.2 我们的贝叶斯框架 5
1.2.1 不得不讲的实例:抛硬币 5
1.2.2 实例:图书管理员还是农民 6
1.3 概率分布 8
1.3.1 离散情况 9
1.3.2 连续情况 10
1.3.3 什么是 12
1.4 使用计算机执行贝叶斯推断 12
1.4.1 实例:从短信数据推断行为 12
1.4.2 介绍我们的第一板斧:PyMC 14
1.4.3 说明 18
1.4.4 后验样本到底有什么用? 18
1.5 结论 20
1.6 补充说明 20
1.6.1 从统计学上确定两个l值是否真的不一样 20
1.6.2 扩充至两个转折点 22
1.7 习题 24
1.8 答案 24
第2章 进一步了解PyMC 27
2.1 引言 27
2.1.1 父变量与子变量的关系 27
2.1.2 PyMC变量 28
2.1.3 在模型中加入观测值 31
2.1.4 最后…… 33
2.2 建模方法 33
2.2.1 同样的故事,不同的结局 35
2.2.2 实例:贝叶斯A/B测试 38
2.2.3 一个简单的场景 38
2.2.4 A和B一起 41
2.2.5 实例:一种人类谎言的算法 45
2.2.6 二项分布 45
2.2.7 实例:学生作弊 46
2.2.8 另一种PyMC模型 50
2.2.9 更多的PyMC技巧 51
2.2.10 实例:挑战者号事故 52
2.2.11 正态分布 55
2.2.12 挑战者号事故当天发生了什么? 61
2.3 我们的模型适用吗? 61
2.4 结论 68
2.5 补充说明 68
2.6 习题 69
2.7 答案 69
第3章 打开MCMC的黑盒子 71
3.1 贝叶斯景象图 71
3.1.1 使用MCMC来探索景象图 77
3.1.2 MCMC算法的实现 78
3.1.3 后验的其他近似解法 79
3.1.4 实例:使用混合模型进行无监督聚类 79
3.1.5 不要混淆不同的后验样本 88
3.1.6 使用MAP来改进收敛性 91
3.2 收敛的判断 92
3.2.1 自相关 92
3.2.2 稀释 95
3.2.3 pymc.Matplot.plot() 97
3.3 MCMC的一些秘诀 98
3.3.1 聪明的初始值 98
3.3.2 先验 99
3.3.3 统计计算的无名定理 99
3.4 结论 99
第4章 从未言明的最伟大定理 101
4.1 引言 101
4.2 大数定律 101
4.2.1 直觉 101
4.2.2 实例:泊松随机变量的收敛 102
4.2.3 如何计算Var(Z) 106
4.2.4 期望和概率 106
4.2.5 所有这些与贝叶斯统计有什么关系呢 107
4.3 小数据的无序性 107
4.3.1 实例:地理数据聚合 107
4.3.2 实例:Kaggle的美国人口普查反馈比例预测比赛 109
4.3.3 实例:如何对Reddit网站上的评论进行排序 111
4.3.4 排序! 115
4.3.5 但是这样做的实时性太差了 117
4.3.6 推广到评星系统 122
4.4 结论 122
4.5 补充说明 122
4.6 习题 123
4.7 答案 124
第5章 失去一只手臂还是一条腿 127
5.1 引言 127
5.2 损失函数 127
5.2.1 现实世界中的损失函数 129
5.2.2 实例:优化“价格竞猜”游戏的展品出价 130
5.3 机器学习中的贝叶斯方法 138
5.3.1 实例:金融预测 139
5.3.2 实例:Kaggle观测暗世界 大赛 144
5.3.3 数据 145
5.3.4 先验 146
5.3.5 训练和PyMC实现 147
5.4 结论 156
第6章 弄清楚先验 157
6.1 引言 157
6.2 主观与客观先验 157
6.2.1 客观先验 157
6.2.2 主观先验 158
6.2.3 决策,决策…… 159
6.2.4 经验贝叶斯 160
6.3 需要知道的有用的先验 161
6.3.1 Gamma分布 161
6.3.2 威沙特分布 162
6.3.3 Beta分布 163
6.4 实例:贝叶斯多臂老虎机 164
6.4.1 应用 165
6.4.2 一个解决方案 165
6.4.3 好坏衡量标准 169
6.4.4 扩展算法 173
6.5 从领域专家处获得先验分布 176
6.5.1 试验轮盘赌法 176
6.5.2 实例:股票收益 177
6.5.3 对于威沙特分布的专业提示 184
6.6 共轭先验 185
6.7 杰弗里斯先验 185
6.8 当N增加时对先验的影响 187
6.9 结论 189
6.10 补充说明 190
6.10.1 带惩罚的线性回归的贝叶斯视角 190
6.10.2 选择退化的先验 192
第7章 贝叶斯A/B测试 195
7.1 引言 195
7.2 转化率测试的简单重述 195
7.3 增加一个线性损失函数 198
7.3.1 收入期望的分析 198
7.3.2 延伸到A/B测试 202
7.4 超越转化率:t检验 204
7.4.1 t检验的设定 204
7.5 增幅的估计 207
7.5.1 创建点估计 210
7.6 结论 211
术语表 213
回复

使用道具 举报

baokan001 发表于 2019-6-10 13:52:24 |显示全部楼层
葛朗台。
回复

使用道具 举报

lonestone 发表于 2019-6-11 06:30:55 来自手机 |显示全部楼层
olympic 发表于 2019-6-10 08:22
贝叶斯方法  概率编程与贝叶斯推断
贝叶斯方法 概率编程与贝叶斯推断 Bayesian Methods for Hackers 中文版 ...
谢谢楼主的分享
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 我要注册

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2019-9-19 23:40