《强化学习的数学原理》中文PDF+英文PDF+课件+赵世钰
《强化学习的数学原理》中文PDF,294页,有书签; 英文PDF,283页,有书签,文字可复制; 配套课件。作者:赵世钰
下载: https://pan.baidu.com/s/1xRP5o0GIkT_8rKjYz2Gq6w?pwd=eh6k
提取码: eh6k
提纲挈领,抓住了主要的矛盾,主要的脉络,让人知道这个方法是在做什么的,原理是什么 ;由浅入深,每一节一开始的例子非常好,不会让人觉得难,但是又深刻揭示了方法的本质 ;深度刚刚好,不那么浅显,也不那么晦涩难懂。
具备基础的微积分和概率论知识、学过现代控制理论的情况下,做强化学习方面的研究,如果具备基础的编程能力,每一个部分,每一个函数的每一个值要怎么计算会非常清楚,明确知道要做RL创新研究的理论门槛在哪,以及知道你距离这个门槛还有多远。
《深度学习入门4强化学习》中文PDF+源代码+斋藤康毅
《深度学习入门4强化学习》中文PDF,333页,有书签,文字可复制;配套源代码,斋藤康毅著
下载: https://pan.baidu.com/s/11shyG47YZ7BzSfrOAwiHKg?pwd=4sjh
提取码: 4sjh
前半部分介绍强化学习的重要思想和基础知识,后半部分介绍如何将深度学习应用于强化学习,遴选讲解了深度强化学习的最新技术。
从最适合入门的多臂老虎机问题切入,依次介绍了定义一般强化学习问题的马尔可夫决策过程、用于寻找最佳答案的贝尔曼方程,以及解决贝尔曼方程的动态规划法、蒙特卡洛方法和TD方法。
随后,神经网络和Q学习、DQN、策略梯度法等几章则分别讨论了深度学习在强化学习领域的应用。搭配丰富的图、表、代码示例,加上轻松、简明的讲解,让人循序渐进地理解强化学习中各种方法之间的关系,于不知不觉中登堂入室。
在快速发展变化的深度学习领域,有变化的事物,有不变的事物。有些事物会随潮流而消逝,有些则会被传承下去。从马尔可夫决策过程、贝尔曼方程、蒙特卡洛方法、时间差分法等强化学习基础方法,自然而然地过渡到神经网络和深度学习,从前沿视角遴选出最值得关注的强化学习理论和方法。
《机器学习方法》PDF+李航
《机器学习方法》PDF,579页,有书签,文字可复制
下载: https://pan.baidu.com/s/1esIQZVOuEkYAmqwLvHKZ8Q?pwd=nqac
提取码: nqac
文本信息处理中, 传统的方法以单词向量表示文本的语义内容,以单词向量空间的度量表示文本之间的话义相似度。潜在语义分析旨在解决这种方法不能准确表示语义的问题, 试图从大量的文本数据中发现潜在的话题,以话题向量表示文本的语义内容,以话题向量空间的度量更准确地表示文本之间的语义相似度。这也是话题分析Ctopic modeling ) 的基本想法。
第1 篇介绍监督学习的主要方法,包括感知机、k 近邻法、朴素贝叶斯法、决策树、逻辑斯谛回归与最大熵模型、支持向量机、Boosting、EM 算法、隐马尔可夫模型、条件随机场等;第2 篇介绍无监督学习
的主要方法,包括聚类、奇异值分解、主成分分析、潜在语义分析、概率潜在语义分析、马尔可夫链蒙特卡罗法、潜在狄利克雷分配、PageRank 算法等;第3 篇介绍深度学习的主要方法,包括前馈神经网络、卷积神经网络、循环神经网络、序列到序列模型、预训练语言模型、生成对抗网络等。
《深度学习入门2自制框架》中文PDF+源代码+斋藤康毅
《深度学习入门2自制框架》中文PDF,504页,有书签,文字可复制;配套源代码,斋藤康毅著
下载: https://pan.baidu.com/s/1PBrX88KcKP4TEselzCAC7A?pwd=2s36
提取码: 2s36
深度学习框架中蕴藏着惊人的技术和有趣的机制,旨在揭开这些技术和机制的神秘面纱,帮助正确理解技术,体会它们的有趣之处。
从零开始创建一个深度学习框架——DeZero。DeZero 是原创的框架,它用最少的代码实现了现代深度学习框架的功能。分60 个步骤来完成这个框架,在此过程中,会加深对PyTorch、TensorFlow 和Chainer 等现代深度学习框架的理解,看清深度学习框架的本质。
如今,深度学习正在推动各个领域的创新。自动驾驶技术、疾病自动诊断技术、高精度机器翻译技术、先进的机器人控制技术
这些仿佛在虚拟世界中才会出现的技术近年来正在成为现实,而且在实际生活中得到了应用。令人惊讶的是,这些技术大多因为深度学习才得以实现(或者正在实现)。可以说我们生活在一个由深度学习改变世界的时代。


雷达卡





京公网安备 11010802022788号







