版: 第1版
国际标准书号: 978-1789342093
发表于: 2018年10月20日
页数: 288页
作者:Giuseppe Ciaburro
使用Keras 强化学习掌握强化学习算法的实用指南在过去几年中已经发展了很多,并且被证明是构建智能和智能AI网络的成功技术。Keras强化学习项目使用强化学习的算法和技术,以及更快的实验库Keras,将人类级性能安装到您的应用程序中。
本书首先介绍了使用Keras强化学习的概念。您将学习如何使用马尔可夫链模拟随机游走,并使用动态编程(DP)和Python选择最佳投资组合。您还将探索诸如使用蒙特卡罗方法预测股票价格,使用时间距离(TD)学习算法提供车辆路线应用以及使用马尔可夫决策过程平衡旋转机械系统等项目。
一旦您了解了基础知识,您将继续使用Segway建模,使用深度强化学习运行机器人控制系统,以及使用图像数据集在Python中构建手写数字识别模型。最后,你将在Q-Learning和强化学习算法的帮助下出色地玩棋盘游戏Go。
在本书的最后,您不仅可以开展关于强化学习的概念,算法和技术的实践培训,而且还可以探索人工智能世界。
你将学到什么
在预测和博彩评估中练习马尔可夫决策过程
实施蒙特卡罗方法预测环境行为
探索TD学习算法以管理仓库操作
使用Python和Keras构建深度Q网络来控制机器人的移动
应用强化概念,使用图像数据集构建手写数字识别模型
使用Q-Learning和OpenAI Gym解决游戏理论问题