深度强化学习核心算法与应用

深度强化学习核心算法与应用

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

本书是一本深度强化学习领域的入门读物。

内容简介

强化学习是实现决策智能的主要途径之一。经历数十年的发展,强化学习领域已经枝繁叶茂,技术内容纷繁复杂,这也为初学者快速入门造成障碍。

全书分为四部分。第一部分主要阐述强化学习领域的基本理论知识;第二部分讲解深度强化学习常用算法的原理、各算法之间的继承与发展,以及各自的算法流程;第三部分总结深度强化学习算法在游戏、推荐系统等领域的应用;第四部分探讨了该领域存在的问题和发展前景。

作者简介

编著者陈世勇,腾讯游戏AI研究中心高级算法研究员。毕业于南京大学机器学习与数据挖掘研究所,主要从事强化学习、分布式机器学习方面的研究工作,并在国际顶级会议和期刊上发表多篇论文。

对于大规模强化学习在游戏AI和推荐系统领域的研究和落地有着丰富经验,负责了多款游戏的强化学习AI项目和“淘宝锦囊”强化学习推荐项目研发,参与了虚拟淘宝项目研发。

章节目录

版权信息

内容简介

好评袭来

前言

第一部分 基础理论篇

1 马尔可夫决策过程

1.1 马尔可夫性

1.2 一些基本定义

1.3 值函数

1.4 基于策略的值函数

1.5 贝尔曼方程

1.6 策略迭代与值迭代

2 无模型的强化学习

2.1 蒙特卡罗方法

2.2 时间差分方法

2.3 值函数估计和策略搜索

3 有模型的强化学习

3.1 什么是模型

3.2 基本思路

3.3 有模型方法和无模型方法的区别

3.4 典型算法

第二部分 常用算法篇

4 DQN算法

4.1 算法介绍

4.2 相关改进

4.3 实验效果与小结

5 A3C算法

5.1 Actor-Critic方法

5.2 基线减法与优势函数

5.3 博采众长的A3C算法

5.4 实验效果与小结

6 确定性策略梯度方法

6.1 随机性策略梯度与确定性策略梯度

6.2 异策略的确定性策略梯度

6.3 深度确定性策略梯度

6.4 D4PG算法

6.5 实验效果与小结

7 PPO算法

7.1 PPO算法的核心

7.2 TRPO算法

7.3 PPO算法

7.4 实验效果与小结

8 IMPALA算法

8.1 算法架构

8.2 V-trace算法

8.3 V-trace Actor-Critic算法

8.4 实验效果与小结

第三部分 应用实践篇

9 深度强化学习在棋牌游戏中的应用

9.1 棋盘类游戏

9.2 牌类游戏

10 深度强化学习在电子游戏中的应用

10.1 研发游戏中的机器人

10.2 制作游戏动画

10.3 其他应用

11 深度强化学习在推荐系统中的应用

11.1 适用的场景

11.2 淘宝锦囊推荐中的应用

12 深度强化学习在其他领域中的应用

12.1 在无人驾驶中的应用

12.2 金融交易中的应用

12.3 信息安全中的应用

12.4 自动调参中的应用

12.5 交通控制中的应用

第四部分 总结与展望篇

13 问题与挑战

13.1 样本利用率低

13.2 奖赏函数难以设计

13.3 实验效果难复现

13.4 行为不完全可控

14 深度强化学习往何处去

14.1 未来发展和研究方向

14.2 审慎乐观,大有可为

参考资料

深度强化学习核心算法与应用是2021年由电子工业出版社出版,作者陈世勇 编著。

得书感谢您对《深度强化学习核心算法与应用》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
深度学习 电子书
本书介绍了深度学习的基本概念、算法原理以及实现框架。全书共9章,分别介绍了深度学习的发展历史、神经网络与深度神经网络、卷积神经网络、循环神经网络、深度学习在目标检测和图像描述中的应用、生成对抗网络、深度迁移学习和深度强化学习等,并提供了应用实例。
深度学习在动态媒体中的应用与实践 电子书
本书是一本深度学习的基础入门读物,对深度学习的基本理论进行了介绍,主要以Ubuntu系统为例搭建了三大主流框架——Caffe、TensorFlow、Torch,然后分别在3个框架下,通过3个实战项目掌握了框架的使用方法,并详细描述了生产流程,最后讲述了通过集群部署深度学习的项目以及如何进行运营维护的注意事项。本书适合对深度学习有浓厚兴趣的读者、希望用深度学习完成设计的计算机专业或电子信息专业的高校
联邦学习:原理与算法 电子书
人工智能机器学习教程书籍,平安科技联邦学习团队执笔,由浅入深介绍联邦机器学习的算法体系,注重工程实践,保证理论前沿性。
深度学习原理与实践 电子书
(1)大量图例,简单易懂。作者亲自绘制了大量插图,力求还原深度学习的算法思想,分解和剖析晦涩的算法,用图例来表示复杂的问题。生动的图例也能给读者带来阅读乐趣,快乐地学习算法知识,体会深度学习的算法本质。 (2)简化公式,生动比喻。深度学习和机器学习类的书中通常会有大量复杂冗长的算法公式,为了避免出现读者读不懂的情况,本书尽可能地统一了公式和符号,简化相关公式,并加以生动的比喻进行解析。在启发读者的同时,锻炼读者分析问题和解决问题的能力。 (3)算法原理,代码实现。在介绍深度学习及相关算法的原理时,不仅给出了对应的公式,还给出了实现和求解公式的代码,让读者明确该算法的作用、输入和输出。原理与代码相结合,使得读者对深度学习的算法实现更加具有亲切感。 (4)深入浅出,精心剖析。理解深度学习需要一定的机器学习知识,本书在D1章介绍了深度学习与机器学习的关系,并简要介绍了机器学习的内容。在内容安排上,每章依次介绍模型框架的应用场景、结构和使用方式,最后通过真实的案例去全面分析该模型结构。目的是让读者可以抓住深度学习的本质。 (5)入门实践,案例重现。每一章最后的真实案例不是直接堆砌代码,而是讲解使用该算法模型的原因和好处。从简单的背景知识出发,使用前文讲解过的深度学习知识实现一个实际的工程项目。实践可以用于及时检验读者对所学知识的掌握程度,为读者奠定深度学习的实践基础。 将一本技术书籍写得通俗易懂谈何容易,但《深度学习原理与实践》这本书确实做到了。书中对近年来火热的深度学习理论知识进行简单剖析,化繁为简,没有局限于坐而论道,而是将实例和数学理论相结合,让读者能够快速理解各种模型并上手实践,值得细读。 --唐春明 广州大学数学与信息学科学院副院长 本书从原理、方法、实践这 3 个维度系统地介绍了深度学习的方方面面,内容详实,解读清晰,细节与全貌兼顾,既适合初学者阅读,也可以作为深入研究的参考用书。 --杨刚 西安电子科技大学教授 近年来出版的深度学习相关图书中,本书是我见过非常有指导意义的中文书籍之一。本书对 ANN、CNN、RNN 等模型进行深入浅出的介绍,引入大量图例和简化后的公式,让算法浅显易懂。每一章的实践内容都给人惊喜,强烈推荐! --吴健之 腾讯音乐高级工程师 作为产品经理,我能看懂的深度学习书籍实在太少了。本书恰到好处,插图丰富直观,数学公式简练,很喜欢此类风格的图书,易懂好学。即使你不是程序员或算法专家,该书也值得一看! --张瑞 中软国际高级产品经理
JavaScript深度学习 电子书
深度学习扛鼎之作《Python深度学习》姊妹篇,前端工程师不可错过的AI入门书。