深度强化学习落地指南(博文视点出品)

深度强化学习落地指南(博文视点出品)

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

内容简介

本书从工业界一线算法工作者的视角,对深度强化学习落地实践中的工程经验和相关方法论做出了深度思考和系统归纳。本书跳出了原理介绍加应用案例的传统叙述模式,转而在横向上对深度强化学习落地过程中的核心环节进行了完整复盘。主要内容包括需求分析和算法选择的方法,动作空间、状态空间和回报函数设计的理念,训练调试和性能冲刺的技巧等。本书既是前人智慧与作者个人经验的交叉印证和精心整合,又构成了从理论到实践再到统一方法论的认知闭环,与市面上侧重于算法原理和代码实现的强化学习书籍形成了完美互补。

作者简介

魏 宁本科和硕士分别毕业于西安交通大学和中国科学院大学计算机专业,在国际顶级会议和期刊上发表多篇学术论文,曾就职于德国KUKA Robotics从事协作机器人智能应用研发工作,目前在海康威视研究院任算法专家,负责深度学习、强化学习等领域的创新研究和落地应用,同时也是互联网社区“深度强化学习实验室”核心成员。

章节目录

第1章 需求分析 1

1.1 需求分析:勿做DRL铁锤人 1

1.2 一问“是不是” 2

1.2.1 Agent和环境定义 2

1.2.2 马尔可夫决策过程和强化学习 3

1.3 二问“值不值” 5

1.3.1 试试规则和启发式搜索 5

1.3.2 别忘了传统强化学习 7

1.3.3 使用DRL的理由 7

1.4 三问“能不能” 9

1.4.1 场景固定:两个分布一致 9

1.4.2 数据廉价:多、快、好、费 13

1.5 四问“边界在哪里” 16

1.6 本章小结 18

参考文献 19

第2章 动作空间设计 23

2.1 动作空间设计:这里大有可为 23

2.1.1 被忽视的价值 23

2.1.2 动作空间的常见类型 24

2.1.3 动作空间设计的基本原则 26

2.2 动作空间的完备性 26

2.2.1 功能完备 27

2.2.2 时效完备 29

2.3 动作空间的高效性 30

2.3.1 化整为零:以精度换效率 31

2.3.2 有机组合:尺度很重要 33

2.4 动作空间的合法性 35

2.4.1 非法动作屏蔽机制 36

2.4.2 Agent的知情权 37

2.5 本章小结 39

参考文献 40

第3章 状态空间设计 43

3.1 状态空间设计:特征工程的诱惑 43

3.2 状态空间设计的两种常见误区 44

3.2.1 过分依赖端到端特征学习 44

3.2.2 极致特征工程 44

3.3 与动作空间和回报函数的协同设计 45

3.3.1 与动作空间尺度一致 45

3.3.2 以回报函数为中心 46

3.4 状态空间设计的四个步骤 47

3.4.1 任务分析 47

3.4.2 相关信息筛选 49

3.4.3 泛化性考量 53

3.4.4 效果验证 58

3.5 本章小结 61

参考文献 62

第4章 回报函数设计 64

4.1 回报函数设计:面向强化学习的编程 64

4.2 稀疏回报问题 65

4.2.1 孤独无援的主线回报 65

4.2.2 稀疏回报问题的本质 66

4.3 辅助回报 67

4.3.1 子目标回报 67

4.3.2 塑形回报 70

4.3.3 内驱回报 76

4.3.4 回报取值的注意事项 77

4.4 回报函数设计的常见陷阱 78

4.4.1 鲁莽 79

4.4.2 贪婪 80

4.4.3 懦弱 82

4.5 最优回报问题 83

4.6 基于学习的回报函数 84

4.6.1 经典方法 84

4.6.2 前沿方法 85

4.7 本章小结 87

参考文献 88

第5章 算法选择 92

5.1 算法选择:拿来主义和改良主义 92

5.1.1 DRL算法的发展脉络 92

5.1.2 一筛、二比、三改良 94

5.1.3 从独当一面到众星捧月 96

5.2 牢记经典勿忘本 97

5.2.1 DQN 98

5.2.2 DDPG 99

5.2.3 A3C 102

5.3 关注SOTA算法别留恋 105

5.3.1 TD3 105

5.3.2 SAC 107

5.3.3 PPO 110

5.4 其他算法 112

5.5 本章小结 113

参考文献 113

第6章 训练调试 119

6.1 训练调试:此事要躬行 119

6.2 训练前的准备工作 120

6.2.1 制定训练方案 120

6.2.2 选择网络结构 124

6.2.3 随机漫步 128

6.2.4 数据预处理 129

6.3 训练进行时 131

6.3.1 反脆弱:拥抱不确定性 131

6.3.2 调节超参数 134

6.3.3 监控训练状态 143

6.4 给初学者的建议 146

6.5 本章小结 148

参考文献 149

第7章 性能冲刺 154

7.1 性能冲刺:为DRL注入强心剂 154

7.2 课程学习 155

7.2.1 源任务及其分类 155

7.2.2 应用方式 157

7.3 额外监督信号 162

7.3.1 有监督预训练 163

7.3.2 辅助任务 164

7.4 进化策略 169

7.4.1 基本原理 169

7.4.2 关键细节 170

7.4.3 应用方式 174

7.5 本章小结 175

参考文献 176

深度强化学习落地指南(博文视点出品)是2021年由电子工业出版社出版,作者魏宁。

得书感谢您对《深度强化学习落地指南(博文视点出品)》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
动手学强化学习 电子书
.名家作品:上海交通大学ACM班创始人俞勇教授、博士生导师张伟楠副教授、APEX实验室博士生沈键编写;.理论扎实:基于上交大ACM班的人工智能专业课程构建强化学习的学习体系;.配套资源丰富:在线代码运行环境+在线视频课程+在线讨论区+在线习题+配套课件;.多位业内大咖力荐:字节跳动人工智能实验室总监李航、1986年图灵奖得主JohnHopcroft、北京大学数学科学学院统计学教授张志华、伦敦大学学院计算机科学系讲席教授汪军、亚马逊资深科学家、《动手学深度学习》作者李沐
PyTorch深度学习实战 电子书
1.PyTorch核心开发者教你使用PyTorch创建神经网络和深度学习系统的实用指南。2.详细讲解整个深度学习管道的关键实践,包括PyTorch张量API、用Python加载数据、监控训练以及对结果进行可视化。3.PyTorch核心知识+真实、完整的案例项目,快速提升读者动手能力:a.全面掌握PyTorch相关的API的使用方法以及系统掌握深度学习的理论和方法;b.快速从零开始构建一个真实示例:肿瘤图像分类器;c.轻松学会使用PyTorch实现各种神经网络模型来解决具体的深度学习问题;d.章尾附有“练习题”,巩固提升所学知识;更有配套的代码文件可下载并动手实现。4.PyTorch联合创作者SoumithChintala作序推荐!5.书中所有代码都是基于Python3.6及以上的版本编写的,提供源代码下载。
深度学习与围棋 电子书
深入浅出的深度学习入门书,从零实现AlphaGo,为AI理论和应用打下基础。
EASY RL:强化学习教程 电子书
本书重点突出强化学习作为机器学习及人工智能领域的一种重要方法,在游戏、自动驾驶、机器人路线规划等领域得到了广泛的应用。
深度学习原理与实践 电子书
(1)大量图例,简单易懂。作者亲自绘制了大量插图,力求还原深度学习的算法思想,分解和剖析晦涩的算法,用图例来表示复杂的问题。生动的图例也能给读者带来阅读乐趣,快乐地学习算法知识,体会深度学习的算法本质。 (2)简化公式,生动比喻。深度学习和机器学习类的书中通常会有大量复杂冗长的算法公式,为了避免出现读者读不懂的情况,本书尽可能地统一了公式和符号,简化相关公式,并加以生动的比喻进行解析。在启发读者的同时,锻炼读者分析问题和解决问题的能力。 (3)算法原理,代码实现。在介绍深度学习及相关算法的原理时,不仅给出了对应的公式,还给出了实现和求解公式的代码,让读者明确该算法的作用、输入和输出。原理与代码相结合,使得读者对深度学习的算法实现更加具有亲切感。 (4)深入浅出,精心剖析。理解深度学习需要一定的机器学习知识,本书在D1章介绍了深度学习与机器学习的关系,并简要介绍了机器学习的内容。在内容安排上,每章依次介绍模型框架的应用场景、结构和使用方式,最后通过真实的案例去全面分析该模型结构。目的是让读者可以抓住深度学习的本质。 (5)入门实践,案例重现。每一章最后的真实案例不是直接堆砌代码,而是讲解使用该算法模型的原因和好处。从简单的背景知识出发,使用前文讲解过的深度学习知识实现一个实际的工程项目。实践可以用于及时检验读者对所学知识的掌握程度,为读者奠定深度学习的实践基础。 将一本技术书籍写得通俗易懂谈何容易,但《深度学习原理与实践》这本书确实做到了。书中对近年来火热的深度学习理论知识进行简单剖析,化繁为简,没有局限于坐而论道,而是将实例和数学理论相结合,让读者能够快速理解各种模型并上手实践,值得细读。 --唐春明 广州大学数学与信息学科学院副院长 本书从原理、方法、实践这 3 个维度系统地介绍了深度学习的方方面面,内容详实,解读清晰,细节与全貌兼顾,既适合初学者阅读,也可以作为深入研究的参考用书。 --杨刚 西安电子科技大学教授 近年来出版的深度学习相关图书中,本书是我见过非常有指导意义的中文书籍之一。本书对 ANN、CNN、RNN 等模型进行深入浅出的介绍,引入大量图例和简化后的公式,让算法浅显易懂。每一章的实践内容都给人惊喜,强烈推荐! --吴健之 腾讯音乐高级工程师 作为产品经理,我能看懂的深度学习书籍实在太少了。本书恰到好处,插图丰富直观,数学公式简练,很喜欢此类风格的图书,易懂好学。即使你不是程序员或算法专家,该书也值得一看! --张瑞 中软国际高级产品经理