强化学习:原理与Python实战

强化学习:原理与Python实战

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

携七大优势,带你一书学透强化学习,掌握ChatGPT背后的关键技术。

内容简介

本书从原理和实战两个方面介绍了强化学习。原理方面,深入介绍了主流强化学习理论和算法,覆盖资格迹等经典算法和MuZero等深度强化学习算法;实战方面,每章都配套了编程案例,以方便读者学习。

作者简介

作者肖智清,深度学习一线研发人员,现就职于世界排名第一的投资银行,清华大学博士。擅长概率统计、随机过程、时间序列和机器学习。近5年发表SCI/EI论文十余篇,是多个顶级期刊和会议审稿人。在国内外多项程序设计和数据科学竞赛获得冠军。

章节目录

版权信息

数学符号表

前言

第1章 初识强化学习

1.1 强化学习及其关键元素

1.2 强化学习的应用

1.3 智能体/环境接口

1.4 强化学习的分类

1.5 强化学习算法的性能指标

1.6 案例:基于Gym库的智能体/环境接口

1.7 本章小结

1.8 练习与模拟面试

第2章 Markov决策过程

2.1 Markov决策过程模型

2.2 价值

2.3 带折扣的分布

2.4 最优策略与最优价值

2.5 案例:悬崖寻路

2.6 本章小结

2.7 练习与模拟面试

第3章 有模型数值迭代

3.1 Bellman算子及其性质

3.2 有模型策略迭代

3.3 价值迭代

3.4 自益与动态规划

3.5 案例:冰面滑行

3.6 本章小结

3.7 练习与模拟面试

第4章 回合更新价值迭代

4.1 同策回合更新

4.2 异策回合更新

4.3 实验:21点游戏

4.4 本章小结

4.5 练习与模拟面试

第5章 时序差分价值迭代

5.1 时序差分目标

5.2 同策时序差分更新

5.3 异策时序差分更新

5.4 资格迹

5.5 案例:的士调度

5.6 本章小结

5.7 练习与模拟面试

第6章 函数近似方法

6.1 函数近似原理

6.2 基于梯度的参数更新

6.3 函数近似的收敛性

6.4 深度Q网络

6.5 案例:小车上山

6.6 本章小结

6.7 练习与模拟面试

第7章 回合更新策略梯度方法

7.1 策略梯度算法的原理

7.2 同策回合更新策略梯度算法

7.3 异策回合更新策略梯度算法

7.4 案例:车杆平衡

7.5 本章小结

7.6 练习与模拟面试

第8章 执行者/评论者

8.1 执行者/评论者方法

8.2 同策执行者/评论者算法

8.3 基于代理优势的同策算法

8.4 自然梯度和信赖域算法

8.5 重要性采样异策执行者/评论者算法

8.6 案例:双节倒立摆

8.7 本章小结

8.8 练习与模拟面试

第9章 连续动作空间的确定性策略

9.1 确定性策略梯度定理

9.2 同策确定性算法

9.3 异策确定性算法

9.4 探索过程

9.5 案例:倒立摆的控制

9.6 本章小结

9.7 练习与模拟面试

第10章 最大熵强化学习

10.1 最大熵强化学习与柔性强化学习理论

10.2 柔性强化学习算法

10.3 自动熵调节

10.4 案例:月球登陆器

10.5 本章小结

10.6 练习与模拟面试

第11章 基于策略的无梯度算法

11.1 无梯度算法

11.2 无梯度算法和策略梯度算法的比较

11.3 案例:双足机器人

11.4 本章小结

11.5 练习与模拟面试

第12章 值分布强化学习

12.1 价值分布及其性质

12.2 效用最大化强化学习

12.3 基于概率分布的算法

12.4 基于分位数的值分布强化学习

12.5 类别深度Q网络算法和分位数回归算法的比较

12.6 案例:Atari电动游戏Pong

12.7 本章小结

12.8 练习与模拟面试

第13章 最小化遗憾

13.1 遗憾

13.2 多臂赌博机

13.3 置信上界价值迭代

13.4 案例:Bernoulli奖励多臂赌博机

13.5 本章小结

13.6 练习与模拟面试

第14章 树搜索

14.1 回合更新树搜索

14.2 回合更新树搜索在棋盘游戏中的应用

14.3 案例:井字棋

14.4 本章小结

14.5 练习与模拟面试

第15章 模仿学习和人类反馈强化学习

15.1 模仿学习

15.2 人类反馈强化学习和生成性预训练变换模型

15.3 案例:机器人行走

15.4 本章小结

15.5 练习与模拟面试

第16章 更多智能体/环境接口模型

16.1 平均奖励离散时间Markov决策过程

16.2 连续时间Markov决策过程

16.3 非齐次Markov决策过程

16.4 半Markov决策过程

16.5 部分可观测Markov决策过程

16.6 案例:老虎

16.7 本章小结

16.8 练习与模拟面试

强化学习:原理与Python实战是2023年由机械工业出版社出版,作者肖智清。

得书感谢您对《强化学习:原理与Python实战》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
Python高手修炼之道:数据处理与机器学习实战 电子书
适读人群 :1.没有编程知识的新手 不同于一般的基础语法讲解教程,本书并未将Python 开发限定于某个集成开发工具(IDE)中,而是采用交互式编程的方式来强化读者对语言特性的理解,帮助新手读者真正理解Python 语言和Python 编程。2.从未接触过Python 语言,但了解一点编程知识的初学者 本书通过对基础知识高度的提炼和概括,以避免初学者陷入低级且冗长的细节知识点而心生懈怠;同时,本书为初学者规划了从初级到高级的编程技能提升路线图。3.具有一定基础的Python 程序员 本书可以作为案头工具书来使用。本书从基础语法、基本技能讲起,涵盖了科学计算、数据处理、机器学习等领域,示例代码涉及30 余个模块的使用。 构建从Python入门到数据分析到机器学习的路线图,入门有章可循; 1.讲解独到,常见盲点趣解析 作者基于多年的经验积累,善于总结概括初学Python过程中的误区。 2.内容全面,常用工具全涵盖 书中介绍的Python工具包覆盖Numpy、Matplotlib、Pandas、SciPy、Scikit-Learn,方便读者拓展实用技能、掌握工作利器。 3.拓展训练,重点知识有强化 语感训练100题、Python内置函数(类)手册、从新手到高手的100个模块,强化知识点的掌握。 4.代码完整,随时动手可复现 本书提供了完整、可验证的代码,方便读者动手练习并强化理解。
SpringSecurity原理与实战 电子书
本书主要介绍基于Spring Security构建系统安全性的技术体系和工程实践。
动手学强化学习 电子书
.名家作品:上海交通大学ACM班创始人俞勇教授、博士生导师张伟楠副教授、APEX实验室博士生沈键编写;.理论扎实:基于上交大ACM班的人工智能专业课程构建强化学习的学习体系;.配套资源丰富:在线代码运行环境+在线视频课程+在线讨论区+在线习题+配套课件;.多位业内大咖力荐:字节跳动人工智能实验室总监李航、1986年图灵奖得主JohnHopcroft、北京大学数学科学学院统计学教授张志华、伦敦大学学院计算机科学系讲席教授汪军、亚马逊资深科学家、《动手学深度学习》作者李沐
深度学习原理与实践 电子书
(1)大量图例,简单易懂。作者亲自绘制了大量插图,力求还原深度学习的算法思想,分解和剖析晦涩的算法,用图例来表示复杂的问题。生动的图例也能给读者带来阅读乐趣,快乐地学习算法知识,体会深度学习的算法本质。 (2)简化公式,生动比喻。深度学习和机器学习类的书中通常会有大量复杂冗长的算法公式,为了避免出现读者读不懂的情况,本书尽可能地统一了公式和符号,简化相关公式,并加以生动的比喻进行解析。在启发读者的同时,锻炼读者分析问题和解决问题的能力。 (3)算法原理,代码实现。在介绍深度学习及相关算法的原理时,不仅给出了对应的公式,还给出了实现和求解公式的代码,让读者明确该算法的作用、输入和输出。原理与代码相结合,使得读者对深度学习的算法实现更加具有亲切感。 (4)深入浅出,精心剖析。理解深度学习需要一定的机器学习知识,本书在D1章介绍了深度学习与机器学习的关系,并简要介绍了机器学习的内容。在内容安排上,每章依次介绍模型框架的应用场景、结构和使用方式,最后通过真实的案例去全面分析该模型结构。目的是让读者可以抓住深度学习的本质。 (5)入门实践,案例重现。每一章最后的真实案例不是直接堆砌代码,而是讲解使用该算法模型的原因和好处。从简单的背景知识出发,使用前文讲解过的深度学习知识实现一个实际的工程项目。实践可以用于及时检验读者对所学知识的掌握程度,为读者奠定深度学习的实践基础。 将一本技术书籍写得通俗易懂谈何容易,但《深度学习原理与实践》这本书确实做到了。书中对近年来火热的深度学习理论知识进行简单剖析,化繁为简,没有局限于坐而论道,而是将实例和数学理论相结合,让读者能够快速理解各种模型并上手实践,值得细读。 --唐春明 广州大学数学与信息学科学院副院长 本书从原理、方法、实践这 3 个维度系统地介绍了深度学习的方方面面,内容详实,解读清晰,细节与全貌兼顾,既适合初学者阅读,也可以作为深入研究的参考用书。 --杨刚 西安电子科技大学教授 近年来出版的深度学习相关图书中,本书是我见过非常有指导意义的中文书籍之一。本书对 ANN、CNN、RNN 等模型进行深入浅出的介绍,引入大量图例和简化后的公式,让算法浅显易懂。每一章的实践内容都给人惊喜,强烈推荐! --吴健之 腾讯音乐高级工程师 作为产品经理,我能看懂的深度学习书籍实在太少了。本书恰到好处,插图丰富直观,数学公式简练,很喜欢此类风格的图书,易懂好学。即使你不是程序员或算法专家,该书也值得一看! --张瑞 中软国际高级产品经理
联邦学习:原理与算法 电子书
人工智能机器学习教程书籍,平安科技联邦学习团队执笔,由浅入深介绍联邦机器学习的算法体系,注重工程实践,保证理论前沿性。