边做边学深度强化学习:PyTorch程序设计实践

边做边学深度强化学习:PyTorch程序设计实践

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

类似推荐

编辑推荐

以PyTorch为工具,在Python中实践深度强化学习。

内容简介

Pytorch是基于python且具备强大GPU加速的张量和动态神经网络,更是Python中优先的深度学习框架,它使用强大的GPU能力,提供最大的灵活性和速度。

本书指导读者以Pytorch为工具在Python中学习深层强化学习(DQN)。主要内容包括:强化学习概述及分类、强化学习的算法和实施方法、在Pytorch中实施深度规划与实现、“实施深层强化学习DQN”、理解并实施新的深层强化学习方法(Double-DQN、DuelingNetwork、PrioritizedExperienceReplay、A3C、A2C)。

作者简介

作者小川雄太郎,隶属于株式会社电通国际资讯服务技术本部开发技术部,从事深度学习的机械学习相关技术研发、技术支援,也负责工作型态创新室的HR资料剖析业务。

章节目录

版权信息

译者序

前言

第1章 强化学习概述

1.1 机器学习的分类(监督学习、非监督学习、强化学习)

1.1.1 术语整理

1.1.2 监督学习、非监督学习、强化学习

1.2 强化学习、深度强化学习的历史

1.2.1 强化学习和大脑学习

1.2.2 强化学习和深度学习的结合

1.3 深度强化学习的应用实例

1.3.1 深度强化学习的应用实例

1.3.2 深度强化学习的未来前景

参考文献

第2章 在走迷宫任务中实现强化学习

2.1 Try Jupyter的使用方法

2.1.1 强化学习的实现和执行环境

2.1.2 Try Jupyter的介绍

2.2 迷宫和智能体的实现

2.2.1 迷宫的实现

2.2.2 智能体的实现

2.3 策略迭代法的实现

2.3.1 策略迭代法与价值迭代法

2.3.2 根据策略梯度法移动智能体

2.3.3 根据策略梯度法更新策略

2.3.4 策略梯度法的相关理论

2.4 价值迭代法的术语整理

2.4.1 奖励

2.4.2 动作价值和状态价值

2.4.3 贝尔曼方程和马尔可夫决策过程

2.5 Sarsa的实现

2.5.1 用ε-贪婪法实现策略

2.5.2 使用Sarsa算法更新动作价值函数Q(s,a)

2.5.3 用Sarsa解决迷宫问题的实现

2.6 实现Q学习

2.6.1 Q学习算法

2.6.2 Q学习的实现

参考文献

第3章 在倒立摆任务中实现强化学习

3.1 在本地PC上准备强化学习的实现和执行环境

3.1.1 安装Anaconda并配置Python执行环境

3.1.2 安装强化学习所需的库

3.2 倒立摆任务“CartPole”

3.2.1 关于CartPole

3.2.2 CartPole的实现

3.3 由多变量连续值表示的状态的表格表示

3.3.1 CartPole的状态

3.3.2 状态离散化的实现

3.4 Q学习的实现

参考文献

第4章 使用PyTorch实现深度学习

4.1 神经网络和深度学习的历史

4.1.1 第一次神经网络热潮

4.1.2 第二次神经网络热潮

4.1.3 第三次神经网络热潮

4.2 深度学习的计算方法

4.2.1 推理阶段

4.2.2 学习阶段

4.3 使用PyTorch实现MNIST手写数字分类任务

4.3.1 关于PyTorch

4.3.2 准备PyTorch的执行环境

4.3.3 获取MNIST数据

4.3.4 使用PyTorch实现深度学习

4.3.5 关于如何使用PyTorch的补充

参考文献

第5章 深度强化学习DQN的实现

5.1 深度强化学习DQN(深度Q网络)的说明

5.1.1 表格表示问题

5.1.2 深度强化学习DQN的说明

5.2 实现DQN的四个要点

5.3 实现DQN(上)

5.3.1 使用PyTorch实现DQN时需要注意的事项

5.3.2 DQN的实现

5.4 实现DQN(下)

第6章 实现深度强化学习的改进版

6.1 深度强化学习算法发展图

6.2 DDQN的实现

6.2.1 DDQN概述

6.2.2 DDQN的实现

6.3 Dueling Network的实现

6.3.1 Dueling Network概述

6.3.2 Dueling Network的实现

6.4 优先经验回放的实现

6.4.1 优先经验回放概述

6.4.2 实现优先经验回放

6.5 A2C的实现

6.5.1 A2C概述

6.5.2 A2C的实现

参考文献

第7章 在AWS GPU环境中实现消砖块游戏

7.1 消砖块游戏“Breakout”的描述

7.2 准备在AWS上使用GPU所需要的深度学习执行环境

7.2.1 创建AWS账户

7.2.2 Ubuntu终端的安装

7.2.3 创建用于与虚拟服务器通信的密钥

7.2.4 在AWS上构建用于执行深度学习的虚拟服务器

7.2.5 准备Breakout的执行环境

7.3 学习Breakout的四个关键思想

7.3.1 设置本地PC的环境

7.3.2 学习Breakout的关键思想

7.4 A2C的实现(上)

7.5 A2C的实现(下)

参考文献

后记

边做边学深度强化学习:PyTorch程序设计实践是2020年由机械工业出版社华章分社出版,作者[日] 小川雄太郎。

得书感谢您对《边做边学深度强化学习:PyTorch程序设计实践》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
深度学习原理与实践 电子书
(1)大量图例,简单易懂。作者亲自绘制了大量插图,力求还原深度学习的算法思想,分解和剖析晦涩的算法,用图例来表示复杂的问题。生动的图例也能给读者带来阅读乐趣,快乐地学习算法知识,体会深度学习的算法本质。 (2)简化公式,生动比喻。深度学习和机器学习类的书中通常会有大量复杂冗长的算法公式,为了避免出现读者读不懂的情况,本书尽可能地统一了公式和符号,简化相关公式,并加以生动的比喻进行解析。在启发读者的同时,锻炼读者分析问题和解决问题的能力。 (3)算法原理,代码实现。在介绍深度学习及相关算法的原理时,不仅给出了对应的公式,还给出了实现和求解公式的代码,让读者明确该算法的作用、输入和输出。原理与代码相结合,使得读者对深度学习的算法实现更加具有亲切感。 (4)深入浅出,精心剖析。理解深度学习需要一定的机器学习知识,本书在D1章介绍了深度学习与机器学习的关系,并简要介绍了机器学习的内容。在内容安排上,每章依次介绍模型框架的应用场景、结构和使用方式,最后通过真实的案例去全面分析该模型结构。目的是让读者可以抓住深度学习的本质。 (5)入门实践,案例重现。每一章最后的真实案例不是直接堆砌代码,而是讲解使用该算法模型的原因和好处。从简单的背景知识出发,使用前文讲解过的深度学习知识实现一个实际的工程项目。实践可以用于及时检验读者对所学知识的掌握程度,为读者奠定深度学习的实践基础。 将一本技术书籍写得通俗易懂谈何容易,但《深度学习原理与实践》这本书确实做到了。书中对近年来火热的深度学习理论知识进行简单剖析,化繁为简,没有局限于坐而论道,而是将实例和数学理论相结合,让读者能够快速理解各种模型并上手实践,值得细读。 --唐春明 广州大学数学与信息学科学院副院长 本书从原理、方法、实践这 3 个维度系统地介绍了深度学习的方方面面,内容详实,解读清晰,细节与全貌兼顾,既适合初学者阅读,也可以作为深入研究的参考用书。 --杨刚 西安电子科技大学教授 近年来出版的深度学习相关图书中,本书是我见过非常有指导意义的中文书籍之一。本书对 ANN、CNN、RNN 等模型进行深入浅出的介绍,引入大量图例和简化后的公式,让算法浅显易懂。每一章的实践内容都给人惊喜,强烈推荐! --吴健之 腾讯音乐高级工程师 作为产品经理,我能看懂的深度学习书籍实在太少了。本书恰到好处,插图丰富直观,数学公式简练,很喜欢此类风格的图书,易懂好学。即使你不是程序员或算法专家,该书也值得一看! --张瑞 中软国际高级产品经理
边做边学——Photoshop+CorelDRAW综合实训教程 电子书
Photoshop和CorelDRAW均是当今流行的图像处理和矢量图形设计软件,被广泛应用于平面设计、包装装潢、彩色出版等诸多领域。本书根据中职学校教师和学生的实际需求,以平面设计的典型应用为主线,通过多个精彩实用的案例,全面细致地讲解如何利用Photoshop和CorelDRAW完成专业的平面设计项目,使学生能够在掌握软件功能和制作技巧的基础上,启发设计灵感,开拓设计思路,提高设计能力。本书配套
边做边学——CorelDRAW X6图形设计案例教程 电子书
本书内容的介绍均以课堂实训案例为主线,通过案例的操作,学生可以快速熟悉案例设计理念。书中的软件相关功能解析部分使学生能够深入学习软件功能;课堂实战演练和课后综合演练,可以拓展学生的实际应用能力。在本书的**后一章,精心安排了专业设计公司的多个综合设计实训,力求通过这些案例的制作,使学生提高艺术设计创新能力。本书配套光盘中包含了书中所有案例的素材及效果文件,以利于教师授课,学生练习。
深度学习原理与 TensorFlow实践 电子书
本书介绍了深度学习原理与TensorFlow实践。着重讲述了当前学术界和工业界的深度学习核心知识:机器学习概论、神经网络、深度学习。着重讲述了深度学习的实现以及深度学习框架TensorFlow:Python编程基础、TensorFlow编程基础、TensorFlow模型、TensorFlow编程实践、TensorFlowLite和TensorFlow.js、TensorFlow案例--医学应用和S
深度学习入门与TensorFlow实践 电子书
基于TensorFlow2,系统讲述如何搭建、训练和应用深度学习模型。