实用深度学习基础

实用深度学习基础

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

类似推荐

编辑推荐

本书全面呈现深度学习基础理论、经典方法、实用技术与最新趋势。

内容简介

本书根据深度学习技术发展速度快、理论性与实践性强、应用广泛等特点,结合教学、科研及应用需求,坚持“原理、技术、应用”三位一体原则,注重基础性、系统性、前沿性和实用性的统一,对深度学习的最新方法与研究趋势进行全面深入的研究和探索。

全书分成四部分:第一部分是人工智能基础,重点阐述人工智能的概念、发展历史和发展趋势等;第二部分是深度学习基础,包括机器学习基础理论、深度学习基础、深度学习网络的优化方法和技巧;第三部分是经典神经网络技术,包括卷积神经网络、循环神经网络、神经网络的区分性训练、序列到序列建模;第四部分是高级深度学习技术,包括自编码器、迁移学习、生成对抗网络、终身学习、深度强化学习、元学习、自监督学习等。

本书在深入浅出的讲解中将最新理论成果与实际问题解决过程相结合,培养学生的创新思维和解决复杂工程问题能力,适用于人工智能、网络安全、通信工程、信息工程等专业高年级本科生、研究生教学,可作为人工智能相关领域的科研人员、工程师的重要参考书。

作者简介

编者屈丹,信息工程大学人工智能教研室副主任、教授、博士生导师,视听感知与语言认知方向学术带头人,国家科技部、国家自然科学基金委评审专家,省部级智能语音处理领域专家组副组长。

从事人工智能与机器学习理论、语音处理与识别、自然语言理解、计算机视觉等领域教学科研工作。承担“人工智能导论”“机器学习”“深度学习”“自然语言理解”“语音处理与识别”等课程教学任务,主持国家863课题、国家自然科学基金、国家社会科学基金、省部级重点预研等科研项目20余项。获得省部级科技进步二等奖4项、三等奖1项,发表学术论文110篇,被三大检索收录60篇。申请国家发明专利、软件著作权近20项,出版专著教材6部。三次获得军队人才岗位津贴,荣立三等功2次。

章节目录

版权信息

内容简介

推荐序

前言

第1章 人工智能技术概览

1.1 人工智能的概念

1.1.1 智能的基本概念

1.1.2 人类智能的度量

1.1.3 人工智能的概念

1.2 人工智能的发展历程

1.2.1 人工智能诞生前的50年

1.2.2 人工智能发展的第一阶段

1.2.3 人工智能发展的第二阶段

1.2.4 人工智能发展的第三阶段

1.3 人工智能的学术流派

1.3.1 戴维·阿兰格里尔的学术流派划分

1.3.2 佩德罗·多明戈斯的学术流派划分

1.3.3 人工智能学术流派的重新划分

1.4 人工智能的未来发展

1.4.1 无监督学习、元学习正在突破通用智能

1.4.2 实时强化学习技术趋于成熟

1.4.3 可解释性知识推理技术成为研究重点

1.4.4 开放式持续学习技术受到广泛关注

1.4.5 不同流派人工智能技术融合认知开辟新的技术路径

1.4.6 应用场景朝小数据量、恶劣环境、非完整数据方向发展

1.5 本章小结

参考文献

第2章 机器学习理论基础

2.1 机器学习基本概念

2.1.1 学习与机器学习

2.1.2 机器学习的分类

2.1.3 感知机及其学习算法

2.2 可能近似正确学习理论

2.2.1 机器学习的不可行性

2.2.2 概率近似正确学习理论

2.3 VC维理论

2.3.1 假设的有效数量

2.3.2 突破点

2.3.3 上限函数

2.3.4 VC维

2.4 三个最基本机器学习模型

2.4.1 线性分类

2.4.2 线性回归

2.4.3 逻辑回归

2.4.4 三种基本机器学习算法对比分析

2.5 本章小结

参考文献

第3章 深度学习基础

3.1 深度学习的基本定义和特点

3.1.1 神经元与生物神经网络

3.1.2 人工神经元及其分类能力

3.1.3 单隐含层神经网络的能力

3.1.4 深度学习

3.2 深度学习网络设计的三个核心问题

3.2.1 定义网络结构

3.2.2 目标函数选择

3.2.3 优化算法选择

3.3 后向传播算法

3.3.1 输出端的损失梯度

3.3.2 隐含层的损失梯度

3.3.3 神经网络参数的损失梯度

3.3.4 算法整理流图

3.4 本章小结

参考文献

第4章 深度学习网络优化技巧

4.1 深度学习网络优化学习

4.1.1 定义网络结构

4.1.2 目标函数选择

4.1.3 优化算法选择

4.1.4 深度学习算法检查

4.2 新激活函数选择

4.2.1 梯度消失问题

4.2.2 ReLU函数

4.2.3 ReLU函数的变形

4.2.4 其他激活函数

4.3 优化算法

4.3.1 基本优化算法

4.3.2 梯度方向调整优化算法

4.3.3 自适应学习率

4.3.4 步长和方向联合优化算法

4.4 测试集性能优化技巧

4.4.1 提前终止策略

4.4.2 正则化

4.4.3 丢弃法

4.5 本章小结

参考文献

第5章 卷积神经网络

5.1 卷积神经网络概述

5.1.1 卷积神经网络的历史

5.1.2 卷积神经网络的结构

5.2 卷积神经网络与全连接网络的关系

5.2.1 连接稀疏性

5.2.2 参数共享机制

5.3 典型的卷积神经网络

5.3.1 LeNet-5网络

5.3.2 AlexNet网络

5.3.3 ZFNet网络

5.3.4 VGGNet网络

5.3.5 GoogLeNet网络

5.3.6 残差网络

5.3.7 挤压激励网络

5.3.8 区域卷积神经网络及其拓展版本

5.4 本章小结

参考文献

本章知识点补充

第6章 循环神经网络

6.1 循环神经网络的引入

6.2 循环神经网络的结构

6.3 循环神经网络的训练

6.3.1 循环神经网络的前向传播

6.3.2 循环神经网络的依时间反向传播

6.3.3 循环神经网络的梯度消失与梯度爆炸问题

6.4 长短时记忆单元与门循环单元

6.4.1 长短时记忆单元

6.4.2 门循环单元

6.5 循环神经网络的扩展

6.5.1 深层循环神经网络

6.5.2 双向循环神经网络

6.6 循环神经网络的应用

6.6.1 多到一模式

6.6.2 一到多模式

6.6.3 同步多到多模式

6.6.4 异步多到多模式

6.7 本章小结

参考文献

第7章 神经网络的区分性训练

7.1 最小交叉熵与最大似然估计

7.2 区分性训练准则

7.3 序列模型的区分性训练

7.3.1 最大互信息准则

7.3.2 增强型MMI

7.3.3 最小音素错误/状态级最小贝叶斯风险

7.3.4 序列区分性训练准则的一般形式

7.4 序列区分性训练准则应用实例

7.4.1 基于词图的序列区分性训练

7.4.2 词图无关的序列区分性训练

7.5 本章小结

参考文献

第8章 序列到序列模型

8.1 序列到序列模型基本原理

8.1.1 序列到序列模型的引入

8.1.2 序列到序列模型构成

8.2 连续时序分类准则

8.2.1 连续时序分类准则定义

8.2.2 连续时序分类准则的解码

8.3 注意力模型

8.3.1 注意力模型定义与原理

8.3.2 自注意力机制

8.4 Transformer模型

8.4.1 Transformer模型组成

8.4.2 Transformer模型的核心技术

8.5 BERT模型与GPT模型

8.5.1 BERT模型

8.5.2 GPT模型

8.5.3 与其他模型异同点分析

8.6 后BERT模型时代的新模型算法

8.6.1 XLNet模型及原理

8.6.2 ERNIE模型及原理

8.6.3 ALBERT模型及原理

8.7 序列到序列模型的应用

8.8 本章小结

参考文献

第9章 自编码器

9.1 自编码器的定义与基本原理

9.1.1 自编码器的通用框架

9.1.2 栈式自编码器

9.2 正则自编码器

9.2.1 稀疏自编码器

9.2.2 降噪自编码器

9.2.3 收缩自编码器

9.3 变分自编码器

9.3.1 目标函数

9.3.2 优化过程

9.3.3 条件变分自编码器

9.4 VAE的改进算法

9.4.1 beta-VAE

9.4.2 info-VAE

9.5 对抗自编码器

9.5.1 AAE与VAE

9.5.2 intro-VAE

9.6 本章小结

参考文献

第10章 迁移学习

10.1 迁移学习的基本原理

10.1.1 迁移学习的定义

10.1.2 迁移学习的分类

10.1.3 迁移学习的意义

10.2 基于特征的迁移学习

10.2.1 分布差异矩阵

10.2.2 特征增强

10.2.3 特征映射

10.2.4 特征选择

10.2.5 特征对齐

10.2.6 基于深度学习的特征迁移

10.3 基于模型的迁移学习

10.3.1 深度网络的可迁移性

10.3.2 基于KL散度的迁移学习

10.3.3 基于知识蒸馏的迁移学习

10.4 基于样例的迁移学习

10.5 迁移学习前沿

10.5.1 混合智能迁移学习

10.5.2 传递式迁移学习

10.5.3 终身迁移学习

10.5.4 对抗迁移学习

10.5.5 迁移强化学习

10.5.6 迁移学习的可解释性

10.6 本章小结

参考文献

第11章 终身学习

11.1 终身学习原理

11.1.1 终身学习的定义

11.1.2 DARPA的L2M项目

11.1.3 终身学习的关键问题

11.2 深度学习与终身学习

11.2.1 生物学依据

11.2.2 现有方法的分类

11.3 弹性权值巩固

11.3.1 EWC中的贝叶斯理论

11.3.2 EWC的目标函数

11.3.3 参数重要性的估计

11.4 自组织增量学习神经网络

11.4.1 自组织映射

11.4.2 自组织增量学习神经网络

11.4.3 算法优、缺点

11.5 梯度情景记忆

11.5.1 知识的前向迁移与后向迁移

11.5.2 情景记忆损失函数

11.5.3 模型求解

11.6 本章小结

参考文献

第12章 生成对抗网络

12.1 生成对抗网络引入

12.1.1 无监督学习与生成模型

12.1.2 生成对抗网络简介

12.2 生成对抗网络的基本原理

12.3 生成对抗网络训练过程的数学推导

12.3.1 最大似然估计

12.3.2 生成对抗网络的训练准则函数

12.3.3 生成对抗网络的训练过程

12.4 生成对抗网络的工程实现及主要问题

12.4.1 生成对抗网络的工程实现

12.4.2 生成对抗网络的工程实现中的问题

12.5 GAN的变体

12.5.1 WGAN

12.5.2 条件GAN

12.5.3 CycleGAN

12.5.4 InfoGAN

12.5.5 BiGAN

12.6 本章小结

参考文献

第13章 深度强化学习

13.1 强化学习基本概念与原理

13.2 强化学习的数学模型、求解框架及分类

13.2.1 马尔可夫决策过程

13.2.2 值函数与策略函数

13.2.3 策略迭代与值迭代求解框架

13.2.4 强化学习的分类

13.3 基于值函数的深度强化学习

13.3.1 深度Q网络算法

13.3.2 DQN算法的变种

13.4 基于策略函数的深度强化学习

13.5 基于参与者-评价者的深度强化学习

13.5.1 A2C与A3C算法

13.5.2 PPO算法

13.6 本章小结

参考文献

第14章 元学习

14.1 元学习的定义及原理

14.1.1 元学习的定义

14.1.2 元学习系统的组成

14.1.3 元学习的主要现状

14.2 模型无关的元学习方法

14.2.1 相关概念

14.2.2 MAML算法原理

14.2.3 MAML算法流程

14.2.4 MAML算法具体实现

14.3 一阶模型无关元学习方法Reptile

14.3.1 Reptile算法的基本原理

14.3.2 Reptile算法理论分析

14.4 自适应梯度更新规则元学习方法

14.4.1 简单LSTM方法

14.4.2 复杂LSTM方法

14.5 度量元学习方法

14.5.1 匹配网络

14.5.2 原型网络

14.5.3 关系网络

14.6 本章小结

参考文献

第15章 自监督学习

15.1 自监督学习的基本原理

15.1.1 自监督学习的定义

15.1.2 自监督学习的分类

15.2 对比式自监督学习

15.2.1 模型坍塌问题

15.2.2 有负例的对比学习

15.2.3 无负例的对比学习

15.3 基于对比预测的自监督语音表示学习

15.3.1 对比预测编码

15.3.2 wav2vec系列

15.3.3 HuBERT系列

15.4 自监督学习中的关键科学问题

15.4.1 任务相关表示学习

15.4.2 模型轻量化

15.5 本章小结

参考文献

实用深度学习基础是2022年由清华大学出版社出版,作者屈丹 主编。

得书感谢您对《实用深度学习基础》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
深度学习与围棋 电子书
深入浅出的深度学习入门书,从零实现AlphaGo,为AI理论和应用打下基础。
实用机器学习 电子书
大数据时代为机器学习的应用提供了广阔的空间,各行各业涉及数据分析的工作都需要使用机器学习算法。本书围绕实际数据分析的流程展开,着重介绍数据探索、数据预处理和常用的机器学习算法模型。本书从解决实际问题的角度出发,介绍回归算法、分类算法、推荐算法、排序算法和集成学习算法。在介绍每种机器学习算法模型时,书中不但阐述基本原理,而且讨论模型的评价与选择。为方便读者学习各种算法,本书介绍了R语言中相应的软件包
深度学习原理与实践 电子书
(1)大量图例,简单易懂。作者亲自绘制了大量插图,力求还原深度学习的算法思想,分解和剖析晦涩的算法,用图例来表示复杂的问题。生动的图例也能给读者带来阅读乐趣,快乐地学习算法知识,体会深度学习的算法本质。 (2)简化公式,生动比喻。深度学习和机器学习类的书中通常会有大量复杂冗长的算法公式,为了避免出现读者读不懂的情况,本书尽可能地统一了公式和符号,简化相关公式,并加以生动的比喻进行解析。在启发读者的同时,锻炼读者分析问题和解决问题的能力。 (3)算法原理,代码实现。在介绍深度学习及相关算法的原理时,不仅给出了对应的公式,还给出了实现和求解公式的代码,让读者明确该算法的作用、输入和输出。原理与代码相结合,使得读者对深度学习的算法实现更加具有亲切感。 (4)深入浅出,精心剖析。理解深度学习需要一定的机器学习知识,本书在D1章介绍了深度学习与机器学习的关系,并简要介绍了机器学习的内容。在内容安排上,每章依次介绍模型框架的应用场景、结构和使用方式,最后通过真实的案例去全面分析该模型结构。目的是让读者可以抓住深度学习的本质。 (5)入门实践,案例重现。每一章最后的真实案例不是直接堆砌代码,而是讲解使用该算法模型的原因和好处。从简单的背景知识出发,使用前文讲解过的深度学习知识实现一个实际的工程项目。实践可以用于及时检验读者对所学知识的掌握程度,为读者奠定深度学习的实践基础。 将一本技术书籍写得通俗易懂谈何容易,但《深度学习原理与实践》这本书确实做到了。书中对近年来火热的深度学习理论知识进行简单剖析,化繁为简,没有局限于坐而论道,而是将实例和数学理论相结合,让读者能够快速理解各种模型并上手实践,值得细读。 --唐春明 广州大学数学与信息学科学院副院长 本书从原理、方法、实践这 3 个维度系统地介绍了深度学习的方方面面,内容详实,解读清晰,细节与全貌兼顾,既适合初学者阅读,也可以作为深入研究的参考用书。 --杨刚 西安电子科技大学教授 近年来出版的深度学习相关图书中,本书是我见过非常有指导意义的中文书籍之一。本书对 ANN、CNN、RNN 等模型进行深入浅出的介绍,引入大量图例和简化后的公式,让算法浅显易懂。每一章的实践内容都给人惊喜,强烈推荐! --吴健之 腾讯音乐高级工程师 作为产品经理,我能看懂的深度学习书籍实在太少了。本书恰到好处,插图丰富直观,数学公式简练,很喜欢此类风格的图书,易懂好学。即使你不是程序员或算法专家,该书也值得一看! --张瑞 中软国际高级产品经理
深度强化学习实战 电子书
详解深度强化学习,从入门到实战。
PaddlePaddleFluid深度学习入门与实战 电子书
本书全面讲解PaddlePaddle Fluid框架在深度学习领域的应用。