深度学习模型及应用详解

深度学习模型及应用详解

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

微软搜索广告部五位业内资深应用科学家实战经验分享,全方位详细解读深度学习模型在互联网搜索、广告、对话机器人、电商等领域的应用实现。

内容简介

本书作者都是微软人工智能及研究院的研究人员和应用科学家,具有深厚的机器学习背景,在一线针对产品需求和支持的场景进行了大量的深度学习模型及算法的研究和开发,在模型设计、训练、评估、部署、推理优化等模型开发全生命周期积累了丰富的经验。 本书面向的读者是希望学习和运用深度学习模型到具体应用场景的企业工程师、科研院所的学生和科研人员。读者学习本书的目的是了解深度学习模型和算法基础后,重点应用和实践并快速部署在自己的工作领域,同时取得落地成果。

本书分为4个部分,共13章。其中第1部分(第1~2章)简要介绍了深度学习的现状、概念和实现工具。第2部分(第3~5章)以具体的实际应用展示基于深度学习技术进行工程实践和开发的流程和技巧。第3部分(第6~12章)介绍了学术界和工业界最新的高阶深度学习模型的实现和应用。第4部分(第13章)介绍了深度学习领域的一些前沿研究方向并对深度学习的未来发展进行展望。

本书作者都是微软人工智能及研究院的研究人员和应用科学家,具有深厚的机器学习背景,在一线针对产品需求和支持的场景进行了大量的深度学习模型及算法的研究和开发,在模型设计、训练、评估、部署、推理优化等模型开发全生命周期积累了丰富的经验。

作者简介

作者张若非,美国纽约州立大学计算机科学博士。微软(美国)人工智能与研究院高级研究总监,全球合伙人,负责微软在线广告平台机器学习模型、算法及系统的研究和建设。研究领域包括机器学习、数据挖掘、自然语言处理、计算机视觉和多媒体信息检索。在这些领域的一流学术期刊和顶级学术会议发表论文50余篇,获得美国发明专利12项。美国国家自然科学基金会(NSF)智能系统评审委员会委员,IEEE和ACM高级会员。

章节目录

版权信息

序言

前言

人工智能热潮

机器学习发展路径

本书的初衷

本书内容定位

本书学习建议

第1章 神经网络发展史

1.1 神经网络的早期雏形

1.1.1 联结主义和Hebb学习规则

1.1.2 Oja学习规则及主分量分析

1.1.3 早期的神经元模型

1.2 现代神经网络

1.2.1 反向传播算法

1.2.2 神经网络的通用函数近似性

1.2.3 深度的必要性

1.3 深度学习发展历史中的重要神经网络

1.3.1 深度神经网络的兴起

1.3.2 自组织特征映射

1.3.3 霍普菲尔德神经网络

1.3.4 玻尔兹曼机及受限玻尔兹曼机

1.3.5 深度信念网

1.3.6 其他深度神经网络

1.4 本章小结

参考文献

第2章 深度学习开源框架

2.1 主流的深度学习开源框架

【知识点讲解】:编程模式与计算图

Theano

TensorFlow

【知识点讲解】分布式架构

PyTorch

MXNet

CNTK

闲话ONNX

2.2 简单神经网络模型在不同框架上的实现对比

TensorFlow

Keras

PyTorch

MXNet-Gluon

CNTK

2.3 本章小结

参考文献

第3章 多层感知机在自然语言处理方面的应用

3.1 词和文本模型的发展历程

3.2 Word2Vec模型:基于上下文的分布式表达

3.2.1 Skip-Gram算法的训练流程

3.2.2 Skip-Gram算法的网络结构

1.输入层

2.编码映射层

3.解码映射层

3.2.3 代价函数

3.3 应用TensorFlow实现Word2Vec模型

3.3.1 定义计算图:训练语料库预处理

3.3.2 模型计算图的实现

3.4 Word2Vec模型的局限及改进

3.5 本章小结

参考文献

第4章 卷积神经网络在图像分类中的应用

4.1 图像识别和图像分类的发展

4.2 AlexNet

4.2.1 网络模型结构

1.输入层

2.卷积层及池化层

4.2.2 AlexNet的具体改进

1.使用ReLU作为非线性激活函数

2.采用多GPU进行并行训练

3.局部响应归一化

4.使用存在重叠的池化感知域

5.Dropout

4.2.3 代价函数

4.3 应用TensorFlow实现AlexNet

4.3.1 读取训练图像集

4.3.2 模型计算图的实现

4.4 本章小结

参考文献

第5章 递归神经网络

5.1 递归神经网络应用背景介绍

5.2 递归神经网络模型介绍

5.2.1 递归神经网络模型结构

5.2.2 双向递归神经网络

5.2.3 长短期记忆模型

5.3 递归神经网络展望

5.4 本章小结

参考文献

第6章 DeepIntent模型在信息检索领域的应用

6.1 信息检索在搜索广告中的应用发展

6.2 含有注意力机制的RNN模型

6.2.1 网络模型结构

1.输入层

2.词嵌入层

3.RNN

4.基于注意力机制的pooling

6.2.2 代价函数

6.3 应用TensorFlow实现DeepIntent模型

6.3.1 定义计算图

1.输入层的实现

2.词嵌入层的实现

3.RNN的实现

4.基于注意力机制的池化层的实现

6.3.2 定义代价函数及优化算法

6.3.3 执行计算图进行训练

6.4 本章小结

参考文献

第7章 图像识别及在广告搜索方面的应用

7.1 视觉搜索

7.2 方法和系统

7.2.1 图像DNN编码器

7.2.2 利用Rich-CDSSM降低维度

7.2.3 快速最近邻搜索系统

7.2.4 精密层

7.2.5 端到端服务系统

7.3 评测

7.4 用于演示的Visual Shopping Assistant应用程序

7.5 相关工作

7.6 本章小结

第8章 Seq2Seq模型在聊天机器人中的应用

8.1 Seq2Seq模型应用背景

8.2 Seq2Seq模型的应用方法

8.3 含有注意力机制的多层Seq2Seq模型

8.3.1 词嵌入层

8.3.2 可变深度LSTM递归层

8.3.3 注意力机制层

8.3.4 投影层

8.3.5 损失函数(loss function)和端到端训练

【知识点讲解】注意力机制

【知识点讲解】概率估计

8.4 信息导向的自适应序列采样

8.5 多轮项目推荐

8.6 熵作为信心的度量

8.6.1 直观的定义和讨论

8.6.2 序列后验估计的不确定性

8.6.3 信息导向的抽样:最大化预期信息增益的原则

8.6.4 Seq2Seq模型的3个应用程序

8.6.5 应用程序1:查询理解和重写

1.What and How(什么和如何):问题理解

2.训练和数据

3.模型细节

4.结果和评估

5.重写质量

6.产品推荐的质量

7.讨论

8.6.6 应用程序2:相关性评分

1.训练和数据

2.模型细节

3.评估

4.讨论

8.6.7 应用程序3:聊天机器人

1.对话流和系统行为

2.问题制定

3.实施和定性反馈

8.7 本章小结

参考文献

第9章 word2vec的改进:fastText模型

9.1 fastText模型的原理

9.1.1 回顾Skip-Gram算法

9.1.2 subword模型

9.1.3 subword形态

9.1.4 分层softmax

9.1.5 fastText的模型架构

9.1.6 fastText算法实现

9.2 应用场景:搜索广告中的查询词关键词匹配问题

9.3 本章小结

参考文献

第10章 生成对抗网络

10.1 生成对抗网络的原理

10.1.1 GAN的基本模型

10.1.2 GAN优化目标的原理

10.1.3 GAN的训练

10.1.4 GAN的扩展模型

DCGAN

InfoGAN

CGAN

SeqGAN

10.2 应用场景:搜索广告中由查询词直接生成关键词

10.2.1 生成模型的构建

10.2.2 判别模型的构建

10.2.3 条件生成对抗网络的构建

10.3 本章小结

参考文献

第11章 深度强化学习

11.1 深度强化学习的原理

11.1.1 强化学习的基本概念

11.1.2 马尔可夫决策过程

11.1.3 价值函数和贝尔曼方程

11.1.4 策略迭代和值迭代

1.策略迭代(policy iteration)

2.值迭代(value iteration)

11.1.5 Q-Learning

11.1.6 深度Q网络

11.1.7 策略梯度

11.1.8 动作评价网络

11.2 应用场景:基于深度强化学习的推荐系统

11.3 本章小结

参考文献

第12章 工程实践和线上优化

12.1 Seq2Seq模型介绍

12.2 LSTM优化分析

12.2.1 优化一:指数运算的近似展开

12.2.2 优化二:矩阵运算的执行速度优化

知识点一:MKL与数据缓存

知识点二:MKL与矢量化

12.2.3 优化三:多线程并行处理

1.多线程处理多个数据样本

2.多线程处理矩阵运算

12.3 优化应用实例:RapidScorer算法对GBDT的加速

12.3.1 背景介绍

12.3.2 RapidScorer数据结构设计

1.优化“与”运算操作

2.等效节点合并

12.3.3 RapidScorer矢量化

12.3.4 RapidScorer实验结果

12.4 本章小结

参考文献

第13章 深度学习的下一个浪潮

13.1 深度学习的探索方向展望

13.1.1 设计更好的生成模型

13.1.2 深度强化学习的发展

13.1.3 半监督学习与深度学习

13.1.4 深度学习自身的学习

13.1.5 迁移学习与深度学习的结合

13.1.6 用于推理的深度学习

13.1.7 深度学习工具的标准化

13.2 深度学习的应用场景展望

13.2.1 医疗健康领域

1.疾病诊断

2.病患状态分析

3.病情咨询

4.药物研发

5.精准医疗

13.2.2 安全隐私领域

1.智能安防系统

2.智能行为分析系统

13.2.3 城市治理领域

1.智能交通控制

2.环境指标预测

3.人员密度预测

13.2.4 艺术创作领域

13.2.5 金融保险领域

1.收益预测

2.投资组合构建

3.风险管理

4.产品推荐

13.2.6 无人服务领域

1.无人车

2.无人店

3.机器人

13.3 本章小结

参考文献

深度学习模型及应用详解是2019年由电子工业出版社出版,作者付强。

得书感谢您对《深度学习模型及应用详解》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
OptiStruct及HyperStudy优化与工程应用 电子书
《OptiStruct及HyperStudy优化与工程应用》是在2019版HyperWorks软件基础上编写的OptiStruct和HyperStudy优化教程。全书首先深入讲解了拓扑优化、自由尺寸优化、形貌优化、尺寸优化、形状优化、自由形状优化、增材制造优化、复合材料优化,以及等效静态载荷法、热、疲劳及非线性优化等OptiStruct优化技术,然后详细介绍了HyperStudy相关的各种优化技术
深度学习训练营21天实战TensorFlow+Keras+scikit-learn 电子书
21天实战,21个典型的人工智能应用场景。
车联网权威指南:标准、技术及应用 电子书
一本全面且宝贵的车联网技术指南。
实用运筹学:案例、方法及应用 电子书
本书共有8章,其中包括线性规划与单纯形法、对偶理论与灵敏度分析、运输问题、整数规划、动态规划、图与网络分析、存储论和排队论。每章都有学习目标、开篇案例、本章小结和课后思考题,有助于引导读者学习和帮助读者加强记忆。读者将能掌握运筹学不同分支对应的问题特征和相应的模型,典型运筹学模型的建模思路和解决方法;能够对实际的管理问题进行抽象和建模,并运用恰当的方法求解。
心导管检查临床应用及操作规范 电子书
详细介绍左、右心导管检查适应证和禁忌证、术前准备内容、操作要点及注意事项、相关并发症的识别与防治等内容。