解析深度学习:语音识别实践

解析深度学习:语音识别实践

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

首次以深度学习为主线介绍语音识别应用的书籍,对你了解语音识别技术及其发展历程有重要的参考价值。

内容简介

全书首先概要介绍了传统语音识别理论和经典的深度神经网络核心算法。接着全面而深入地介绍了深度学习在语音识别中的应用,包括“深度神经网络-隐马尔可夫混合模型”的训练和优化,特征表示学习、模型融合、自适应,以及以循环神经网络为代表的若干先进深度学习技术。

本书适合有一定机器学习或语音识别基础的学生、研究者或从业者阅读,所有的算法及技术细节都提供了详尽的参考文献,给出了深度学习在语音识别中应用的全景。

作者简介

作者俞栋,1998年加入微软公司,现任微软研究院首席研究员、浙江大学兼职教授和中科大客座教授。他是语音识别和深度学习方向的资深专家,出版了两本专著,发表了150多篇论文,是近60项专利的发明人及有广泛影响力的深度学习开源软件CNTK 的发起人和主要作者之一。

他在基于深度学习的语音识别技术上的工作带来了语音识别研究方向的转变,极大地推动了语音识别领域的发展,并获得2013年IEEE信号处理协会最佳论文奖。

俞栋博士现担任IEEE语音语言处理专业委员会委员,曾担任IEEE/ACM音频、语音及语言处理汇刊、IEEE信号处理杂志等期刊的编委。

章节目录

版权信息

内容简介

作者及译者简介

译者序

前言

术语缩写

符号

1 简介

1.1 自动语音识别:更好的沟通之桥

1.2 语音识别系统的基本结构

1.3 全书结构

第一部分 传统声学模型

2 混合高斯模型

2.1 随机变量

2.2 高斯分布和混合高斯随机变量

2.3 参数估计

2.4 采用混合高斯分布对语音特征建模

3 隐马尔可夫模型及其变体

3.1 介绍

3.2 马尔可夫链

3.3 序列与模型

3.4 期望最大化算法及其在学习HMM参数中的应用

3.5 用于解码HMM状态序列的维特比算法

3.6 隐马尔可夫模型和生成语音识别模型的变体

第二部分 深度神经网络

4 深度神经网络

4.1 深度神经网络框架

4.2 使用误差反向传播来进行参数训练

4.3 实际应用

5 高级模型初始化技术

5.1 受限玻尔兹曼机

5.2 深度置信网络预训练

5.3 降噪自动编码器预训练

5.4 鉴别性预训练

5.5 混合预训练

5.6 采用丢弃法的预训练

第三部分 语音识别中的深度神经网络–隐马尔可夫混合模型

6 深度神经网络–隐马尔可夫模型混合系统

6.1 DNN-HMM混合系统

6.2 CD-DNN-HMM的关键模块及分析

6.3 基于KL距离的隐马尔可夫模型

7 训练和解码的加速

7.1 训练加速

7.2 加速解码

8 深度神经网络序列鉴别性训练

8.1 序列鉴别性训练准则

8.2 具体实现中的考量

8.3 噪声对比估计

第四部分 深度神经网络中的特征表示学习

9 深度神经网络中的特征表示学习

9.1 特征和分类器的联合学习

9.2 特征层级

9.3 使用随意输入特征的灵活性

9.4 特征的鲁棒性

9.5 对环境的鲁棒性

9.6 缺乏严重信号失真情况下的推广能力

10 深度神经网络和混合高斯模型的融合

10.1 在GMM-HMM系统中使用由DNN衍生的特征

10.2 识别结果融合技术

10.3 帧级别的声学分数融合

10.4 多流语音识别

11 深度神经网络的自适应技术

11.1 深度神经网络中的自适应问题

11.2 线性变换

11.3 线性隐层网络

11.4 保守训练

11.5 子空间方法

11.6 DNN说话人自适应的效果

第五部分 先进的深度学习模型

12 深度神经网络中的表征共享和迁移

12.1 多任务和迁移学习

12.2 多语言和跨语言语音识别

12.3 语音识别中深度神经网络的多目标学习

12.4 使用视听信息的鲁棒语音识别

13 循环神经网络及相关模型

13.1 介绍

13.2 基本循环神经网络中的状态-空间公式

13.3 沿时反向传播学习算法

13.4 一种用于学习循环神经网络的原始对偶技术

13.5 结合长短时记忆单元(LSTM)的循环神经网络

13.6 循环神经网络的对比分析

13.7 讨论

14 计算型网络

14.1 计算型网络

14.2 前向计算

14.3 模型训练

14.4 典型的计算节点

14.5 卷积神经网络

14.6 循环连接

15 总结及未来研究方向

15.1 路线图

15.2 技术前沿和未来方向

参考文献

解析深度学习:语音识别实践是2016年由电子工业出版社出版,作者[美]俞栋邓力。

得书感谢您对《解析深度学习:语音识别实践》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
JavaScript深度学习 电子书
深度学习扛鼎之作《Python深度学习》姊妹篇,前端工程师不可错过的AI入门书。
深度学习在动态媒体中的应用与实践 电子书
本书是一本深度学习的基础入门读物,对深度学习的基本理论进行了介绍,主要以Ubuntu系统为例搭建了三大主流框架——Caffe、TensorFlow、Torch,然后分别在3个框架下,通过3个实战项目掌握了框架的使用方法,并详细描述了生产流程,最后讲述了通过集群部署深度学习的项目以及如何进行运营维护的注意事项。本书适合对深度学习有浓厚兴趣的读者、希望用深度学习完成设计的计算机专业或电子信息专业的高校
PyTorch深度学习实战 电子书
1.PyTorch核心开发者教你使用PyTorch创建神经网络和深度学习系统的实用指南。2.详细讲解整个深度学习管道的关键实践,包括PyTorch张量API、用Python加载数据、监控训练以及对结果进行可视化。3.PyTorch核心知识+真实、完整的案例项目,快速提升读者动手能力:a.全面掌握PyTorch相关的API的使用方法以及系统掌握深度学习的理论和方法;b.快速从零开始构建一个真实示例:肿瘤图像分类器;c.轻松学会使用PyTorch实现各种神经网络模型来解决具体的深度学习问题;d.章尾附有“练习题”,巩固提升所学知识;更有配套的代码文件可下载并动手实现。4.PyTorch联合创作者SoumithChintala作序推荐!5.书中所有代码都是基于Python3.6及以上的版本编写的,提供源代码下载。
深度学习与围棋 电子书
深入浅出的深度学习入门书,从零实现AlphaGo,为AI理论和应用打下基础。
深度强化学习实战 电子书
详解深度强化学习,从入门到实战。