AI数字人原理与实现

AI数字人原理与实现

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

带你深入数字人世界,掌握AIGC时代的创新开发之道。

内容简介

本书是一部系统介绍AI数字人技术的专业著作,涵盖了数字人的定义、发展历程、关键技术及应用实践等内容,全书共分三部分。

在技术基础部分,首先介绍了数字人的定义、发展历程、分类和应用场景,接着详细解析了数字人系统的架构设计、视觉算法和语音合成技术的原理,以及语义理解和知识表示技术如何提升数字人的智能和表现力。

在应用实践部分,带领读者深入探索数字人的创作流程,从内容策划、角色建模到交互设计,每一步都进行了详细讲解。此外,还讨论了数字人的身份认知和技术规范,为数字人的应用实践提供了必要的知识。

在展望未来部分,探讨了数字人技术的未来发展趋势,为读者描绘了数字人与人类和谐共生的美好蓝图。

作者简介

作者方进,资深软件架构师,长期深耕于前沿技术领域,曾在多家知名企业成功推动机器学习平台建设,领导模型创新工作。在自然语言处理、计算机视觉和语音合成等领域积累了丰富的算法研发经验,并对生成式AI技术及预训练语言模型进行了深入研究。

章节目录

版权信息

内容提要

赞誉

前言

资源与支持

技术基础

第1章 数字人概述

1.1 什么是数字人

1.1.1 数字人的定义

1.1.2 数字人的特征

1.2 数字人的发展历史

1.2.1 早期虚拟角色

1.2.2 人工智能与数字人的融合

1.3 数字人的分类

1.3.1 根据外观分类

1.3.2 根据用途分类

1.3.3 根据智能级别分类

1.4 数字人的应用场景

1.4.1 娱乐场景

1.4.2 教育场景

1.4.3 客服场景

1.5 数字人技术的发展趋势

1.6 数字人的社会影响

1.7 本章小结

第2章 数字人系统的架构

2.1 系统的组成模块

2.1.1 输入模块

2.1.2 内容生成模块

2.1.3 渲染模块

2.1.4 交互模块

2.2 多模态信息融合流程

2.2.1 文本生成

2.2.2 语音合成

2.2.3 表情映射

2.2.4 唇型同步

2.3 数字人云服务架构

2.3.1 云平台选型

2.3.2 模型仓库

2.3.3 多模态处理

2.3.4 在线服务

2.4 数字人的数据表示

2.4.1 文本数据表示

2.4.2 音频数据表示

2.4.3 视频数据表示

2.4.4 多模态数据表示

2.5 本章小结

第3章 数字人视觉算法

3.1 3D人脸建模

3.1.1 建模流程

3.1.2 参数调整

3.1.3 3D人脸重建技术

3.1.4 建模软件比较

3.2 表情分析

3.2.1 表情识别

3.2.2 表情生成

3.2.3 表情跟踪

3.2.4 表情融合

3.3 姿态估计

3.3.1 2D姿态估计

3.3.2 3D姿态估计

3.3.3 手势估计

3.3.4 手势生成

3.4 唇型检测和口型匹配

3.4.1 2D唇型检测

3.4.2 2D口型匹配

3.4.3 3D唇型检测

3.4.4 3D口型匹配

3.4.5 唇型同步评价

3.5 本章小结

第4章 数字人语音合成

4.1 语音数字化原理

4.1.1 音频采样

4.1.2 语音编码

4.2 基于拼接的语音合成

4.2.1 段音拼接

4.2.2 语音跨段平滑

4.3 基于深度学习的语音合成

4.3.1 LSTM在语音合成中的应用

4.3.2 基于注意力机制的Tacotron模型

4.3.3 Tacotron2与WaveNet集成

4.3.4 基于Transformer的语音合成

4.3.5 基于非自回归结构的实时语音合成

4.4 语音风格迁移

4.4.1 声纹提取

4.4.2 风格转换

4.5 个性化语音合成

4.6 语音风格增强

4.7 多语种语音合成

4.7.1 多语言模型训练

4.7.2 语言嵌入

4.7.3 语言自适应模型

4.7.4 语音后处理

4.8 本章小结

第5章 数字人语义理解

5.1 语义解析

5.1.1 词法分析

5.1.2 句法分析

5.1.3 语义分析

5.2 情感分析

5.2.1 情感识别

5.2.2 情感分类

5.3 语义编码器-解码器

5.3.1 编码器架构

5.3.2 解码器架构

5.3.3 注意力机制

5.3.4 应用场景

5.4 本章小结

第6章 数字人知识表示

6.1 知识表示基础

6.1.1 符号主义知识表示

6.1.2 连接主义知识表示

6.1.3 图数据库知识表示

6.2 预训练语言模型

6.2.1 模型架构

6.2.2 能力提升

6.2.3 功能拓展

6.3 数字人知识的应用

6.3.1 自然语言理解

6.3.2 对话系统

6.3.3 数字人人格化

6.4 本章小结

应用实践

第7章 数字人创作流程

7.1 创作流程概览

7.1.1 数字人创作的7个阶段

7.1.2 创作流程的优化策略

7.1.3 创作准备工作

7.2 数字人形象设计

7.2.1 外观设计

7.2.2 面部建模

7.2.3 动作设计

7.3 语音内容生成

7.3.1 语音素材收集与处理

7.3.2 实现语音合成

7.3.3 个性化语音风格设计

7.3.4 数字人语音生成实例

7.4 表情及动作生成

7.4.1 实现动作捕捉

7.4.2 实现表情映射

7.4.3 实现动作生成

7.4.4 数字人表情及动作生成实例

7.5 语音及视频合成

7.5.1 语音驱动的唇型动画

7.5.2 体积感渲染

7.5.3 数字人语音及视频合成实例

7.6 内容编辑和后期制作

7.6.1 视频编辑

7.6.2 后期特效制作

7.6.3 渲染与输出

7.6.4 数字人后期编辑与渲染实例

7.7 交互设计与内容运营

7.7.1 交互设计

7.7.2 内容运营策略

7.7.3 数字人交互设计与内容运营实例

7.8 本章小结

第8章 数字人身份认知

8.1 数字人的身份定位

8.1.1 个体或工具

8.1.2 数字人的角色定位

8.2 数字人的权利保障

8.2.1 知识产权

8.2.2 隐私权

8.3 数字人的成长与没落

8.3.1 持续学习

8.3.2 版本迭代

8.4 数字人的伦理问题

8.4.1 摒弃偏见和歧视

8.4.2 透明可解释性

8.4.3 尊重多样性

8.5 本章小结

第9章 数字人技术规范

9.1 数字人信息安全规范

9.1.1 数据隔离规范

9.1.2 访问控制规范

9.2 数字人内容审核规范

9.2.1 内容审核方式

9.2.2 违规处理机制

9.3 数字人应用管理规范

9.3.1 应用接入管理

9.3.2 应用监测与审计

9.4 本章小结

展望未来

第10章 人机共生

10.1 人机共生的美好时代

10.1.1 人机共生的定义与理念

10.1.2 人机共生时代的社会生态

10.2 数字人与人类的深度互动

10.2.1 互动模式的多样性

10.2.2 数字人与人类文化的交融

10.3 社区共建

10.3.1 数字人与人类社区的融合

10.3.2 共同学习的平台与机制

10.3.3 社区共建与数字人技术的创新

10.4 本章小结

AI数字人原理与实现是2024年由人民邮电出版社出版,作者方进。

得书感谢您对《AI数字人原理与实现》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
分布式对象存储——原理、架构及Go语言实现 电子书
适读人群 :本书适合从事云存储方面工作的工程师或架构师,也适合想要学习和实现分布式对象存储的读者。   赠送价值249元的云存储专家视频课程   掌握云存储理论,动手搭建分布式对象存储架构   云存储已经是大家司空见惯的一种网络服务了,比如大家常用的百度云盘、美亚S3、微软的OneDrive、苹果公司的iCloud和谷歌的Google Cloud等。云存储背后的原理是怎样的,又是如何实现的呢?   本书完全从云存储的需求出发讲述对象存储的原理,并且带领读者使用Go语言编程,循序渐进、从无到有地建立起一个分布式对象存储的架构。也就是说,本书首先介绍为什么要这么做,然后解释怎么做。   本书适合云存储方面的研究者、工程师或架构师阅读,也可以供对云存储技术感兴趣的读者参考。在读完本书之后,你将较为深入地理解对象存储服务,甚至能够实现自己的对象存储服务。   本书包括以下内容:    对象存储简介;    分布式系统原理;    元数据以及元数据服务;    数据校验和去重;    数据冗余和即时修复;    断点续传;    数据压缩;    数据维护。
Vue.js设计与实现 电子书
1.Vue.js官方团队成员霍春阳倾力打造;2.基于Vue.js3深入解析Vue.js设计细节;3.Vue.js作者尤雨溪作序推荐;4.本书提供源代码下载;5.业界大咖联袂推荐...
SpringSecurity原理与实战 电子书
本书主要介绍基于Spring Security构建系统安全性的技术体系和工程实践。
Flink原理与实践 电子书
本书围绕大数据流处理领域,介绍FlinkDataStreamAPI、时间和窗口、状态和检查点、TableAPI&SQL等知识。书中以实践为导向,使用大量真实业务场景案例来演示如何基于Flink进行流处理。
企业数据治理与SAP MDG实现 电子书
深度解析企业数据治理工程,助力企业数字化转型。