语音优先:智能语音技术驱动的交互界面设计与语音机器人设计

语音优先:智能语音技术驱动的交互界面设计与语音机器人设计

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

全球语音领域专家重磅作品。

内容简介

本书涵盖了语音应用程序的各个方面,不仅深入浅出地讨论了对话技术和智能语音交互设计的细节,还谈到了产品的整体愿景和参与设计过程的人,充满了有用的技巧和实践,是一本语音用户界面(VUI)设计指南和实战手册。

本书首先介绍有关语音、音频和对话式语音建模的基本概念,然后针对具体挑战提供详细建议,最后提供了概念工具和实践工具,帮助设计师有效地剖析设计策略,并进一步强化思维方式。

虽然本书面向的是专注于语音界面的对话设计师,但从事产品、研究和开发工作的人也能从本书中获益。

作者简介

作者艾哈迈德·布齐德,Witlingo(该公司致力于构建语音产品和解决方案)的创始人兼首席执行官。

在加入Witlingo之前,布齐德博士曾担任亚马逊Alexa智能家居产品负责人和Genesys的产品创新副总裁。他还是Open Voice Network的推广大使,负责其社交音频社区。他在语音识别和自然语言处理领域拥有12项专利,被Speech Technology Magazine评为语音领域的杰出人物。

章节目录

版权信息

O'Reilly Media, Inc. 介绍

本书赞誉

译者序

前言

引言

第1章 为什么语音优先

1.1 解放双眼

1.2 解放双手

1.3 转瞬即逝

1.4 富有内涵

1.5 被动性

1.6 最小工作量

1.7 广播性

1.8 无须读写

第2章 什么时候语音优先

2.1 环境

2.2 内容

2.3 用户状态

2.3.1 身体状态

2.3.2 语言能力

2.3.3 有效时间

2.3.4 交流意愿

2.4 渠道

2.5 一些应用场景

2.5.1 场景1

2.5.2 场景2

2.5.3 场景3

第3章 为什么实现语音优先的自动化

3.1 降低成本

3.2 高峰处理

3.3 提高客户满意度

3.4 提高人工代理满意度

3.5 增加收入

3.6 实现个性化

3.7 促进任务完成

3.8 保护隐私

3.9 提高安全性

第4章 VUI的三大核心特征

4.1 时间线性

4.2 单向性

4.3 不可见性

第5章 对话的要素

5.1 对话本体

5.1.1 参与者

5.1.2 陈述

5.1.3 轮次

5.1.4 对话

5.2 对话动作

5.3 对话状态

5.4 内部对话上下文

5.5 对话信号

5.5.1 状态信号

5.5.2 转换信号

第6章 对话的规则

6.1 合作原则

6.2 质量准则

6.3 数量准则

6.4 关联准则

6.5 行为准则

第7章 基本宗旨

7.1 语音机器人不是人类

7.2 语音机器人应该和它所拥有的数据一样聪明

7.3 语音机器人应该保持一致

7.4 语音机器人应该是透明的

7.5 语音机器人应该尊重用户

第8章 对话外的上下文

8.1 用户状态

8.1.1 情绪状态

8.1.2 语言能力

8.1.3 用户熟悉程度

8.1.4 技术理解程度

8.1.5 条件准备就绪

8.1.6 任务相关的属性

8.2 物理环境

8.3 社交环境

8.4 近期上下文

8.5 用户模式

8.6 用户基础模式

第9章 界面与用例的匹配

9.1 一个说明性用例

9.2 基本的启发式方法

第10章 起步的要素

10.1 简明扼要

10.2 使用音频图标

10.3 放弃“欢迎来到……”的说法

10.4 永远不要说“请仔细听,因为我们的选项已经发生改变”

10.5 让语音机器人以第一人称称呼自己

10.6 放弃“你可以随时打断我”

10.7 记住起源上下文

10.8 记住用户的偏好

10.9 预测用户的具体要求

10.10 预测一般用户群体的要求

第11章 提示的要素

11.1 提示类型

11.2 编写有效的提示

11.2.1 使用口语化语言

11.2.2 用户会模仿语音机器人

11.2.3 除非对用户场景至关重要,否则不要使用俚语或行话

11.2.4 把最重要的信息放在前面

11.2.5 用“想要”代替“希望”

11.2.6 避免使用“说出”

11.2.7 简化语言

11.2.8 保持措辞一致

11.2.9 避免混合使用录音和TTS语音

11.2.10 可以以介词结束一句话

11.2.11 避免使用第三人称

11.2.12 尽量减少使用“请”

11.2.13 在与专家用户打交道时使用增量提示

11.2.14 使用逐渐减少的提示来避免冗长的重复

11.2.15 仅在必要时请求显式确认

第12章 选项菜单

12.1 先展示最常用的项目

12.2 将菜单选项保持在三个或更少

12.3 将菜单的深度保持在三层或更少

12.4 避免提供相似的选项列表让客户从中选择

12.5 不要使用“请从以下选项中选择”

12.6 菜单选项的词性、短语要一致

12.7 允许用户提问“我有哪些选择?”

12.8 允许用户返回上级菜单

12.9 停顿3s后重复菜单选项

12.10 允许资深用户“打断”语音提示

12.11 使用快捷方式

第13章 管理异常

13.1 错误类型

13.1.1 缺少输入

13.1.2 匹配失败

13.1.3 错误识别

13.1.4 系统故障

13.2 失败的原因

13.2.1 缺少输入

13.2.2 匹配失败

13.2.3 错误识别

13.2.4 系统故障

13.3 最佳实践

13.3.1 让语音机器人承担责任

13.3.2 给用户三次机会

13.3.3 提供如何回应的明确示例

13.3.4 小心使用重复提示

13.3.5 建立“安全点”

13.3.6 不要单方面终止对话——特别是在恢复期间

13.3.7 恢复期间不要重复

13.3.8 让用户了解自己所处的位置

13.3.9 向用户提供问题的相关信息

13.3.10 不要过分道歉

第14章 帮助策略

14.1 告知用户可以获取帮助

14.2 检测用户何时需要帮助

14.3 构建你的帮助

14.3.1 提及语音机器人所要解决的基本任务

14.3.2 首先对最常见问题提供帮助

14.4 提供帮助后从离开的地方返回

14.5 帮助要简明扼要

14.6 使用上下文来指导你的解释

14.7 用例子来阐述你的解释

14.8 只在需要的时候提供帮助

第15章 对话标记

15.1 确认信息的接收

15.2 宣布用户即将收到一些信息

15.3 标记序列

15.4 标记对话区块的开始和结束

15.5 标记错误

15.6 显示隧道尽头的光明

15.7 暗示语音机器人仍然掌握着对话轮次的所有权

15.8 明确告诉用户他们正在等待

15.9 不要连续两次重复相同的标记

15.10 注意失败策略后的标记

第16章 非语言对话标记

16.1 非语言音频的类型

16.2 开始对话

16.3 提醒用户应答

16.4 语音机器人正忙着处理某事,且仍保留着对话轮次所有权

16.5 等待用户做出答复

16.6 在没有输入之后

16.7 告知选项清单

16.8 进入一个新的主题

16.9 选项列表中上一项到下一项的过渡标记

16.10 告知帮助

16.11 结束对话

第17章 语言设计

17.1 关于“自然性”

17.2 关键术语

17.3 设计一个有效的语言模型

17.4 清楚地描述语音机器人可以帮助用户解决什么问题

17.5 通过其他方式告知语音机器人存在的原因,以及它能帮助用户做什么

17.6 花时间构建一个干净的本体

17.7 不要坐在椅子上设计语言模型

17.8 从语言错误中恢复时要明确说明

第18章 利用停顿

18.1 用在列出选项之前

18.2 用在菜单列表中的选项之间

18.3 用在选项类别之间

18.4 当与高级用户交互时

18.5 用在语音机器人回应之后

18.6 用在TTS提示和人工录音切换时

第19章 结束的要素

19.1 允许用户明确地结束对话

19.2 允许用户直接请求人工座席

19.3 当用户需要等待时提供一个预估的等待时间

19.4 提供取消转人工座席的选项

19.5 让“用户等候”的音频与用户相关

19.6 播放“用户等候”音频时要了解用户的心态

19.7 永远不要说“您的请求对我们来说很重要”

19.8 不要让用户对人工座席再重复一遍对语音机器人说过的内容

19.9 让人工座席意识到用户已经和语音机器人沟通过了

19.10 避免将用户从一个语音机器人转到另一个语音机器人

19.11 除非要将用户直接转到人工座席,否则不要播放电话铃声

19.12 对于用户的成功操作给予确认

19.13 不要在对话结束时提供重要信息

19.14 给用户一个快捷方式

19.15 给用户提供稍后联系的选项

第20章 语音优先的通知

20.1 基本考量

20.2 通知中的关键属性

20.2.1 通知的紧急程度

20.2.2 通知的内容

20.2.3 交付的场景

20.3 关键的媒介形态因素

20.3.1 远场语音

20.3.2 近场语音

20.3.3 耳机中的语音

20.4 一些最佳实践

20.4.1 留意接收者的时区

20.4.2 提供一些上下文

20.4.3 直奔主题

20.4.4 重复重要的信息

20.4.5 为用户提供获取更多详细信息的方法

20.5 一些应用场景

20.5.1 场景1

20.5.2 场景2

20.5.3 场景3

第21章 奠定基础

21.1 召集所有关键角色

21.2 定义商业目标

21.3 定义用户的需求和意图

21.3.1 识别用户任务

21.3.2 识别使用模式

21.4 定义语音机器人的语体风格

第22章 发布成功产品的关键

22.1 用完整的句子写出所有的东西

22.2 新闻稿需要清晰明了

22.3 答案最多只能有一两段内容

22.4 先回答基本问题

22.5 清楚地描述已完成的研究

22.6 在主张和声明中要谦虚谨慎

22.7 让每个人都能读懂你的文档

22.8 根据用户可以做的事情列出功能需求

22.9 详细描述预期的最小可行性产品

第23章 部署的要素

23.1 产品管理

23.2 产品营销

23.3 用户体验研究人员

23.4 用户体验设计师

23.5 开发人员

23.6 质量工程师

23.6.1 功能测试

23.6.2 遍历测试

23.6.3 压力测试

23.6.4 Beta测试

23.7 项目管理

第24章 发布后的监测

24.1 信息来源

24.1.1 交互日志

24.1.2 交互的音频

24.1.3 终端用户

24.2 基本问题

24.2.1 用户在哪里放弃会话

24.2.2 用户在哪里要求转接到人工代理

24.2.3 用户在哪里说错话了

24.2.4 用户在哪里什么都不说了

24.2.5 哪些地方用户说话太早

24.2.6 用户环境的噪声水平是多少

24.2.7 用户需要什么样的选择

24.2.8 用户对语音机器人的感觉如何

第25章 语音优先服务的成功指标要素

25.1 放弃率

25.2 自动化率

25.3 每个会话的平均故障次数

25.4 每个任务的平均故障次数

25.5 平均任务完成时间

25.6 遏制率

25.7 首次使用解决率

25.8 任务完成率

25.9 任务启动率

25.10 接入时间

第26章 结束语

附录A 语音优先产品失败的10个原因

附录B 演示语音优先的产品

附录C 有用的指标矩阵

术语表

参考文献

语音优先:智能语音技术驱动的交互界面设计与语音机器人设计是2023年由机械工业出版社出版,作者[美] 艾哈迈德·布齐德。

得书感谢您对《语音优先:智能语音技术驱动的交互界面设计与语音机器人设计》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
湖南洞绥片赣方言语音调查研究 电子书
本书对湖南洞绥片赣方言语音进行了比较全面的调查研究,重点调查了隆回、洞口、绥宁三县22个方言点,对这些方言点的语音特征进行了分析,对洞绥片赣方言语音特征的分布情况、内部差异进行了揭示,并对洞绥片赣方言与江西赣方言的语音特征进行了初步比较。
汉藏语音韵对应研究:以杨福绵汉藏音韵研究成果为例 电子书
本书是通过汇编杨福绵的汉藏语同源词进行汉藏语比较研究的一部著作。本书以学者论著为研究对象,对其汉藏语比较研究的成果进行梳理,将学者们提出的汉藏语同源词进行全面系统的总结,力图概括规律或提出问题与意见。本书主要通过对杨福绵的关于汉藏语同源词的重要论文进行翻译整理归类,把其中出现的兼具汉语和藏语同源词的词项归纳为杨福绵汉藏语同源词表,对杨福绵汉藏语同源词在音韵上的对应体系和规律进行系统总结,以期为古汉
汽车智能交互内外饰设计 电子书
本书从汽车行业的时代机遇、底层通用技术、智能交互技术和未来发展展望四个维度,介绍汽车内外饰系统在数字化转型趋势下的前沿技术。
Arduino 智能机器人设计与制作 电子书
本书以中国教育学会发布的《中小学机器人课程指导纲要》为指导,以培养中小学生设计思维、计算思维、创新思维、实践动手能力为目标,在深入分析儿童机器人教育需求与认知特点的基础上,通过16个儿童机器人教学项目案例,对智能机器人结构搭建、电路连接、工作原理、编程控制及创新设计等进行详细阐述。全书共包含17课内容,第0课为引导部分,主要介绍机器人的概况、制作机器人的硬件平台及软件工具等,其余16课分为“创意生
以人为本的智能汽车交互设计(HMI) 电子书
本书全面、完整地阐述了汽车人机交互设计的方法和要点。