语音优先：智能语音技术驱动的交互界面设计与语音机器人设计

[美] 艾哈迈德·布齐德

查阅电子书

手机扫码

微信扫一扫

关注微信公众号

因版权原因待上架

类似推荐

编辑推荐

全球语音领域专家重磅作品。

内容简介

本书涵盖了语音应用程序的各个方面，不仅深入浅出地讨论了对话技术和智能语音交互设计的细节，还谈到了产品的整体愿景和参与设计过程的人，充满了有用的技巧和实践，是一本语音用户界面（VUI）设计指南和实战手册。

本书首先介绍有关语音、音频和对话式语音建模的基本概念，然后针对具体挑战提供详细建议，最后提供了概念工具和实践工具，帮助设计师有效地剖析设计策略，并进一步强化思维方式。

虽然本书面向的是专注于语音界面的对话设计师，但从事产品、研究和开发工作的人也能从本书中获益。

作者简介

作者艾哈迈德·布齐德，Witlingo（该公司致力于构建语音产品和解决方案）的创始人兼首席执行官。

在加入Witlingo之前，布齐德博士曾担任亚马逊Alexa智能家居产品负责人和Genesys的产品创新副总裁。他还是Open Voice Network的推广大使，负责其社交音频社区。他在语音识别和自然语言处理领域拥有12项专利，被Speech Technology Magazine评为语音领域的杰出人物。

章节目录

版权信息

O'Reilly Media, Inc. 介绍

本书赞誉

译者序

前言

引言

第1章为什么语音优先

1.1 解放双眼

1.2 解放双手

1.3 转瞬即逝

1.4 富有内涵

1.5 被动性

1.6 最小工作量

1.7 广播性

1.8 无须读写

第2章什么时候语音优先

2.1 环境

2.2 内容

2.3 用户状态

2.3.1 身体状态

2.3.2 语言能力

2.3.3 有效时间

2.3.4 交流意愿

2.4 渠道

2.5 一些应用场景

2.5.1 场景1

2.5.2 场景2

2.5.3 场景3

第3章为什么实现语音优先的自动化

3.1 降低成本

3.2 高峰处理

3.3 提高客户满意度

3.4 提高人工代理满意度

3.5 增加收入

3.6 实现个性化

3.7 促进任务完成

3.8 保护隐私

3.9 提高安全性

第4章 VUI的三大核心特征

4.1 时间线性

4.2 单向性

4.3 不可见性

第5章对话的要素

5.1 对话本体

5.1.1 参与者

5.1.2 陈述

5.1.3 轮次

5.1.4 对话

5.2 对话动作

5.3 对话状态

5.4 内部对话上下文

5.5 对话信号

5.5.1 状态信号

5.5.2 转换信号

第6章对话的规则

6.1 合作原则

6.2 质量准则

6.3 数量准则

6.4 关联准则

6.5 行为准则

第7章基本宗旨

7.1 语音机器人不是人类

7.2 语音机器人应该和它所拥有的数据一样聪明

7.3 语音机器人应该保持一致

7.4 语音机器人应该是透明的

7.5 语音机器人应该尊重用户

第8章对话外的上下文

8.1 用户状态

8.1.1 情绪状态

8.1.2 语言能力

8.1.3 用户熟悉程度

8.1.4 技术理解程度

8.1.5 条件准备就绪

8.1.6 任务相关的属性

8.2 物理环境

8.3 社交环境

8.4 近期上下文

8.5 用户模式

8.6 用户基础模式

第9章界面与用例的匹配

9.1 一个说明性用例

9.2 基本的启发式方法

第10章起步的要素

10.1 简明扼要

10.2 使用音频图标

10.3 放弃“欢迎来到……”的说法

10.4 永远不要说“请仔细听，因为我们的选项已经发生改变”

10.5 让语音机器人以第一人称称呼自己

10.6 放弃“你可以随时打断我”

10.7 记住起源上下文

10.8 记住用户的偏好

10.9 预测用户的具体要求

10.10 预测一般用户群体的要求

第11章提示的要素

11.1 提示类型

11.2 编写有效的提示

11.2.1 使用口语化语言

11.2.2 用户会模仿语音机器人

11.2.3 除非对用户场景至关重要，否则不要使用俚语或行话

11.2.4 把最重要的信息放在前面

11.2.5 用“想要”代替“希望”

11.2.6 避免使用“说出”

11.2.7 简化语言

11.2.8 保持措辞一致

11.2.9 避免混合使用录音和TTS语音

11.2.10 可以以介词结束一句话

11.2.11 避免使用第三人称

11.2.12 尽量减少使用“请”

11.2.13 在与专家用户打交道时使用增量提示

11.2.14 使用逐渐减少的提示来避免冗长的重复

11.2.15 仅在必要时请求显式确认

第12章选项菜单

12.1 先展示最常用的项目

12.2 将菜单选项保持在三个或更少

12.3 将菜单的深度保持在三层或更少

12.4 避免提供相似的选项列表让客户从中选择

12.5 不要使用“请从以下选项中选择”

12.6 菜单选项的词性、短语要一致

12.7 允许用户提问“我有哪些选择？”

12.8 允许用户返回上级菜单

12.9 停顿3s后重复菜单选项

12.10 允许资深用户“打断”语音提示

12.11 使用快捷方式

第13章管理异常

13.1 错误类型

13.1.1 缺少输入

13.1.2 匹配失败

13.1.3 错误识别

13.1.4 系统故障

13.2 失败的原因

13.2.1 缺少输入

13.2.2 匹配失败

13.2.3 错误识别

13.2.4 系统故障

13.3 最佳实践

13.3.1 让语音机器人承担责任

13.3.2 给用户三次机会

13.3.3 提供如何回应的明确示例

13.3.4 小心使用重复提示

13.3.5 建立“安全点”

13.3.6 不要单方面终止对话——特别是在恢复期间

13.3.7 恢复期间不要重复

13.3.8 让用户了解自己所处的位置

13.3.9 向用户提供问题的相关信息

13.3.10 不要过分道歉

第14章帮助策略

14.1 告知用户可以获取帮助

14.2 检测用户何时需要帮助

14.3 构建你的帮助

14.3.1 提及语音机器人所要解决的基本任务

14.3.2 首先对最常见问题提供帮助

14.4 提供帮助后从离开的地方返回

14.5 帮助要简明扼要

14.6 使用上下文来指导你的解释

14.7 用例子来阐述你的解释

14.8 只在需要的时候提供帮助

第15章对话标记

15.1 确认信息的接收

15.2 宣布用户即将收到一些信息

15.3 标记序列

15.4 标记对话区块的开始和结束

15.5 标记错误

15.6 显示隧道尽头的光明

15.7 暗示语音机器人仍然掌握着对话轮次的所有权

15.8 明确告诉用户他们正在等待

15.9 不要连续两次重复相同的标记

15.10 注意失败策略后的标记

第16章非语言对话标记

16.1 非语言音频的类型

16.2 开始对话

16.3 提醒用户应答

16.4 语音机器人正忙着处理某事，且仍保留着对话轮次所有权

16.5 等待用户做出答复

16.6 在没有输入之后

16.7 告知选项清单

16.8 进入一个新的主题

16.9 选项列表中上一项到下一项的过渡标记

16.10 告知帮助

16.11 结束对话

第17章语言设计

17.1 关于“自然性”

17.2 关键术语

17.3 设计一个有效的语言模型

17.4 清楚地描述语音机器人可以帮助用户解决什么问题

17.5 通过其他方式告知语音机器人存在的原因，以及它能帮助用户做什么

17.6 花时间构建一个干净的本体

17.7 不要坐在椅子上设计语言模型

17.8 从语言错误中恢复时要明确说明

第18章利用停顿

18.1 用在列出选项之前

18.2 用在菜单列表中的选项之间

18.3 用在选项类别之间

18.4 当与高级用户交互时

18.5 用在语音机器人回应之后

18.6 用在TTS提示和人工录音切换时

第19章结束的要素

19.1 允许用户明确地结束对话

19.2 允许用户直接请求人工座席

19.3 当用户需要等待时提供一个预估的等待时间

19.4 提供取消转人工座席的选项

19.5 让“用户等候”的音频与用户相关

19.6 播放“用户等候”音频时要了解用户的心态

19.7 永远不要说“您的请求对我们来说很重要”

19.8 不要让用户对人工座席再重复一遍对语音机器人说过的内容

19.9 让人工座席意识到用户已经和语音机器人沟通过了

19.10 避免将用户从一个语音机器人转到另一个语音机器人

19.11 除非要将用户直接转到人工座席，否则不要播放电话铃声

19.12 对于用户的成功操作给予确认

19.13 不要在对话结束时提供重要信息

19.14 给用户一个快捷方式

19.15 给用户提供稍后联系的选项

第20章语音优先的通知

20.1 基本考量

20.2 通知中的关键属性

20.2.1 通知的紧急程度

20.2.2 通知的内容

20.2.3 交付的场景

20.3 关键的媒介形态因素

20.3.1 远场语音

20.3.2 近场语音

20.3.3 耳机中的语音

20.4 一些最佳实践

20.4.1 留意接收者的时区

20.4.2 提供一些上下文

20.4.3 直奔主题

20.4.4 重复重要的信息

20.4.5 为用户提供获取更多详细信息的方法

20.5 一些应用场景

20.5.1 场景1

20.5.2 场景2

20.5.3 场景3

第21章奠定基础

21.1 召集所有关键角色

21.2 定义商业目标

21.3 定义用户的需求和意图

21.3.1 识别用户任务

21.3.2 识别使用模式

21.4 定义语音机器人的语体风格

第22章发布成功产品的关键

22.1 用完整的句子写出所有的东西

22.2 新闻稿需要清晰明了

22.3 答案最多只能有一两段内容

22.4 先回答基本问题

22.5 清楚地描述已完成的研究

22.6 在主张和声明中要谦虚谨慎

22.7 让每个人都能读懂你的文档

22.8 根据用户可以做的事情列出功能需求

22.9 详细描述预期的最小可行性产品

第23章部署的要素

23.1 产品管理

23.2 产品营销

23.3 用户体验研究人员

23.4 用户体验设计师

23.5 开发人员

23.6 质量工程师

23.6.1 功能测试

23.6.2 遍历测试

23.6.3 压力测试

23.6.4 Beta测试

23.7 项目管理

第24章发布后的监测

24.1 信息来源

24.1.1 交互日志

24.1.2 交互的音频

24.1.3 终端用户

24.2 基本问题

24.2.1 用户在哪里放弃会话

24.2.2 用户在哪里要求转接到人工代理

24.2.3 用户在哪里说错话了

24.2.4 用户在哪里什么都不说了

24.2.5 哪些地方用户说话太早

24.2.6 用户环境的噪声水平是多少

24.2.7 用户需要什么样的选择

24.2.8 用户对语音机器人的感觉如何

第25章语音优先服务的成功指标要素

25.1 放弃率

25.2 自动化率

25.3 每个会话的平均故障次数

25.4 每个任务的平均故障次数

25.5 平均任务完成时间

25.6 遏制率

25.7 首次使用解决率

25.8 任务完成率

25.9 任务启动率

25.10 接入时间

第26章结束语

附录A 语音优先产品失败的10个原因

附录B 演示语音优先的产品

附录C 有用的指标矩阵

术语表

参考文献

语音优先：智能语音技术驱动的交互界面设计与语音机器人设计是2023年由机械工业出版社出版,作者[美] 艾哈迈德·布齐德。

得书感谢您对《语音优先：智能语音技术驱动的交互界面设计与语音机器人设计》关注和支持，如本书内容有不良信息或侵权等情形的，请联系本网站。

得书 - 好书推荐、正版图书免费阅读