自然语言处理与医疗文本的知识抽取

刘永彬

查阅电子书

手机扫码

微信扫一扫

关注微信公众号

因版权原因待上架

类似推荐

编辑推荐

自然语言处理在医疗文本上的智能应用图书，详细讲解医疗领域的前沿技术。

内容简介

本书主要介绍自然语言处理技术在医疗信息领域尤其是电子病历文本中的应用。

作者首先对一些基础知识和技术做了介绍，然后给出相关技术在医疗信息领域的应用案例。还介绍了知识抽取的一些前沿技术与实践。

本书可作为高校相关专业师生的学习用书和培训机构的教材，以及希望深入研究自然语言处理算法的计算机工程师的参考书，也可作为对人工智能、深度学习和自然语言处理感兴趣的初学者与希望把人工智能应用到医疗领域的研究者学习用书。

作者简介

作者刘永彬，博士、副教授，中国计算机学会-自然语言处理专业委员会执行委员，中国中文信息学会-语言与知识计算专业委员会委员，中国中文信息学会-自然语言生成与智能写作专业委员会委员，中国人工智能学会-青年工作委员会委员，中国人工智能学会-教育工作委员会委员；主要研究信息抽取、知识图谱构建，以及在医疗大数据、科学大数据和企业智能化信息服务等领域的应用。

章节目录

版权信息

内容提要

序

前言

致谢

第一部分基础知识

第1章自然语言处理技术

1.1 自然语言处理概述

1.2 数据标注任务

1.2.1 数据标注之中文分词

1.2.2 数据标注之词性标注

1.3 词表示学习任务

1.3.1 词表示方法的类型

1. 独热表示

2. 词的分布式表示

1.3.2 详解词的分布式表示

1. 基于矩阵的分布表示

2. 基于聚类的分布表示

3. 基于神经网络的分布表示

1.3.3 词嵌入

1.4 实体识别任务

1.5 关系抽取任务

1.6 事件抽取任务

1.7 预训练模型

1.8 小样本学习

1.9 领域自适应

1.10 多模态任务

1. 分类问题处理

2. 多模态语义分析

3. 视觉常识推理

4. 跨模态匹配

5. 跨模态检索

6. 跨模态样本生成

7. 多模态人机对话

1.11 对话任务

1.11.1 生成式对话

1.11.2 任务导向型对话

1. 基于管道的方法

2. 端到端的方法

1.12 本书结构

参考文献

第2章从统计机器学习模型到神经网络模型

2.1 统计机器学习方法的三要素

2.2 隐马尔可夫模型

1. 马尔可夫性质

2. 马尔可夫链

3. 隐马尔可夫模型概述

4. 隐马尔可夫模型的3个问题

2.3 支持向量机

1. 线性可分支持向量机

2. 对偶问题

3. 软间隔

4. 核函数

2.4 条件随机场

2.5 前馈神经网络

1. 把数据变成介于0和1之间的小数

2. 把有量纲表达式变成无量纲表达式

2.6 反馈神经网络

2.6.1 循环神经网络

2.6.2 递归神经网络

2.6.3 Hopfield神经网络

1. 离散型Hopfield神经网络

2. 连续型Hopfield神经网络

2.6.4 长短期记忆网络

2.7 注意力模型

2.7.1 注意力

2.7.2 Encoder-Decoder框架

2.7.3 软注意力

1. 计算注意力分布

2. 计算加权平均值

2.7.4 硬注意力

2.7.5 自注意力

2.8 Transformer模型

1. 编码器层

2. 注意力机制

3. 解码器层

2.9 图神经网络模型

参考文献

第3章词表示学习

3.1 分布假设与分布式表示

3.2 词向量模型CBOW

3.3 词向量模型Skip-Gram

参考文献

第二部分知识抽取

第4章实体识别

4.1 基于卷积神经网络的实体识别

4.2 基于循环神经网络的实体识别

4.3 基于Transformer的实体识别模型

参考文献

第5章关系抽取

5.1 基于注意力的关系抽取模型

5.2 基于集成学习的关系抽取模型

5.3 基于预训练的关系抽取模型

5.4 基于Transformer的关系抽取模型

5.5 基于GCN的关系抽取模型

参考文献

第6章领域自适应

6.1 DAN模型

6.2 DANN模型

6.3 DSN模型

参考文献

第7章多模态任务

7.1 多模态数据

7.2 多模态融合技术

1. 多模态表示学习

2. 多模态融合

3. 多模态对齐

4. 多模态映射

5. 多模态协同学习

7.3 多模态融合技术面临的挑战

参考文献

第8章小样本学习

8.1 数据增强

1. 基于词典的数据增强

2. 基于词向量的数据增强

3. 基于语言模型的数据增强

4. 基于翻译的数据增强

5. 基于随机噪声注入的数据增强

8.2 远程监督

8.3 元学习

参考文献

第9章实体与关系联合抽取

9.1 参数共享模式

9.2 新标注策略模式

9.3 关系重叠问题

参考文献

第三部分医疗电子病历研究与实践

第10章电子病历研究背景

10.1 电子病历概述

10.2 电子病历文本类型

10.3 电子病历实体分类体系

10.4 电子病历实体关系分类体系

10.5 电子病历隐私实体分类体系

10.6 ICD编码

10.7 电子病历ICD自动编码实践

1. 模型结构

2. 数据准备

3. 位置嵌入

4. Dilated CNN

5. 系统实现

10.8 电子病历实体识别实践

1. 向量表示

2. 实体识别模型

3. 特定任务规则

4. 数据集和实验设置

5. 评价

6. 实验结果

7. 结果分析

8. 结论

参考文献

第11章电子病历的事件抽取

11.1 电子病历中的事件

11.2 电子病历事件触发词识别

11.3 电子病历事件触发词抽取实践

11.3.1 文本预处理

1. 文本分词

2. 句法分析

11.3.2 引入依存句法特征的动态多池化模型

1. 输入序列的表示

2. 混合表示学习

11.3.3 动态多池化卷积神经网络

11.3.4 实验结果分析

1. 混合特征对模型的影响

2. 类别性能分析

11.4 电子病历事件元素抽取

11.4.1 电子病历事件元素角色类别的定义

11.4.2 电子病历事件元素抽取实践

11.4.3 句子编码

11.4.4 混合句法特征的图神经网络

1. 句子级别特征

2. 图卷积网络

3. 混合表示学习

4. 分类输出层

5. 实验结果分析

6. 类别性能分析

参考文献

第12章医疗对话摘要生成

12.1 基于情景记忆网络的编码标记模型

12.1.1 情景记忆网络

1. 多情节迭代

2. 注意力机制

3. 记忆更新机制

4. 终止标准

12.1.2 基于情景记忆网络的分层标记模型

12.1.3 实验

1. 实验设置

2. 数据集

3. 摘要评估方法

4. 与以往模型的比较

5. 不同的黄金标准

6. 情景记忆网络

12.2 医疗对话摘要的未来

参考文献

第四部分前沿技术与实践

第13章因果推断技术

13.1 电子病历中的因果关系

13.2 因果方法

13.2.1 因果推断

1. 后门标准与后门调整

2. 前门标准与前门调整

3. 逆概率加权

13.2.2 将因果关系发现与不同研究方向结合

1. 将因果关系发现与计算机视觉结合

2. 将因果关系发现与自然语言处理结合

3. 将因果关系发现与交互式学习（如推荐系统）结合

13.2.3 将因果关系发现应用于不同领域

1. 将因果关系发现应用于金融领域

2. 将因果关系发现应用于民航领域

3. 将因果关系发现应用于医疗领域

13.2.4 典型的因果推断技术

1. 基于约束的因果发现方法

2. 基于函数因果模型的方法

3. 混合型方法

13.3 电子病历中的因果推断技术

参考文献

第14章小样本学习实体识别实践

14.1 问题定义

14.2 方法

14.2.1 原型网络

14.2.2 字符感知

14.2.3 句子感知

14.2.4 联合学习策略

14.3 实验

14.3.1 数据集

14.3.2 超参数设置

14.3.3 基线模型

14.3.4 整体实验结果

14.3.5 收敛速度验证

14.3.6 消融研究

1. 句子感知部分

2. 字符感知部分

14.3.7 整体实验结果

14.3.8 错误指标分析

参考文献

第15章小样本实体关系抽取实践

15.1 问题定义

15.2 方法

15.2.1 原型网络

15.2.2 特征级注意力

15.2.3 深度集成策略

15.2.4 微调策略

15.3 实验

15.3.1 数据集

15.3.2 超参数设置

15.3.3 基线模型

15.3.4 整体实验结果

15.3.5 交叉验证

15.3.6 消融研究

参考文献

自然语言处理与医疗文本的知识抽取是2023年由人民邮电出版社出版,作者刘永彬。

得书感谢您对《自然语言处理与医疗文本的知识抽取》关注和支持，如本书内容有不良信息或侵权等情形的，请联系本网站。

得书 - 好书推荐、正版图书免费阅读