自然语言处理技术——文本信息抽取及应用研究

自然语言处理技术——文本信息抽取及应用研究

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

信息抽取:推动AI认知技术,助力知识图谱构建。

内容简介

信息抽取的目的是从海量互联网文本信息中抽取结构化知识,是知识图谱自动化构建、更新的基础,为信息检索、推荐系统、智能问答等诸多研究领域提供底层知识推理支撑并取得了重大突破,是推动人工智能技术由感知走向认知的关键要素,具有重要的研究意义和实用价值。本书梳理了命名实体识别、关系抽取、事件抽取等相关研究方向的知识资源、基础理论和实践应用,详细介绍了实体关系联合抽取、弱监督关系抽取、基于迁移学习的关系抽取、多实例联合事件抽取、基于因变量的事件模板推导等前沿理论研究,并以领域知识图谱、事理图谱等为例,详细介绍了信息抽取在图谱构建中的应用。最后本书对信息抽取进行了总结和未来研究方向展望。

章节目录

封面

版权信息

内容简介

前言

第1章 绪论

1.1 研究背景及意义

1.2 基本定义及问题描述

1.2.1 概念

1.2.2 命名实体识别

1.2.3 关系抽取

1.2.4 事件抽取

1.2.5 资源受限

1.2.6 信息抽取应用

1.3 基本研究方法与代表性系统

1.3.1 基于规则的方法

1.3.2 基于统计模型的方法

1.3.3 基于深度学习的方法

1.3.4 基于文本挖掘的方法

1.4 本书章节组织架构

第2章 基础理论

2.1 词汇语义表示

2.1.1 基于矩阵分解的方法

2.1.2 基于预测任务的方法

2.2 序列标注

2.3 条件随机场

2.3.1 线性链条件随机场

2.3.2 Viterbi算法

2.4 循环神经网络

2.4.1 朴素循环神经网络

2.4.2 长短期记忆网络

2.4.3 门控循环单元

2.4.4 双向循环神经网络

2.5 卷积神经网络

2.5.1 文本上的卷积

2.5.2 卷积神经网络的优点

2.6 图卷积神经网络

2.7 多任务学习

2.7.1 多任务学习模式

2.7.2 多任务学习有效性分析

2.8 远程监督

2.9 迁移学习

2.9.1 基于实例的迁移学习

2.9.2 基于特征的迁移学习

2.9.3 基于共享参数的迁移学习

参考文献

第3章 信息抽取相关评测和标注资源

3.1 MUC系列评测会议

3.2 ACE系列评测会议

3.3 TAC-KBP系列评测会议

3.4 其他研究活动

3.5 信息抽取标注资源

参考文献

第4章 联合实体识别的关系抽取

4.1 引言

4.2 问题描述

4.3 基于序列建模的实体识别

4.3.1 基于BERT的句子编码

4.3.2 头实体识别

4.3.3 尾实体识别

4.4 基于生成的实体关系联合抽取

4.4.1 句子编码

4.4.2 基于集合预测的解码过程

4.5 基于翻译的实体关系联合抽取

4.5.1 输入编码

4.5.2 实体识别

4.5.3 关系预测

4.5.4 基于翻译的实体关系联合抽取案例

4.6 实验验证

4.6.1 数据集和评价指标

4.6.2 对比算法

4.6.3 实验结果

4.6.4 问题与思考

4.7 本章小结

参考文献

第5章 弱监督的关系抽取

5.1 引言

5.2 问题分析

5.3 基于注意力机制的弱监督关系抽取

5.3.1 基于切分卷积神经网络的关系抽取

5.3.2 基于句子级别的注意力机制的远程监督关系抽取

5.3.3 基于实体描述的句子级别的注意力机制的远程监督关系抽取

5.3.4 基于非独立同分布的远程监督关系抽取

5.4 基于图卷积的远程监督关系抽取

5.4.1 基于依存树的图卷积关系抽取

5.4.2 基于注意力机制引导的图卷积神经网络关系抽取

5.5 基于篇章级别的远程监督关系抽取

5.6 实验验证

5.7 本章小结

参考文献

第6章 基于知识迁移的关系抽取

6.1 引言

6.2 同类别迁移的关系抽取

6.2.1 引言

6.2.2 相关工作

6.2.3 基于领域分离映射的领域自适应关系抽取框架

6.2.4 实验部分

6.2.5 总结与分析

6.3 跨类别迁移的关系抽取

6.3.1 引言

6.3.2 相关工作

6.3.3 基于任务感知的小实例关系抽取模型

6.3.4 实验部分

6.3.5 总结与分析

6.4 不均衡模型训练方法

6.4.1 引言

6.4.2 相关工作

6.4.3 基于多分布选择的不均衡数据分类方法

6.4.4 实验部分

6.4.5 总结与分析

6.5 本章小结

参考文献

第7章 多实例联合的事件抽取

7.1 引言

7.2 问题分析

7.3 基于记忆单元的多实例联合的事件抽取

7.3.1 技术路线

7.3.2 总结与分析

7.4 基于图卷积的多实例联合的事件抽取

7.4.1 技术路线

7.4.2 总结与分析

7.5 基于全局信息的多实例联合的事件抽取

7.5.1 技术路线

7.5.2 总结与分析

7.6 实验验证

7.6.1 实验设置

7.6.2 对比算法

7.6.3 实验分析

7.6.4 问题与思考

7.7 本章小结

参考文献

第8章 无监督的事件模板推导

8.1 引言

8.2 问题分析

8.3 融合语言特征的隐变量方法

8.3.1 技术路线

8.3.2 总结与分析

8.4 神经网络扩展的隐变量方法

8.4.1 技术路线

8.4.2 总结与分析

8.5 基于对抗生成网络的隐状态方法

8.5.1 技术路线

8.5.2 总结与分析

8.6 实验验证

8.6.1 实验设置

8.6.2 对比算法

8.6.3 实验分析

8.6.4 问题与思考

8.7 本章小结

参考文献

第9章 信息抽取在知识图谱构建中的应用

9.1 引言

9.2 指代消解方法

9.2.1 基于逻辑规则的指代消解

9.2.2 基于数据驱动的指代消解

9.2.3 利用结构化信息的指代消解

9.2.4 利用深层语义信息的指代消解

9.2.5 跨文本的指代消解

9.3 实体链接方法

9.3.1 实体链接介绍

9.3.2 实体链接基本架构

9.4 总结分析

参考文献

第10章 基于图谱知识的应用

10.1 引言

10.2 知识表示方法

10.2.1 基于距离的知识表示方法

10.2.2 基于翻译的知识表示方法

10.2.3 基于双线性的知识表示方法

10.2.4 基于神经网络的知识表示方法

10.3 知识推理

10.3.1 基于语言模式的匹配方法

10.3.2 基于分布式表示的识别方法

10.4 知识补全

10.4.1 预备知识

10.4.2 基于时序知识图谱的自动补全模型

10.5 基于知识图谱的推荐算法

10.5.1 基于分布式表示的方法

10.5.2 基于路径的方法

10.5.3 基于传播的方法

10.6 基于知识图谱的自动问答

10.6.1 常用知识图谱和问答数据集

10.6.2 知识图谱简单关系问答

10.6.3 知识图谱复杂关系问答

10.6.4 知识图谱序列问答

10.6.5 基于信息检索的知识图谱问答

10.6.6 结合非结构化知识的知识图谱问答

10.6.7 多结构或多语言的知识图谱问答

10.7 本章小结

参考文献

第11章 总结与展望

11.1 本书总结

11.2 未来研究展望

11.2.1 命名实体识别技术展望与发展趋势

11.2.2 关系抽取技术展望与发展趋势

11.2.3 事件识别与抽取技术展望与发展趋势

封底

自然语言处理技术——文本信息抽取及应用研究是2022年由电子工业出版社出版,作者 石戈。

得书感谢您对《自然语言处理技术——文本信息抽取及应用研究》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
信息技术基础及应用教程 电子书
本书共7章,全书以Windows7为操作平台,以实例讲解为主线,将每章节的知识点有机地融合在实例中。其内容主要涵盖信息技术基础知识、计算机硬件系统、Windows7的基本操作、网络应用基本操作、Word2010、Excel2010、PowerPoint2010等办公软件的应用及Flash动画设计技术等计算机及信息技术知识。
PyTorch自然语言处理入门与实战 电子书
一本兼顾理论基础和工程实践的入门级教程。
信息技术及素养实训教程 电子书
本书详细介绍了Windows7系统基本操作,实用工具软件的使用,常用办公自动化软件Office2010的文字处理软件、电子表格处理软件和演示文稿软件的使用,以及安全密码的基础知识和相关设置等内容。
信息技术基础及应用教程(第2版) 电子书
本书共6章,全书以Windows7为操作平台,以实例讲解为主线,将每章节的知识点有机地融合在实例中。其内容主要涵盖计算机概述、Word2010的应用、Excel2010的应用、PowerPoint2010的应用、网页制作、Flash动画设计等计算机及信息技术知识。
信息技术导论 电子书
全书共分11章,在介绍信息科学基本理论形成的基础上,重点介绍了信息技术、应用及发展趋势。本书主要内容有信息技术与信息社会、计算机技术、软件技术、云计算与大数据、微电子与传感技术、通信与网络技术、物联网技术及应用、电子商务与电子政务、人工智能技术、自动化与智能控制、智能家居与智能汽车。本书内容丰富、由点到面、循序渐进,通过对信息技术的源流与演变、理论建立与转变进行较为全面的介绍,助读者拓展综合素质。