编辑推荐
本书站在数字人文与知识图谱的交叉地带,探索数字人文领域的知识图谱构建方法,为数字人文领域知识的重构和研究范式的改变奠定基础。
内容简介
书中首先介绍了数字资源组织与表示的基础知识,以及知识图谱的概念、起源和发展;其次,针对数字人文领域的问题和数据的特点,提出数字人文领域知识图谱构建的一般性方法,既包括在图谱构建中涉及的多种智能信息处理技术,也包括需要特别关注的基于众包的人机协作模式和全过程质量管理问题;最后,展示了相关方法在浙江高迁吴氏西宅宗谱的知识图谱构建实践中的应用。
作者简介
作者任明,中国人民大学信息资源管理学院副教授、博士生导师。清华大学管理学博士,印第安纳大学布卢明顿分校访问学者。数据工程与知识工程教育部重点实验室研究员,中国人民大学数字人文研究中心研究员。兼任中国科学技术情报学会知识组织专业委员会委员等。研究领域包括知识工程、信息分析、系统建模及其在数字人文等领域的应用,主持完成包括国家自然科学基金项目在内的多项研究课题,在信息科学领域一流学术期刊上发表多篇成果,已出版学术专著1部。科研成果获国家档案局优秀科技成果二等奖。
章节目录
版权信息
第1章 绪论
1.1 大数据与知识图谱
1.2 数字人文
1.3 本书概述
第2章 数字资源组织与表示
2.1 语义网
2.2 关联数据
2-2-1 RDF
2-2-2 数据存储
2-2-3 关联开放数据
2.3 本体
2-3-1 概念和分类
2-3-2 描述语言
2.4 知识图谱
2-4-1 概念和起源
2-4-2 数据存储
2-4-3 类别
第3章 数字人文领域知识图谱构建方法
3.1 概述
3-1-1 数字人文资源特点
3-1-2 知识图谱构建基础
3-1-3 数字人文领域知识图谱构建
3.2 领域本体构建
3-2-1 手动构建
3-2-2 半自动构建
3-2-3 自动构建
3.3 知识抽取
3-3-1 结构化数据的知识抽取
3-3-2 半结构化数据的知识抽取
3-3-3 非结构化数据的知识抽取
3.4 知识融合
3-4-1 模式层融合
3-4-2 数据层融合
3.5 知识推理
3-5-1 基于逻辑规则的知识推理
3-5-2 基于图结构的知识推理
3-5-3 基于分布式表示的知识推理
3-5-4 基于神经网络的知识推理
3.6 基于众包的人机协作模式
3-6-1 人机协作
3-6-2 众包应用
3-6-3 众包设计
3.7 全过程质量控制
3-7-1 概述
3-7-2 数据资源的质量控制
3-7-3 本体构建的质量控制
3-7-4 知识抽取的质量控制
3-7-5 知识融合的质量控制
3-7-6 知识推理的质量控制
第4章 家谱知识图谱构建实践
4.1 家谱资源组织现状
4-1-1 家谱数字化资源建设
4-1-2 家谱本体
4-1-3 家谱信息抽取
4.2 家谱数据集
4-2-1 浙江高迁吴氏西宅宗谱
4-2-2 数据校对及预处理
4.3 家谱本体构建
4.4 基于深度学习的家谱信息抽取
4-4-1 序列标签设计
4-4-2 半自动的数据标注
4-4-3 深度学习模型
4-4-4 数据实验
4.5 基于小规模标注数据的家谱信息抽取
4-5-1 上下文表示
4-5-2 基于bootstrapping扩展训练样本
4-5-3 数据实验
4.6 家谱知识融合
4-6-1 实体消歧
4-6-2 冲突检验
第5章 家谱可视化应用
5.1 中西方家谱可视化
5.2 中华传统家谱可视化
5-2-1 改进的家谱树状图
5-2-2 家谱力导向图
5.3 中华传统家谱可视化平台
5-3-1 功能需求
5-3-2 技术选型和框架
5-3-3 系统原型
5-3-4 可视化实例
5.4 小结
第6章 结语
参考文献
后记
数字人文领域知识图谱构建方法与实践是2022年由中国人民大学出版社出版,作者任明。
得书感谢您对《数字人文领域知识图谱构建方法与实践》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。