工业级知识图谱:方法与实践

工业级知识图谱:方法与实践

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

本书源于阿里巴巴千亿级知识图谱构建与产业化应用的工作总结,对知识图谱理论和大规模工业实践进行了全面和深入的阐述。

内容简介

本书以阿里巴巴的实战经验为中心,以深厚的理论成果为支撑,详细阐述了知识图谱的方方面面。首先介绍工业场景下知识图谱的现状、存在的问题和架构设计;然后从知识表示、知识融合、知识获取、知识推理、知识存储和知识图谱前沿方向等方面入手,介绍大规模商品知识图谱的构建方法。

最后结合阿里巴巴的业务实践,详细介绍知识图谱的产品设计、技术实现和业务应用细节。通过阅读本书,读者不仅可以从零开始认识知识图谱,了解知识图谱技术方法和前沿技术方向,而且可以熟悉知识图谱工业实践的实现路径,清楚知识图谱的应用方向和方法。本书介绍的成果获得钱伟长中文信息处理科学技术一等奖。

作者简介

作者陈华钧,浙江大学计算机科学与技术学院教授。浙江大学阿里巴巴知识引擎联合实验室负责人、浙江省大数据智能计算重点实验室副主任、中国人工智能学会知识工程与分布智能专业委员会副主任委员、中国中文信息学会语言与知识计算专业委员会副主任委员、OpenKG发起人。曾获国际语义网会议ISWC最佳论文奖。

章节目录

版权信息

内容简介

前言

第1章 工业级知识图谱概述

1.1 知识图谱概述

1.1.1 通用知识图谱

1.1.2 行业知识图谱

1.2 工业级知识图谱实战原则

1.2.1 实践中的典型问题

1.2.2 实战原则

1.3 阿里巴巴知识引擎技术架构

1.3.1 平台产品:知识建模与管理

1.3.2 平台产品:知识生产

1.3.3 业务、平台产品:知识服务

1.4 本章小结

第2章 商品知识的表示和建模

2.1 知识表示简介

2.1.1 基于符号逻辑的知识表示方法

2.1.2 面向互联网的知识表示方法

2.1.3 基于连续向量的知识表示

2.2 行业知识建模

2.2.1 基于专家的知识建模

2.2.2 基于机器学习的知识建模

2.3 商品知识建模实践

2.3.1 术语抽取

2.3.2 商品概念及上下位关系生成

2.4 构建商品知识体系

2.4.1 通用域知识图谱

2.4.2 阿里商品域知识体系

2.5 商品知识建模应用场景

2.5.1 服务国家和社会机构应用

2.5.2 零售业务应用

2.6 小结

2.6.1 知识建模技术的未来发展

2.6.2 知识体系设计的未来发展

第3章 商品知识融合

3.1 知识融合概述

3.1.1 知识融合的主要难点

3.1.2 知识融合的基本步骤

3.2 本体对齐

3.2.1 基于语言学特征的方法

3.2.2 基于结构特征的方法

3.2.3 商品知识图谱本体对齐算法

3.3 实体对齐

3.3.1 实体对齐的流程

3.3.2 实体对齐的技术路线

3.3.3 商品知识图谱实体对齐实践

3.4 信息融合

3.4.1 无监督的信息融合方法

3.4.2 有监督和半监督的信息融合方法

3.4.3 商品知识图谱信息融合算法实践

3.5 跨语言知识融合

3.5.1 跨语言知识融合的挑战

3.5.2 跨语言实体对齐的技术路线

3.5.3 基于规则的跨语言实体对齐方法

3.5.4 基于翻译的跨语言实体对齐方法

3.5.5 基于表示学习的跨语言实体对齐方法

3.6 知识融合质量评估体系

3.6.1 知识融合评估指标介绍

3.6.2 离线融合效果评估

3.6.3 在线融合效果评估

3.7 本章小结

第4章 商品知识获取

4.1 知识获取概述

4.1.1 知识获取相关任务

4.1.2 知识获取相关测评会议

4.2 命名实体识别

4.2.1 命名实体识别概览

4.2.2 标注体系及常用数据集

4.2.3 基于规则的命名实体识别

4.2.4 基于统计模型的命名实体识别

4.2.5 基于神经网络的实体识别

4.3 实体链接

4.3.1 实体链接概述

4.3.2 候选实体生成

4.3.3 候选实体排序

4.3.4 端到端的实体链接方法

4.4 关系抽取

4.4.1 关系抽取概述

4.4.2 基于模板的关系抽取方法

4.4.3 基于监督学习的关系抽取方法

4.4.4 基于半监督学习的关系抽取方法

4.4.5 基于无监督学习的关系抽取方法

4.5 槽填充与属性补全

4.5.1 槽填充与属性补全概述

4.5.2 基于模板的方法

4.5.3 基于关系分类的方法

4.6 面向半结构化数据的知识获取

4.6.1 百科类网站数据抽取

4.6.2 面向Web网页的知识获取

4.7 低资源条件下知识获取

4.7.1 基于监督学习和弱监督学习的方法

4.7.2 基于迁移学习的方法

4.7.3 基于元学习的方法

4.7.4 基于知识增强的方法

4.8 电商领域知识获取实践

4.8.1 电商知识获取框架

4.8.2 面向场景导购的知识获取示例

4.8.3 低资源商品知识获取示例

4.9 本章小结

第5章 商品知识推理

5.1 知识推理概述

5.1.1 知识推理的作用

5.1.2 专家系统与知识推理

5.1.3 神经网络与知识推理

5.2 基于符号逻辑的知识推理

5.2.1 基于本体的知识推理方法

5.2.2 基于规则的知识推理方法

5.2.3 基于规则学习的知识图谱推理

5.3 基于表示学习的知识推理

5.3.1 基于分布式表示的知识推理

5.3.2 基于神经网络的知识推理

5.4 基于图数据库的商品知识推理引擎工程实践

5.4.1 技术框架简介

5.4.2 与传统规则推理引擎的对比

5.5 可解释的商品知识图谱推理应用实践

5.5.1 电商应用背景

5.5.2 技术实践方案

5.5.3 实验结果及案例分析

5.6 基于强化学习的商品规则学习与推理应用实践

5.6.1 电商应用背景

5.6.2 技术实践方案

5.6.3 实验结果及案例分析

5.7 本章小结

第6章 知识图谱的存储、服务与质量

6.1 知识图谱的存储

6.1.1 数据模型

6.1.2 存储系统选型

6.1.3 图查询语言

6.1.4 关键技术与选择

6.2 知识图谱的服务

6.2.1 基于知识图谱的搜索

6.2.2 基于知识图谱的推荐

6.2.3 搜索推荐在业务智能中的应用

6.2.4 基于知识图谱的问答系统

6.3 知识图谱质量保障

6.3.1 质量保障架构

6.3.2 测试原则与方法

6.4 本章小结

第7章 大规模商品知识图谱预训练

7.1 知识预训练概述

7.1.1 预训练语言模型

7.1.2 知识图谱中的结构化上下文信息

7.1.3 基于知识增强的预训练模型

7.1.4 预训练知识图谱模型与预训练语言模型的区别

7.2 商品知识图谱静态预训练模型

7.2.1 预训练知识图谱查询框架

7.2.2 预训练知识图谱查询模块

7.2.3 预训练知识图谱查询服务

7.2.4 在任务模块中使用查询服务

7.3 商品知识图谱动态预训练模型

7.3.1 上下文模块和整合模块

7.3.2 预训练阶段和微调阶段

7.4 商品知识图谱预训练实践案例

7.4.1 基于知识图谱预训练的商品分类

7.4.2 基于知识图谱预训练的商品对齐

7.4.3 基于知识图谱预训练的商品推荐

7.4.4 基于商品知识预训练的实体识别

7.4.5 基于商品知识预训练的关系抽取与属性补齐

7.4.6 基于商品知识预训练的标题生成

7.5 总结与展望

参考文献

工业级知识图谱:方法与实践是2021年由电子工业出版社出版,作者陈华钧。

得书感谢您对《工业级知识图谱:方法与实践》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
独具匠心:做最小可行性产品(MVP)方法与实践 电子书
本书以“面向市场,以产品为中心”的产品管理理念及方法,试图帮助企业在日益激烈的市场竞争中,解决产品同质化严重的问题,提升产品核心竞争力。
HBase入门与实践 电子书
大数据时代快速上手HBase行动指南。
Kafka入门与实践 电子书
本书适合应用Kafka的专业技术人员阅读,包括但不限于大数据相关应用的开发者、运维者和爱好者。
Flink原理与实践 电子书
本书围绕大数据流处理领域,介绍FlinkDataStreamAPI、时间和窗口、状态和检查点、TableAPI&SQL等知识。书中以实践为导向,使用大量真实业务场景案例来演示如何基于Flink进行流处理。
产品经理方法论——构建完整的产品知识体系(第2版) 电子书
系统总结产品经理的工作经验,帮助产品经理搭建完善的知识体系。