知识图谱:概念与技术(博文视点出品)

知识图谱:概念与技术(博文视点出品)

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

适读人群 :本书可作为高年级本科生、硕士生或者博士生的教材,也适合企业与行业智能化的从业人员阅读。

· 有深度也有广度,力求涵盖知识图谱相关的基本概念与关键技术。

· 梳理前沿成果,总结了十多个知识图谱工程项目的落地经验。

· 写作团队成员均为国内知名高校和研究所AI相关专业教师和研究员。

· 内容历经一年打磨,并曾在多所高校试讲,根据听众反馈迭代改进。

内容简介

知识图谱是一种大规模语义网络,已经成为大数据时代知识工程的代表性进展。知识图谱技术是实现机器认知智能和推动各行业智能化发展的关键基础技术。知识图谱也成为大规模知识工程的代表性实践,其学科日益完善。

本书是一本系统介绍知识图谱概念、技术与实践的书籍。全书共5篇,由16 章构成,力求涵盖知识图谱相关的基本概念与关键技术。“基础篇”介绍知识图谱的基本概念、内涵与外延、历史沿革、应用价值,以及相关的基础知识。“构建篇”重点介绍大规模高质量知识图谱的自动化构建技术,涵盖词汇挖掘、实体识别、关系抽取及概念图谱构建、百科图谱构建、众包构建与质量控制等专题。“管理篇”系统地阐述了知识图谱建模与存储、查询与检索,以及图数据管理系统。“应用篇”对于基于知识图谱的关键应用技术展开介绍,包括搜索与推荐、自然语言问答,以及基于知识图谱的自然语言理解。“实践篇”介绍知识图谱实践中的基本原则和有用实践,初步讨论了知识图谱实践中的开放性问题。

本书可作为高年级本科生、硕士生或者博士生的教材,也适合企业与行业智能化的从业人员阅读。

作者简介

肖仰华

博士,复旦大学教授、博士生导师、复旦大学知识工场实验室创始人。曾担任多家企业高级技术顾问与首席科学家。曾获得十多个国家、省/市、企业级的研究奖项,曾承担三十多项国家、省/市、企业级研发项目。在级学术会议与期刊(包括SIGMOD、VLDB、ICDE、IJCAI、AAAI、ACL、TKDE等)发表论文百余篇,授权近20项知识图谱专利。担任多个国际期刊编委,百余次为国际/国内学术机构/会议提供学术服务工作。领导构建了知识工场平台,发布了一系列知识图谱包括CN-DBpedia、CN-Probase等。

章节目录

第1篇基础篇

第1章知识图谱概述... 2

1.1知识图谱的基本概念... 2

1.1.1知识图谱的狭义概念... 3

1.1.2知识图谱的广义概念... 8

1.2知识图谱的历史沿革... 10

1.2.1知识图谱溯源... 10

1.2.2大数据知识工程... 13

1.3知识图谱的研究意义... 16

1.3.1知识图谱是认知智能的基石... 16

1.3.2知识引导成为解决问题的重要方式之一... 19

1.4知识图谱的应用价值... 20

1.4.1数据分析... 20

1.4.2智慧搜索... 21

1.4.3智能推荐... 22

1.4.4自然人机交互... 23

1.4.5决策支持... 23

1.5知识图谱的分类... 24

1.5.1知识图谱中的知识分类... 25

1.5.2知识图谱的领域特性... 26

1.5.3典型知识图谱... 30

本章小结38

思考题... 39

参考文献40

第2章基础知识... 43

2.1概述43

2.2知识表示... 45

2.2.1基本概念... 45

2.2.2知识图谱的图表示... 47

2.2.3知识图谱的数值表示... 49

2.2.4其他相关知识表示... 54

2.3机器学习... 64

2.3.1机器学习的基本概念... 65

2.3.2深度学习概述... 67

2.3.3卷积神经网络... 70

2.3.4循环神经网络... 71

2.3.5注意力机制... 72

2.4自然语言处理... 73

2.4.1基本概念... 74

2.4.2文本的向量化表示... 76

本章小结78

思考题... 79

参考文献80

第2篇构建篇

第3章词汇挖掘与实体识别... 84

3.1概述84

3.2领域短语挖掘... 86

3.2.1问题描述... 87

3.2.2领域短语挖掘方法... 88

3.2.3统计指标特征... 91

3.3同义词挖掘... 95

3.3.1概述... 95

3.3.2典型方法... 96

3.4缩略词抽取... 101

3.4.1缩略词的概念与形式... 101

3.4.2缩略词的检测与抽取... 103

3.4.3缩略词的预测... 105

3.5实体识别... 109

3.5.1概述... 109

3.5.2传统的NER方法... 110

3.5.3基于深度学习的NER方法... 114

3.5.4近期的一些方法... 120

本章小结121

思考题... 122

参考文献122

第4章关系抽取... 127

4.1概述127

4.1.1关系抽取的问题和方法分类... 128

4.1.2关系抽取常用数据集... 130

4.1.3关系抽取评估方法... 131

4.2基于模式的抽取... 133

4.2.1基于字符模式的抽取... 134

4.2.2基于语法模式的抽取... 135

4.2.3基于语义模式的抽取... 135

4.2.4自动化模式获取:自举法... 136

4.2.5基于模式抽取的质量评估... 138

4.3基于学习的抽取... 139

4.3.1基于监督学习的关系抽取... 140

4.3.2基于远程监督学习的关系抽取... 142

4.3.3基于深度学习的关系抽取... 144

4.4开放关系抽取... 150

4.4.1TextRunner 151

4.4.2ReVerb. 152

4.4.3Ollie. 154

本章小结154

思考题... 156

参考文献157

第5章概念图谱构建... 160

5.1概述160

5.1.1常见的概念图谱... 163

5.1.2概念图谱的应用... 166

5.2isA关系抽取... 168

5.2.1基于在线百科的方法... 169

5.2.2基于模式的方法... 170

5.2.3中文概念图谱的构建... 172

5.3isA关系补全... 175

5.3.1isA关系缺失的成因... 176

5.3.2基于isA关系传递性的概念图谱补全... 177

5.3.3基于协同过滤思想的概念图谱补全... 179

5.4isA关系纠错... 181

5.4.1错误的成因... 182

5.4.2基于支持度的纠错... 183

5.4.3基于图模型的纠错... 184

本章小结185

思考题... 186

参考文献187

第6章百科图谱构建... 189

6.1概述189

6.1.1什么是百科图谱... 189

6.1.2百科图谱的意义... 190

6.1.3百科图谱的分类... 191

6.2基于单源的百科图谱构建... 192

6.2.1数据获取... 193

6.2.2属性抽取... 195

6.2.3关系构建... 200

6.2.4概念层级体系构建... 201

6.2.5实体分类... 201

6.3基于多源的百科图谱融合... 207

6.3.1基于多个知识图谱的融合方法... 207

6.3.2基于多源异构数据的融合方法... 215

本章小结216

思考题... 217

参考文献217

第7章知识图谱的众包构建... 221

7.1概述221

7.2知识型众包的基本概念... 223

7.3知识型众包研究的问题... 226

7.3.1What(对什么任务进行众包)... 226

7.3.2Whom(将任务交予谁完成)... 229

7.3.3How(如何完成众包)... 230

7.4基于众包的知识图谱构建与精化... 235

7.4.1本体构建阶段的人工介入... 235

7.4.2知识图谱构建阶段的人工介入... 237

7.4.3知识图谱精化阶段的人工介入... 242

本章小结244

思考题... 245

参考文献246

第8章知识图谱的质量控制... 250

8.1概述251

8.1.1知识图谱质量评估的维度... 251

8.1.2知识图谱质量评估的方法... 253

8.1.3知识图谱质量控制全周期概览... 254

8.2缺失知识的发现与补全... 260

8.2.1类型补全... 260

8.2.2关系补全... 263

8.2.3属性值补全... 268

8.3错误知识的发现与纠正... 270

8.3.1错误实体类型检测... 271

8.3.2错误实体关系检测... 271

8.3.3错误属性值检测... 273

8.4过期知识的更新... 274

8.4.1基于更新频率预测的更新机制... 275

8.4.2基于时间标签的更新机制... 276

8.4.3基于热点事件发现的更新机制... 277

本章小结278

思考题... 279

参考文献280

第3篇管理篇

第9章知识图谱的建模与存储... 286

9.1概述286

9.2知识图谱的数据模型... 287

9.2.1知识图谱的三元组模型... 287

9.2.2知识图谱的图模型... 291

9.3知识图谱的物理存储... 296

9.3.1知识图谱数据的基本操作... 296

9.3.2知识图谱的关系表存储... 297

9.3.3知识图谱的图存储... 302

9.3.4分布式计算环境下的知识图谱数据存储... 305

本章小结309

思考题... 310

参考文献310

第10章知识图谱的查询与检索... 314

10.1概述314

10.2查询语言:SPARQL. 315

10.2.1简单查询... 315

10.2.2SPARQL查询机制及知识图谱上的推理... 321

10.3子图查询... 324

10.3.1子图查询基本知识... 324

10.3.2近似子图查询... 326

10.3.3Top-k查询... 331

10.3.4索引结构... 334

10.4其他查询... 335

10.4.1路径查询... 335

10.4.2关键词查询... 337

10.4.3社团搜索... 339

本章小结342

思考题... 343

参考文献343

第11章图数据管理系统... 347

11.1概述347

11.2知识图谱与图数据管理系统... 348

11.2.1大图管理的挑战... 350

11.2.2图数据管理系统的重要性... 352

11.2.3图数据管理系统管理知识图谱的挑战... 354

11.3图数据管理系统的基本架构和设计原则... 357

11.4典型的图数据管理系统... 360

11.4.1通用图数据管理系统... 361

11.4.2知识图谱专用图数据管理系统... 364

11.4.3图数据管理系统使用实例... 366

本章小结370

思考题... 371

参考文献371

第4篇应用篇

第12章基于知识图谱的语言认知... 374

12.1概述375

12.1.1语言理解的挑战... 375

12.1.2语言理解需要知识图谱... 376

12.1.3语言理解的任务... 377

12.2实体理解... 378

12.2.1基本模型... 379

12.2.2局部实体链接分数... 380

12.2.3全局实体链接分数... 381

12.2.4模型计算... 382

12.2.5短文本实体链接... 388

12.2.6跨语言实体链接... 389

12.3概念理解... 391

12.3.1单实例概念理解... 391

12.3.2多实例概念理解... 393

12.3.3短语概念理解... 395

12.3.4关系对概念理解... 397

12.3.5概念理解应用举例... 398

12.4属性理解... 399

本章小结401

思考题... 402

参考文献402

第13章基于知识图谱的搜索与推荐... 405

13.1概述405

13.2基于知识图谱的搜索... 408

13.2.1搜索概述... 408

13.2.2搜索意图理解... 411

13.2.3目标查找... 413

13.2.4结果呈现... 413

13.2.5实体探索... 414

13.3基于知识图谱的推荐... 419

13.3.1推荐的基本问题与挑战... 419

13.3.2基于知识图谱的物品画像... 422

13.3.3基于知识图谱的用户画像... 427

13.3.4基于知识图谱的跨领域推荐... 429

13.3.5基于知识图谱的可解释推荐... 432

本章小结433

思考题... 435

参考文献435

第14章基于知识图谱的问答... 438

14.1概述438

14.1.1问答系统... 438

14.1.2KBQA.. 441

14.2基于模板的KBQA.. 449

14.2.1基于模板的意图识别... 449

14.2.2基于模板的属性关联... 451

14.3基于图模型的KBQA.. 453

14.3.1监督学习方法... 453

14.3.2无监督方法... 455

14.4基于深度学习的KBQA.. 457

14.4.1表示学习... 458

14.4.2分类模型... 459

14.4.3生成模型... 461

本章小结462

思考题... 463

参考文献464

第5篇实践篇

第15章知识图谱实践... 468

15.1概述468

15.1.1知识图谱应用的推动力... 469

15.1.2知识图谱应用与产业现状... 471

15.1.3知识图谱实践的系统工程观念... 472

15.1.4知识图谱助力行业智能化的演进路径... 474

15.2知识图谱系统... 476

15.2.1知识图谱系统的外部环境... 476

15.2.2知识图谱系统的关键要素... 477

15.2.3知识图谱系统的典型架构... 479

15.3知识图谱工程... 485

15.3.1基本原则... 486

15.3.2过程模型... 489

15.3.3可行性分析... 491

15.3.4实践建议... 495

本章小结499

思考题... 499

参考文献500

第16章开放性问题... 501

16.1知识表示... 501

16.1.1与其他知识表示相联合的语义增强... 501

16.1.2过程语义增强... 502

16.1.3时空语义增强... 503

16.1.4跨模态语义增强... 504

16.2知识获取... 504

16.2.1低成本知识获取... 505

16.2.2复杂知识的获取... 506

16.2.3知识获取中的人机协作与评测... 508

16.3知识应用... 509

16.3.1知识图谱上的推理... 509

16.3.2符号知识增强机器学习... 510

16.3.3基于知识图谱的可解释人工智能... 511

16.3.4知识图谱的个性化问题... 511

本章小结512

思考题... 513

参考文献513

知识图谱:概念与技术(博文视点出品)是2019年由电子工业出版社出版,作者肖仰华。

得书感谢您对《知识图谱:概念与技术(博文视点出品)》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
程序设计竞赛训练营:基础与数学概念 电子书
本书是针对大学生程序设计竞赛的训练指南,主要介绍程序设计和针对竞赛训练所需的基础知识和基本数学概念,包括UVaOJ平台的使用方法、C++的输入输出处理、C++库实现所包含的数据结构、高级数据结构、字符串的处理和相关算法、排序与查找算法、代数、组合数学、数论、几何等内容。
抖音博主实操攻略 电子书
八大内容,直击痛点,助你成为百万粉丝抖音博主。
路由与交换技术 电子书
本书从大众耳熟能详的内容切入,由浅入深带领读者掌握艰深的技术要点,保障零基础读者无障碍理解。
路由与交换技术 电子书
本书是华为ICT学院路由与交换技术官方教材,旨在帮助初级阶段的学生进一步学习网络技术的常用协议和对应的配置方法。本书的写作顺序为先交换后路由。本书首先对交换网络进行了概述,以便读者学习本书后文的内容。接下来,用两章介绍了VLAN和STP这两项交换网络中常用的技术。后面的6章内容均与路由技术有关,路由技术是互联网络中必不可少的核心技术。除华为ICT学院的学生之外,本书同样适合正在备考HCNA认证或者
新媒体数据分析:概念、工具、方法 电子书
本书适合新媒体营销的学习者和从业者使用,也可作为本科院校、职业院校营销类、企业管理类、商务贸易类、电子商务类专业的新媒体营销课程的教学用书。