编辑推荐
互联网技术飞速发展下半结构化数据管理在学术和工业界具广阔前景。
内容简介
随着互联网技术的飞速发展,传统的结构化数据已经无法满足人们对信息处理的要求。尤其是在云计算和物联网高速发展的今天,对管理半结构化数据、大规模信息处理等领域的研究受到越来越多的关注。由于半结构化数据模型既能描述半结构化数据又能描述结构化数据,且具有灵活易扩展的存储结构,其已被许多系统和应用作为公共数据模型,被广泛地用于异构数据量大的使用场景中。如今,几乎所有行业都制订了描述和共享本领域数据的半结构化数据模型应用标准。此外,由于半结构化数据模型具有易于描述结构、易于校验、易于展现等特点,许多原本是以非结构化方式进行存储的数据,也通过半结构化数据模型进行描述并存储。因此,如何对大规模半结构化数据进行有效的管理,在学术界是一个重要的理论研究课题,而在工业界又是一项具有广阔应用前景的技术。本书以XML为代表,探讨了大规模半结构化数据管理中的关键问题——模式提取、节点编码、索引与查询处理等研究课题。
章节目录
封面
书名页
版权页
内容简介
作者简介
《中南财经政法大学青年学术文库》编辑委员会
前言
目录
第一章 半结构化数据的应用背景
第一节 研究背景
第二节 研究内容及意义
第三节 本书结构
第二章 半结构化数据的基础知识
第一节 半结构化数据的结构特征
第二节 半结构化数据的结构模型
第三节 半结构化数据的模式语言
第四节 半结构化数据的查询语言
第五节 半结构化数据的应用程序接口
第三章 半结构化数据的管理模型
第一节 半结构化数据模式提取的相关研究
第二节 半结构化数据节点编码的相关研究
第三节 半结构化数据索引的相关研究
第四节 半结构化数据查询处理的相关研究
第四章 半结构化数据的模式提取
第一节 半结构化数据的元素内容模型
第二节 基于正则表达式的模式提取方法
第三节 基于集合/序列的模式提取方法——XTree
第四节 实证研究
第五节 小结
第五章 半结构化数据的节点编码
第一节 半结构化数据节点编码的特点
第二节 D2编码方案
第三节 D2编码的二进制表示
第四节 实证研究
第五节 小结
第六章 半结构化数据的索引和查询处理
第一节 D2-Index索引策略
第二节 基于D2-Index索引策略的查询处理
第三节 实证研究
第四节 小结
第七章 半结构化数据与大数据
第一节 大数据时代来临
第二节 大数据基础
第三节 大数据应用
第八章 总结
第一节 主要内容
第二节 未来研究展望
参考文献
半结构化数据管理关键算法研究与实证是2018年由中国社会科学出版社出版,作者张引。
得书感谢您对《半结构化数据管理关键算法研究与实证》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。