数字文献资源高维聚合模型研究

数字文献资源高维聚合模型研究

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

基于元数据的文献聚类新算法研究

内容简介

针对文本挖掘和信息检索中的文本或文献聚类与分类等问题,学术界基于VSM(向量空间模型)主要有两方面的研究,一者是文献表示模型的改进,二者是算法的改进。然而传统的算法对高维稀疏的向量聚类存在不足,一些新的算法也不尽完美,更主要的是聚类算法的效果与数据本身的特征以及信息提取和表示密切相关,特别是在信息有限的情况下,聚类算法的优势也不能得到完美发挥,相比之下,信息的挖掘、提取和文献向量表示就尤为重要。在本文仅限于元数据甚至只有关键词的前提下,文献的表示向量相比一般文本表示就表现得非常稀疏,面对这种情形聚类算法即使是“巧妇”也“难为无米之炊”,因此,本书的重点突破是文献主题语义信息的提取、度量和文献高维向量的新表示方法。基于以上问题和现象,本书以数字文献资源为对象,本着在信息资源聚合中减少对背景知识的依赖,便于推广应用的宗旨,提出了基于文献集本身或者相关领域的共现信息而实现文献聚合的共现潜在语义向量空间模型(CLSVSM)。而且通过实验证实基于CLSVSM的文献聚类表现比基于VSM和GVSM(广义向量空间模型)显著地好。

章节目录

封面

书名页

版权页

内容简介

作者简介

目录

引言

一 研究背景和意义

二 国内外研究综述

三 研究目的、方法与创新

第一章 数字文献资源聚合的概念与理论基础

一 数字文献资源的范畴

二 数字文献资源聚合的内涵与外延

三 数字文献资源聚合研究的形式和内容

四 数字文献资源聚合研究的理论基础

五 数字文献资源聚合的应用方法研究

六 数字文献资源基于元数据聚合的探索

七 本章小结

第二章 数字文献资源的高维向量表示与语义相关性研究

一 数字文献资源的多元和高维特征

二 文献主题的特征选择与评价方法

三 文献特征的高维表示与文献相似性测度方法

四 向量空间模型及其衍生模型

五 语义向量空间模型

六 本章小结

第三章 共现潜在语义向量空间模型(CLSVSM)

一 共现潜在语义的概念

二 基于共现潜在语义的文献高维向量表示模型

三 语义信息的增强与约简探讨

四 基于CLSVSM的数字文献资源聚合

五 CLSVSM模型与VSM衍生模型的类比

六 本章小结

第四章 CLSVSM模型的实验检验与评价

一 文献聚类实验的基本设计

二 文献聚类评价方法

三 高维向量聚类工具:gCLUTO

四 实验文献集的来源与描述

五 文献聚类实验内容与方案

六 文献聚类实验结果与分析

七 本章小结

第五章 CLSVSM模型的应用与实证

一 CLSVSM模型的应用范围

二 实证准备

三 基于CLSVSM模型的聚合实证研究

四 本章小结

第六章 CLSVSM模型的进一步研究

一 共现潜在语义的不同估计量对比研究

二 CLSVSM对英文文献的适应性研究

三 共现矩阵的约简研究

四 共现潜在语义核研究

五 三元共现的挖掘与利用研究

六 本章小结

第七章 总结与展望

一 总结与启示

二 不足与展望

参考文献

致谢

数字文献资源高维聚合模型研究是2017年由中国社会科学出版社出版,作者牛奉高。

得书感谢您对《数字文献资源高维聚合模型研究》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
图解数学思维训练课:建立孩子的数学模型思维(乘法与除法应用训练课) 电子书
聂卫平围棋习题精解 手筋专项训练 从10级到5级 电子书
“棋圣”聂卫平、围棋世界冠军柯洁亲自作序, 檀啸、周睿羊、王晨星、赵守洵、刘星等众多围棋冠军、知名棋士联袂推荐! 聂卫平教练多年教学经验总结,聂卫平围棋道场一线教师邵佳潜心研究编写 本书特点: 1.适合从10级到5级的围棋学习者练习使用 2.内容提供660道习题及其答案,内容覆盖吃子技巧、对杀、连接、分断和实战技巧 3.习题难度适宜,循序渐进 4.采用“知识点复习 例题热身 实战习题 答案解析”的模式,让围棋初学者反覆练习和夯实围棋基础 5.可与“聂卫平围棋教程”系列图书配合使用
度量 电子书
这是一个很好的几何学和微积分的替代教程,让数学不再令人望而却步,让你也重新爱上数学。
奇妙量子世界:人人都能看懂的量子科学漫画 电子书
科学研究精华汇集,量子前沿科普开山之作。
普林斯顿概率论读本 电子书
本书既可以作为经典概率论图书的补充,也可以作为学习概率论的主要教材。