在线文本数据挖掘算法原理与编程实现

在线文本数据挖掘算法原理与编程实现

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

全方位解读大数据背景下的文本分析核心算法,助力打造下一代AI。

内容简介

本书介绍了互联网环境下文本类型数据的分析方法,探讨了当前主流的文本挖掘技术,以及这些技术在商业环境中的具体应用。本书从算法原理和应用场景两方面分别对在线文本分析技术进行了介绍:从算法原理的角度,以数据挖掘和机器学习的相关知识为基础,介绍了以文本建模、文本分类、文本聚类、序列标注为主要任务的文本分析方法,并对当前主流的深度学习方法与文本分析的结合进行了讨论。从应用场景的角度,讨论了文本分析技术的几个重要实践领域,包括信息检索、内容摘要、口碑分析、社交网络分析以及智能系统。

作者简介

作者刘通,毕业于上海交通大学安泰经济与管理学院,获得博士研究生学位,多年从事动画、虚拟现实、手机游戏设计开发的研究。曾出版《PREMIERE PRO CS4 视频编辑与实战演练》《手机动画角色设计》目前就职于华为技术有限公司。

章节目录

版权信息

内容简介

前言

第1章 概述

1.1 网络运营与文本分析

1.2 文本分析的4V特征

1.3 在线文本分析应用

1.4 本章小结

第2章 预备知识

2.1 文本挖掘的主要任务

2.2 语义分析与语法分析

2.3 文本的结构化分析

2.4 文本的标准化分析

2.5 机器学习的基本概念

2.6 机器学习的重要问题

2.7 本章小结

第3章 文本建模

3.1 文本建模的基本概念

3.2 文本建模的应用场景

3.3 语言学建模概述

3.4 词标注分析

3.5 句法分析

3.6 知识库与语义网

3.7 统计学建模概述

3.8 向量空间模型

3.9 LSI模型

3.10 Unigram模型

3.11 pLSI模型

3.12 LDA主题模型

3.13 主题模型拓展

3.14 基于词汇的统计学建模方法

3.15 本章小结

第4章 文本分类

4.1 文本分类的基本概念

4.2 文本分类的应用场景

4.3 朴素贝叶斯模型

4.4 向量空间模型

4.5 SVM模型

4.6 文本分类的评价

4.7 分类特征优化

4.8 分类学习策略优化

4.9 本章小结

第5章 文本聚类

5.1 文本聚类的基本概念

5.2 文本聚类的应用场景

5.3 扁平式聚类

5.4 凝聚式聚类

5.5 聚类结果分析

5.6 聚类特征优化

5.7 半监督聚类

5.8 短文本聚类

5.9 流数据聚类

5.10 本章小结

第6章 序列标注

6.1 序列标注的基本概念

6.2 序列标注的应用场景

6.3 HMM

6.4 最大熵模型和最大熵马尔可夫模型

6.5 条件随机场

6.6 本章小结

第7章 信息检索

7.1 信息检索的基本概念

7.2 信息检索的应用场景

7.3 基于空间模型的信息检索

7.4 基于概率模型的信息检索

7.5 基于语言模型的信息检索

7.6 本章小结

第8章 文本摘要

8.1 文本摘要的基本概念

8.2 文本摘要的应用场景

8.3 关键词提取的特征设计

8.4 关键词提取的有监督算法

8.5 关键词提取的无监督算法

8.6 基于图模型的关键词提取算法

8.7 关键词提取的技术优化

8.8 关键短语提取

8.9 关键句提取

8.10 本章小结

第9章 口碑分析

9.1 口碑分析的基本概念

9.2 口碑分析的应用场景

9.3 基于词典的评价对象提取

9.4 基于语料的评价对象提取

9.5 评价水平量化

9.6 基于语言模型的情感分析技术

9.7 本章小结

第10章 社交网络分析

10.1 社交网络分析的基本概念

10.2 社交网络分析的应用场景

10.3 社交网络的虚拟社区发现

10.4 社交网络的用户影响力分析

10.5 社交网络的情感分析

10.6 社交网络的话题发现与演化

10.7 社交网络的信息检索

10.8 本章小结

第11章 深度学习与NLP

11.1 基本原理

11.2 词嵌入模型

11.3 RNN与NLP

11.4 本章小结

第12章 实证研究

12.1 研究框架

12.2 理论与模型

12.3 文本数据处理

12.4 研究结论

12.5 本章小结

第13章 总结

在线文本数据挖掘算法原理与编程实现是2019年由电子工业出版社出版,作者刘通。

得书感谢您对《在线文本数据挖掘算法原理与编程实现》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
计算思维与算法设计基础 电子书
本书内容共8章,按照问题求解所需,涵盖了C语言的3个基本结构、函数、数组、指针、结构体和文件等知识。
数学建模实例与优化算法 电子书
本书共分9章内容:数学建模概述、用初等数学解决的问题、与利息有关的经济问题、运用微积分方法解决的问题、线性规划问题、网络优化问题、层次分析法应用实例、优化算法简介、其他应用实例。
在线视频技术精要 电子书
音视频、开发、人工智能、编解码,帮你构建在线视频技术的全景图在线视频技术。
智能推荐算法与系统构建实践 电子书
本书从系统视角出发,阐述如何利用技术手段搭建企业级推荐系统,内容包括认知篇、数据篇、召回篇、排序篇、系统篇5个部分,覆盖企业级推荐系统建设的核心要点。本书知识体系清晰,从基础知识切入,逐步深入,先后涉及推荐系统的经典技术、主流技术和前沿技术。本书通过“理论+案例+代码示例+心得体会”的方式阐述、归纳和总结推荐系统的知识,帮助读者理解推荐系统,掌握技能,建立系统思维。本书适合对推荐系统感兴趣的初学者
空间智能原理与应用 电子书
本书从空间信息处理角度出发,将人工智能领域的理论研究与专业实践相结合,完整介绍人工智能方法及其在空间信息处理中的应用,不仅涵盖人工智能领域的基础概念与基本方法,而且探讨知识图谱、计算智能、新兴机器学习、深度学习等前沿技术,同时介绍人工智能在地理文本大数据、遥感影像、激光点云等空间信息处理中的应用实例,具有较强的代表性和启发性。本书可以作为高等院校空间信息与数字技术、遥感科学与技术等专业高年级本科生