在线文本数据挖掘算法原理与编程实现

在线文本数据挖掘算法原理与编程实现

我想读
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

全方位解读大数据背景下的文本分析核心算法,助力打造下一代AI。

内容简介

本书介绍了互联网环境下文本类型数据的分析方法,探讨了当前主流的文本挖掘技术,以及这些技术在商业环境中的具体应用。本书从算法原理和应用场景两方面分别对在线文本分析技术进行了介绍:从算法原理的角度,以数据挖掘和机器学习的相关知识为基础,介绍了以文本建模、文本分类、文本聚类、序列标注为主要任务的文本分析方法,并对当前主流的深度学习方法与文本分析的结合进行了讨论。从应用场景的角度,讨论了文本分析技术的几个重要实践领域,包括信息检索、内容摘要、口碑分析、社交网络分析以及智能系统。

作者简介

作者刘通,毕业于上海交通大学安泰经济与管理学院,获得博士研究生学位,多年从事动画、虚拟现实、手机游戏设计开发的研究。曾出版《PREMIERE PRO CS4 视频编辑与实战演练》《手机动画角色设计》目前就职于华为技术有限公司。

章节目录

版权信息

内容简介

前言

第1章 概述

1.1 网络运营与文本分析

1.2 文本分析的4V特征

1.3 在线文本分析应用

1.4 本章小结

第2章 预备知识

2.1 文本挖掘的主要任务

2.2 语义分析与语法分析

2.3 文本的结构化分析

2.4 文本的标准化分析

2.5 机器学习的基本概念

2.6 机器学习的重要问题

2.7 本章小结

第3章 文本建模

3.1 文本建模的基本概念

3.2 文本建模的应用场景

3.3 语言学建模概述

3.4 词标注分析

3.5 句法分析

3.6 知识库与语义网

3.7 统计学建模概述

3.8 向量空间模型

3.9 LSI模型

3.10 Unigram模型

3.11 pLSI模型

3.12 LDA主题模型

3.13 主题模型拓展

3.14 基于词汇的统计学建模方法

3.15 本章小结

第4章 文本分类

4.1 文本分类的基本概念

4.2 文本分类的应用场景

4.3 朴素贝叶斯模型

4.4 向量空间模型

4.5 SVM模型

4.6 文本分类的评价

4.7 分类特征优化

4.8 分类学习策略优化

4.9 本章小结

第5章 文本聚类

5.1 文本聚类的基本概念

5.2 文本聚类的应用场景

5.3 扁平式聚类

5.4 凝聚式聚类

5.5 聚类结果分析

5.6 聚类特征优化

5.7 半监督聚类

5.8 短文本聚类

5.9 流数据聚类

5.10 本章小结

第6章 序列标注

6.1 序列标注的基本概念

6.2 序列标注的应用场景

6.3 HMM

6.4 最大熵模型和最大熵马尔可夫模型

6.5 条件随机场

6.6 本章小结

第7章 信息检索

7.1 信息检索的基本概念

7.2 信息检索的应用场景

7.3 基于空间模型的信息检索

7.4 基于概率模型的信息检索

7.5 基于语言模型的信息检索

7.6 本章小结

第8章 文本摘要

8.1 文本摘要的基本概念

8.2 文本摘要的应用场景

8.3 关键词提取的特征设计

8.4 关键词提取的有监督算法

8.5 关键词提取的无监督算法

8.6 基于图模型的关键词提取算法

8.7 关键词提取的技术优化

8.8 关键短语提取

8.9 关键句提取

8.10 本章小结

第9章 口碑分析

9.1 口碑分析的基本概念

9.2 口碑分析的应用场景

9.3 基于词典的评价对象提取

9.4 基于语料的评价对象提取

9.5 评价水平量化

9.6 基于语言模型的情感分析技术

9.7 本章小结

第10章 社交网络分析

10.1 社交网络分析的基本概念

10.2 社交网络分析的应用场景

10.3 社交网络的虚拟社区发现

10.4 社交网络的用户影响力分析

10.5 社交网络的情感分析

10.6 社交网络的话题发现与演化

10.7 社交网络的信息检索

10.8 本章小结

第11章 深度学习与NLP

11.1 基本原理

11.2 词嵌入模型

11.3 RNN与NLP

11.4 本章小结

第12章 实证研究

12.1 研究框架

12.2 理论与模型

12.3 文本数据处理

12.4 研究结论

12.5 本章小结

第13章 总结

在线文本数据挖掘算法原理与编程实现是2019年由电子工业出版社出版,作者刘通。

得书感谢您对《在线文本数据挖掘算法原理与编程实现》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

你可能喜欢
机器学习算法评估实战 电子书

在机器学习算法的实际应用中,我们不仅要知道算法的原理,也要了解如何评估算法上线服务的可靠性。
治理与养护:实现海洋资源的可持续利用 电子书

本书在介绍国际上实现海洋资源可持续利用的做法的基础上,提出可行建议。
Go语言高级编程 电子书

Go语言进阶实战,CGO编程web编程书。
函数式编程思维 电子书

Java等现代编程语言中出现了越来越多的函数式特性,跟随这本书,去了解语法表象之下真正需要掌握的新思维。
C++ 黑客编程揭秘与防范(第3版) 电子书

反病毒工程师入门精选,包含反病毒领域的所有知识,是亿万读者的引路名师。
人工智能云平台:原理、设计与应用 电子书

从原理到应用,全面、深入地学习人工智能云平台。