文本数据挖掘——基于R语言

文本数据挖掘——基于R语言

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

内容简介

文本是一种特殊的非结构化数据,在当今的大数据时代,其价值日趋凸显。本书利用开源而强大的R软件,对文本数据挖掘的概念、技术及技巧进行了系统的介绍。本书共11章,内容包括:走进文本数据挖掘,R语言快速入门,字符串的基本处理,用好正则表达式,导入各类文本数据,对各类文本数据进行预处理,文本特征提取的4种方法,基于机器学习的文本分类方法,文本情感分析,文本可视化,文本数据挖掘项目实践。本书还提供了丰富的应用案例和程序源代码引导读者高效学习。 本书适合对文本数据挖掘感兴趣的学生、科研人员和数据科学从业者阅读。同时,本书还可以作为工具书,为需要经常进行文本数据挖掘的读者提供快速检索。

文本数据挖掘——基于R语言是2021年由机械工业出版社出版,作者黄天元。

得书感谢您对《文本数据挖掘——基于R语言》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

你可能喜欢
计算机网络技术入门教程(项目式) 电子书
内容提要本书是计算机网络技术的入门级教材,它打破了传统的课程教学模式,以职业能力为导向,构建以项目为载体的课程体系。本书将理论教学和实践教学融为一体,由浅入深构建了7个项目,包括认知网络、双机直连、组建简单的局域网、配置和管理网络、配置Internet接入、组建小型无线局域网、构建安全的校园网络,内容涵盖网络体系结构、局域网技术、网络传输介质与网络设备、IP地址、网络共享、网络接入技术、网络服务配
计算机视觉教程(第2版) 电子书
本书系统地介绍了计算机视觉的基本原理、典型方法和实用技术,内容包括图像采集、图像预处理、基元检测、目标分割、目标表达和描述、纹理特性分析、形状特性分析、立体视觉、三维景物恢复、运动特性分析、景物识别、广义匹配、时空行为了解、场景解释及计算机视觉系统。读者可从中了解计算机视觉的基本原理和典型技术,并能据此解决计算机视觉应用中的一些具体问题。本书提供了许多讲解例题,每章均有要点小结、参考文献介绍和练习
计算思维的结构 电子书
这是一本讲述计算思维的入门书,适合大学新生,以及所有希望提高问题求解、系统设计和人类行为理解能力的人阅读。本书的结构建立在计算机方法论的结构框架之上,重点放在计算机科学中的不同抽象层次的“自动有效进行”方面,着力于一般(类)问题的有效求解。这样做的好处是:一方面,从类问题求解的思维模式上帮助大学新生顺利过渡到大学学习中来;另一方面,强调计算机科学中抽象层次的概念,可以降低不同学科人们沟通的复杂程度
计算机网络技术基础(第2版) 电子书
本书是一本计算机网络技术的基础教程。全书共15章,前14章系统地介绍了计算机网络基础知识、数据通信技术、计算机网络体系结构与协议、局域网、广域网接入技术、网络互联技术、Internet基础知识、Internet接入技术、Internet的应用、移动IP与下一代Internet、网络操作系统、网络安全、网络管理、云计算与网联网,**后1章为实验部分。为了让读者能够及时地检查学习效果,巩固所学知识,每
JUnit实战(第3版) 电子书
本书全面介绍JUnit5的新特性及其主要应用。全书共22章,分为五部分。第一部分介绍JUnit的核心、JUnit的体系结构、从JUnit4向JUnit5迁移、软件测试原则等内容;第二部分介绍软件测试质量、用stub和mockobject进行测试、容器内测试等内容;第三部分介绍用Maven和Gradle工具运行JUnit测试、IDE对JUnit5的支持、JUnit5的持续集成等内容;第四部分介绍JU