100 条"文本挖掘:基于R语言的整洁工具"搜索结果
  • [美]茱莉亚·斯拉格
  • 本书介绍了如何使用tidytext包以及其他基于R语言的tidy工具来进行文本挖掘。
文本数据挖掘——基于R语言 电子书
  • 黄天元
  • 文本是一种特殊的非结构化数据,在当今的大数据时代,其价值日趋凸显。本书利用开源而强大的R软件,对文本数据挖掘的概念、技术及技巧进行了系统的介绍。本书共11章,内容包括:走进文本数据挖掘,R语言快速入门,字符串的基本处理,用好正则表达式,导入各类文本数据,对各类文本数据进行预处理,文本特征提取的4种方法,基于机器学习的文本分类方法,文本情感分析,文本可视化,文本数据挖掘项目实践。本书还提供了丰富的应
数据挖掘——基于R语言的实战 电子书
  • 张俊妮
  • 本书以深入浅出的语言系统地讲解了数据挖掘的框架和基本方法,主要内容包括:数据挖掘与R语言概述、数据理解、数据准备、关联规则挖掘、聚类分析、线性模型与广义线性模型、神经网络的基本方法、决策树、基于决策树的模型组合、模型评估与比较。本书使用基于R语言的数据挖掘案例贯穿全书,并辅以上机实验和习题,帮助读者熟练使用R语言进行数据挖掘。
R语言编程:基于tidyverse 电子书
  • 张敬信
  • 一本基于tidyverse入门R语言编程的书。
数据可视化——基于R语言 电子书
  • 贾俊平
  • 本书以R语言为实现工具,以数据可视化分析为导向,结合实际案例介绍数据可视化方法。全书共8章,第1章介绍数据可视化概述以及R语言数据处理的基本技能;第2章介绍R语言绘图基础,重点介绍R语言传统绘图包graphics中的绘图函数及基本使用方法;第3章介绍类别数据的可视化方法;第4章介绍数据分布特征的可视化方法;第5章介绍变量间关系的可视化方法;第6章介绍样本相似性的可视化方法;第7章介绍时间序列的可视
R语言数据分析与挖掘(微课版) 电子书
  • 谢佳标 编著
  • 本书由浅入深,内容丰富。全书共11章,主要内容包括第1章R语言数据分析概述、第2章R语言数据操作基础、第3章数据读写、第4章数据预处理、第5章数据的描述统计分析、第6章数据相关性分析、第7章R语言可视化基础、第8章高级可视化工具、第9章聚类分析、第10章关联规则、第11章分类及预测。
基于文献和新闻数据的“海上丝绸之路”文本挖掘研究 电子书
  • 王婷婷
  • 本书内容包括绪论;相关概念、技术与理论基础研究;LDA主题模型及其文献的量化综述研究;基于传统LDA模型的“海上丝绸之路”文献文本数据分析等共10章。
R语言编程基础 电子书
  • 林智章
  • 《R语言学习手册》:7章全面介绍R语言及Rattle工具,附课后习题。
R语言在统计中的应用 电子书
  • 薛毅 陈立萍
  • 本书按照统计学的结构来编排,在介绍完相关的统计知识后,着重介绍如何用R求解统计问题。因此,本书并不是简单的R使用手册,而是将统计知识、统计模型及R的求解过程融为一体的教科书。本书共9章,分别是:第1章绪论,介绍统计学及R的基本概念;第2章R语言入门,介绍R软件的下载与安装,以及R使用的基本方法;第3章数据的描述性分析,介绍描述数据的图形和数值方法;第4章概率、随机变量及其分布,介绍概率的基本知识和
R语言金融分析与建模 电子书
  • 严玉星
  • R语言量化分析与建模教程,以金融分析和建模为主题,讲解R在金融分析中的应用。
基于数据挖掘的软件缺陷预测技术 电子书
  • 马樱
  • 本专著主要基于软件领域数据的特性和预测模型的不同应用场景,对软件缺陷预测前言的若干关键技术进行了研究和总结。主要内容包括迁移学习环境下的缺陷预测技术,半监督环境下的缺陷预测技术,主动学习环境下的缺陷预测技术,基于核理论的缺陷预测技术,所应用的理论、算法及应用成果的介绍和展示。
代码整洁之道 电子书
  • 罗伯特·C.
  • “阅读这本书有两种原因:第一,你是个程序员;第二,你想成为更好的程序员。很好,IT行业需要更好的程序员!”——罗伯特·C.马丁(RobertC.Martin)尽管糟糕的代码也能运行,但如果代码不整洁,会使整个开发团队泥足深陷,写得不好的代码每年都要耗费难以计数的时间和资源。但是,这种情况并非无法避免。著名软件专家罗伯特·C.马丁(RobertC.Martin)在本书中为你呈现了革命性的视野。他携同ObjectMentor公司的同事,从他们有关整洁代码的佳敏捷实践中提炼出软件技艺的价值观,以飨读者,让你成为更优秀的程序员——只要你着手研读本书。阅读本书需要你做些什么呢?你将阅读代码——大量代码。本书会促使你思考何谓正确的代码,何谓错误的代码。更重要的是,本书将促使你重新评估自己的专业价值观,以及对自己技艺的承诺。书中的具体内容包括:·好代码和糟糕的代码之间的区别;·如何编写好代码,如何将糟糕的代码转化为好代码;·如何创建好名称、好函数、好对象和好类;·如何格式化代码以实现其可读性的大化;·如何在不妨碍代码逻辑的前提下充分实现错误处理;·如何进行单元测试和测试驱动开发。
铁路文本大数据分析挖掘研究及应用 电子书
  • 李平,杨连报
  • 本书阐述了铁路文本大数据分析挖掘的理论、技术及应用,内容包括:绪论、文本大数据分析挖掘基础、文本大数据分析挖掘理论体系、常用分析与挖掘工具包、铁路文本大数据分析挖掘平台研究、铁路安全文本大数据应用案例、铁路应急管理文本大数据应用案例。
大数据数学基础(R语言描述) 电子书
  • 程丹 张良均
  • 本书全面地讲解了在科学领域运用广泛的数据微积分、线性代数、统计学、数值计算、多元统计分析等数学基础知识。全书共6章:第1章介绍了大数据与数学、数学与R语言的关系;第2章介绍了微积分的基础知识,包括函数、极限、导数、微分、不定积分与定积分及其应用;第3章介绍了线性代数的基础知识,包括矩阵的运算、行列式、特征分解、奇异值分解;第4章介绍了统计学的基础知识,包括数据分布特征、概率论、随机变量的数字特征、
R语言与数据分析实战 电子书
  • 朱顺泉
  • 本书共13章,主要包括:数据分析概述及R语言环境,R语言的数据对象及其类型,R语言数据存储与读取,R语言编程,R语言可视化,R语言描述性统计,R语言参数估计,R语言参数假设检验等内容。
R语言医学数据分析实战 电子书
  • 赵军 编著
  • 以医学数据为例,讲解如何使用R进行数据分析。
R语言与医学统计图形 电子书
  • 张铁军
  • 本书主要讲述了R语言的绘图功能,主要从以下几点入手。第一,系统介绍了R语言基础绘图包中的常用绘图函数的使用方法和技巧;第二,详细介绍了当下十分流行的绘图包ggplot2的使用方法;第三,统计地图等其他常用的静态图形也在书中进行了详细讲解;此外,书中还介绍了用于结果呈现与汇报的动态交互图的绘制方法。本书是国内第一本十分系统的介绍R语言中几大绘图系统的图书,并且着重的关注医学研究领域,从易到难,从简单
R语言统计分析与应用 电子书
  • 汪海波
  • R统计软件是目前应用*广泛的统计软件之一,已广泛应用于医学、财经和社会科学等领域中进行数据管理和数据分析处理。本书以Windows操作系统下的R软件为基础,以实践中常用的统计分析方法为基本内容,介绍了R语言的编写以及结果解释。本书重点介绍了各种多元统计分析方法的基本原理及其应用,包括方差分析、多元线性回归、Logistic回归分析、生存分析、主成分分析、因子分析、聚类分析、判别分析以及典型相关分析
Python与R语言数据科学实践 电子书
  • J.
  • 本书从数据科学的角度,讲解了Python和R的语言特性以及各自的优缺点,介绍了包括包、框架和工作流在内的开源生态系统,分析了Python和R分别适用于哪些业务场景,并通过真实的案例演示如何在单个工作流中集成Python与R,使两种语言充分发挥优势,改善业务应用的效果。本书还提供了Python和R的对照翻译,帮助读者在两种语言间快速切换。本书适合数据科学领域有一定Python或R基础的开发人员阅读,
基于评论挖掘的中国旅游市场秩序评价研究 电子书
  • 童碧莎著
  • 童碧莎著的《基于评论挖掘的中国旅游市场秩序评价研究》围绕中国旅游市场秩序发展现状,运用评论挖掘的理论与方法,依托旅游网站的用户评论,构建了旅游市场秩序评价新方法,为旅游市场秩序评价的理论研究和实践工作提供了新的思路和视野。本书适合旅游管理专业研究人员、从业人员及高等院校相关专业学生阅读。
编写整洁的Python代码(第2版) 电子书