深入浅出R语言数据分析

深入浅出R语言数据分析

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

R语言数据分析实用指南,适用于专业学生及从业人员。

内容简介

本书介绍了R语言在数据分析中的应用,讲解了数据分析的基本内容,数据分析的实现过程。介绍了数据分析过程中如何进行数据处理,数据探索。数据分析过程中常用的机器学习模型,介绍了文本挖掘,社交网络分析等等内容。本书介绍了数据分析的相关内容,其中避免了复杂的理论讨论,更加偏重于数据分析的实现与应用,有非常高的实用价值。本书适用于,统计学,计算机,机器学习,数学等相关专业的本科,研究生使用,同样也能够帮助互联网,市场营销等从业人员解决实际问题。

章节目录

版权信息

作者简介

内容简介

前言

第1章 数据分析项目的流程

1.1 数据分析项目中的角色

1.2 数据分析项目的阶段

1.3 总结

第2章 数据的读取

2.1 RData数据

2.2 readr高效读取数据

2.3 读取Excel数据

2.4 读取SPSS、SAS、STATA数据

2.5 R语言操作数据库

2.6 总结

第3章 数据探索

3.1 缺失值的识别与处理

3.2 异常值

3.3 dlookr数据处理包

3.4 数据相关性

3.5 自动化创建数据探索报告

3.6 总结

第4章 生存分析

4.1 生存分析的基本内容

4.2 使用R语言进行生存分析

4.3 非参数模型

4.4 半参数模型生存分析方法

4.5 参数模型

4.6 随机生存森林模型

4.7 总结

第5章 主成分分析

5.1 概述

5.2 主成分分析详解

5.3 使用R语言进行主成分分析

5.4 总结

第6章 多维缩放

6.1 MDS的工作原理

6.2 在R语言中实现MDS

6.3 MDS的优点

6.4 总结

第7章 线性回归模型

7.1 线性回归模型概述

7.2 在R语言中实现回归模型

7.3 总结

第8章 逻辑回归模型

8.1 逻辑回归的原理

8.2 在R语言中实现逻辑回归模型

8.3 总结

第9章 聚类模型

9.1 概述

9.2 在R语言中实现聚类模型

9.3 总结

第10章 关联规则

10.1 关联规则概述

10.2 关联规则的基本概念

10.3 在R语言中实现关联规划

10.4 总结

第11章 随机森林

11.1 随机森林的基本概念

11.2 在R语言中实现随机森林

11.3 总结

第12章 支持向量机

12.1 概述

12.2 在R语言中实现支持向量机

12.3 总结

第13章 神经网络

13.1 概述

13.2 在R语言中实现神经网络

13.3 总结

第14章 文本挖掘

14.1 概述

14.2 text2vec背景及其基本原理

14.3 DTM与TFIDF的原理和实现

14.4 情感分析

14.5 LDA主题模型及其实现

14.6 构建自动问答系统

14.7 总结

第15章 社交网络分析

15.1 社交网络概述

15.2 igraph简介

15.3 社交网络的常见结构

15.4 社交网络分析算法

15.5 微博社交群体分析

15.6 总结

第16章 H2O机器学习

16.1 H2O机器学习平台

16.2 在R语言中使用H2O

16.3 H2O Flow

16.4 总结

第17章 R语言爬虫

17.1 快速爬取网页数据

17.2 rvest简介

17.3 爬取BOSS直聘数据

17.4 模拟登录

17.5 总结

深入浅出R语言数据分析是2020年由清华大学出版社出版,作者米霖。

得书感谢您对《深入浅出R语言数据分析》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
文本数据挖掘——基于R语言 电子书
文本是一种特殊的非结构化数据,在当今的大数据时代,其价值日趋凸显。本书利用开源而强大的R软件,对文本数据挖掘的概念、技术及技巧进行了系统的介绍。本书共11章,内容包括:走进文本数据挖掘,R语言快速入门,字符串的基本处理,用好正则表达式,导入各类文本数据,对各类文本数据进行预处理,文本特征提取的4种方法,基于机器学习的文本分类方法,文本情感分析,文本可视化,文本数据挖掘项目实践。本书还提供了丰富的应
数据可视化——基于R语言 电子书
本书以R语言为实现工具,以数据可视化分析为导向,结合实际案例介绍数据可视化方法。全书共8章,第1章介绍数据可视化概述以及R语言数据处理的基本技能;第2章介绍R语言绘图基础,重点介绍R语言传统绘图包graphics中的绘图函数及基本使用方法;第3章介绍类别数据的可视化方法;第4章介绍数据分布特征的可视化方法;第5章介绍变量间关系的可视化方法;第6章介绍样本相似性的可视化方法;第7章介绍时间序列的可视
数据挖掘——基于R语言的实战 电子书
本书以深入浅出的语言系统地讲解了数据挖掘的框架和基本方法,主要内容包括:数据挖掘与R语言概述、数据理解、数据准备、关联规则挖掘、聚类分析、线性模型与广义线性模型、神经网络的基本方法、决策树、基于决策树的模型组合、模型评估与比较。本书使用基于R语言的数据挖掘案例贯穿全书,并辅以上机实验和习题,帮助读者熟练使用R语言进行数据挖掘。
大数据数学基础(R语言描述) 电子书
本书全面地讲解了在科学领域运用广泛的数据微积分、线性代数、统计学、数值计算、多元统计分析等数学基础知识。全书共6章:第1章介绍了大数据与数学、数学与R语言的关系;第2章介绍了微积分的基础知识,包括函数、极限、导数、微分、不定积分与定积分及其应用;第3章介绍了线性代数的基础知识,包括矩阵的运算、行列式、特征分解、奇异值分解;第4章介绍了统计学的基础知识,包括数据分布特征、概率论、随机变量的数字特征、
Python与R语言数据科学实践 电子书
J.
本书从数据科学的角度,讲解了Python和R的语言特性以及各自的优缺点,介绍了包括包、框架和工作流在内的开源生态系统,分析了Python和R分别适用于哪些业务场景,并通过真实的案例演示如何在单个工作流中集成Python与R,使两种语言充分发挥优势,改善业务应用的效果。本书还提供了Python和R的对照翻译,帮助读者在两种语言间快速切换。本书适合数据科学领域有一定Python或R基础的开发人员阅读,