R语言实战(第2版)

R语言实战(第2版)

编辑推荐

本书适合数据分析人员及R用户学习参考。

内容简介

本书注重实用性,是一本全面而细致的R指南,高度概括了该软件和它的强大功能,展示了使用的统计示例,且对于难以用传统方法处理的凌乱、不完整和非正态的数据给出了优雅的处理方法。作者不仅仅探讨统计分析,还阐述了大量探索和展示数据的图形功能。新版做了大量更新和修正,新增了近200页内容,介绍数据挖掘、预测性分析和高级编程。

作者简介

作者Robert I. Kabacoff,R语言社区著名学习网站Quick-R的维护者,现为全球化开发与咨询公司Management研究集团研发副总裁。此前,Kabacoff博士是佛罗里达诺瓦东南大学的教授,讲授定量方法和统计编程的研究生课程。Kabacoff还是临床心理学博士、统计顾问,擅长数据分析,在健康、金融服务、制造业、行为科学、政府和学术界有20余年的研究和统计咨询经验。

章节目录

版权信息

版权声明

对第1版的赞誉

致谢

前言

关于本书

第2版的不同之处

读者对象

本书结构

对数据挖掘者的建议

例子

排版约定

作者在线

关于封面图片

第一部分 入门

第1章 R语言介绍

1.1 为何要使用R

1.2 R的获取和安装

1.3 R的使用

1.4 包

1.5 批处理

1.6 将输出用为输入:结果的重用

1.7 处理大数据集

1.8 示例实践

1.9 小结

第2章 创建数据集

2.1 数据集的概念

2.2 数据结构

2.3 数据的输入

2.4 数据集的标注

2.5 处理数据对象的实用函数

2.6 小结

第3章 图形初阶

3.1 使用图形

3.2 一个简单的例子

3.3 图形参数

3.4 添加文本、自定义坐标轴和图例

3.5 图形的组合

3.6 小结

第4章 基本数据管理

4.1 一个示例

4.2 创建新变量

4.3 变量的重编码

4.4 变量的重命名

4.5 缺失值

4.6 日期值

4.7 类型转换

4.8 数据排序

4.9 数据集的合并

4.10 数据集取子集

4.11 使用SQL语句操作数据框

4.12 小结

第5章 高级数据管理

5.1 一个数据处理难题

5.2 数值和字符处理函数

5.3 数据处理难题的一套解决方案

5.4 控制流

5.5 用户自编函数

5.6 整合与重构

5.7 小结

第二部分 基本方法

第6章 基本图形

6.1 条形图

6.2 饼图

6.3 直方图

6.4 核密度图

6.5 箱线图

6.6 点图

6.7 小结

第7章 基本统计分析

7.1 描述性统计分析

7.2 频数表和列联表

7.3 相关

7.4 t检验

7.5 组间差异的非参数检验

7.6 组间差异的可视化

7.7 小结

第三部分 中级方法

第8章 回归

8.1 回归的多面性

8.2 OLS回归

8.3 回归诊断

8.4 异常观测值

8.5 改进措施

8.6 选择“最佳”的回归模型

8.7 深层次分析

8.8 小结

第9章 方差分析

9.1 术语速成

9.2 ANOVA模型拟合

9.3 单因素方差分析

9.4 单因素协方差分析

9.5 双因素方差分析

9.6 重复测量方差分析

9.7 多元方差分析

9.8 用回归来做ANOVA

9.9 小结

第10章 功效分析

10.1 假设检验速览

10.2 用pwr包做功效分析

10.3 绘制功效分析图形

10.4 其他软件包

10.5 小结

第11章 中级绘图

11.1 散点图

11.2 折线图

11.3 相关图

11.4 马赛克图

11.5 小结

第12章 重抽样与自助法

12.1 置换检验

12.2 用coin包做置换检验

12.3 lmPerm包的置换检验

12.4 置换检验点评

12.5 自助法

12.6 boot包中的自助法

12.7 小结

第四部分 高级方法

第13章 广义线性模型

13.1 广义线性模型和glm()函数

13.2 Logistic回归

13.3 泊松回归

13.4 小结

第14章 主成分分析和因子分析

14.1 R中的主成分和因子分析

14.2 主成分分析

14.3 探索性因子分析

14.4 其他潜变量模型

14.5 小结

第15章 时间序列

15.1 在R中生成时序对象

15.2 时序的平滑化和季节性分解

15.3 指数预测模型

15.4 ARIMA预测模型

15.5 延伸阅读

15.6 小结

第16章 聚类分析

16.1 聚类分析的一般步骤

16.2 计算距离

16.3 层次聚类分析

16.4 划分聚类分析

16.5 避免不存在的类

16.6 小结

第17章 分类

17.1 数据准备

17.2 逻辑回归

17.3 决策树

17.4 随机森林

17.5 支持向量机

17.6 选择预测效果最好的解

17.7 用rattle包进行数据挖掘

17.8 小结

第18章 处理缺失数据的高级方法

18.1 处理缺失值的步骤

18.2 识别缺失值

18.3 探索缺失值模式

18.4 理解缺失数据的来由和影响

18.5 理性处理不完整数据

18.6 完整实例分析(行删除)

18.7 多重插补

18.8 处理缺失值的其他方法

18.9 小结

第五部分 技能拓展

第19章 使用ggplot2进行高级绘图

19.1 R中的四种图形系统

19.2 ggplot2包介绍

19.3 用几何函数指定图的类型

19.4 分组

19.5 刻面

19.6 添加光滑曲线

19.7 修改ggplot2图形的外观

19.8 保存图形

19.9 小结

第20章 高级编程

20.1 R语言回顾

20.2 环境

20.3 面向对象的编程

20.4 编写有效的代码

20.5 调试

20.6 深入学习

20.7 小结

第21章 创建包

21.1 非参分析和npar包

21.2 开发包

21.3 创建包的文档

21.4 建立包

21.5 深入学习

21.6 小结

第22章 创建动态报告

22.1 用模版生成报告

22.2 用R和Markdown创建动态报告

22.3 用R和LaTeX创建动态报告

22.4 用R和Open Document创建动态报告

22.5 用R和Microsoft Word创建动态报告

22.6 小结

第23章 使用lattice进行高级绘图

23.1 lattice包

23.2 调节变量

23.3 面板函数

23.4 分组变量

23.5 图形参数

23.6 自定义图形条带

23.7 页面布局

23.8 深入学习

附录 A 图形用户界面

附录 B 自定义启动环境

附录 C 从R中导出数据

C.1 符号分隔文本文件

C.2 Excel电子表格

C.3 统计学程序

附录 D R中的矩阵运算

附录 E 本书中用到的扩展包

附录 F 处理大数据集

F.1 高效程序设计

F.2 在内存之外存储数据

F.3 用于大数据的分析包

F.4 超大数据集的全面解决方案

附录 G 更新R

G.1 自动安装(仅适用于Windows)

G.2 手动安装(Windows和Mac OS X)

G.3 更新R(Linux)

后记:探索R的世界

参考文献

看完了

R语言实战(第2版)是2016年由人民邮电出版社出版,作者[美]卡巴科弗。

得书感谢您对《R语言实战(第2版)》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

你可能喜欢
Spark快速大数据分析(第2版) 电子书

涵盖Spark3.0的新特性,着重展示如何利用机器学习算法执行大数据分析。
统计思维:程序员数学之概率统计(第2版) 电子书

本书介绍了如何借助计算而非数学方法,使用Python语言对数据进行统计分析。
大数据分析与挖掘 电子书

数据科学与大数据技术专业系列规划教材。强调概念+算法实践,让你“小数据”上会“算”,“大数据”上“算得快”。
IBM SPSS Modeler 18.0数据挖掘权威指南 电子书

联袂推荐暨南大学教授、博士生导师刘建平,暨南大学研究生院副院长、经济学院统计学系副主任、教授、博士生导师陈光慧,天善智能创始人梁勇,IBM技术专家刘咏梅,IBM数据科学家钟云飞...
跟着迪哥学:Python数据分析与机器学习实战 电子书

本书适合对人工智能、机器学习、数据分析等方向感兴趣的初学者和爱好者。
大数据时代的数据挖掘 电子书

(1)内容全面,覆盖当前数据挖掘的主要应用。在介绍每个应用案例时,详细阐述应用的背景,该领域中数据的来源和特点,数据采集与预处理方式,应用领域中数据挖掘的任务和实施数据挖掘技术...