数据挖掘与数据分析:基于R语言

数据挖掘与数据分析:基于R语言

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

详解数据挖掘技术的理论知识与R语言的实战应用。

内容简介

本书首先介绍了R语言的相关知识,包括R语言基础、R语言可视化技术。随后本书详细介绍了数据挖掘与数据分析中重要的理论方法与基础知识,包括线性回归、逻辑回归、决策树与回归树、随机森林、贝叶斯分类器等内容,并展示了如何将R语言用到这些方法的具体场景中。

章节目录

版权信息

前言

第1章 R语言基础

学习目标

应用背景介绍

1.1 R语言中的数据读取和数据导出

1.1.1 第一个R会话

1.1.2 变量赋值

1.1.3 从文件中读取数据

1.1.4 从R语言的包中获取数据

1.1.5 导出数据

1.2 R语言中的数据类型和对象

1.2.1 数据类型

1.2.2 R语言中的向量

1.2.3 R语言中的矩阵

1.2.4 R语言中的数据框

1.2.5 R语言中的列表

1.2.6 R语言中的因子

1.3 R语言中的控制语句及函数

1.3.1 if分支

1.3.2 for循环

1.3.3 while循环

1.3.4 switch语句

1.3.5 自定义函数

1.3.6 R语言中的内置函数

1.4 R语言中的数据处理

1.4.1 从数据集中提取信息

1.4.2 缺失信息处理

1.4.3 运算符

1.4.4 替换现有字段中的数据

1.4.5 变量的重命名

1.4.6 数字的四舍五入

1.4.7 子集数据

1.4.8 随机抽样

1.4.9 apply()函数集合

1.4.10 数据类型转换

1.4.11 数据聚合

1.4.12 文本数据排序

1.4.13 数据合并

1.4.14 table()函数

1.5 R包

1.5.1 dplyr包

1.5.2 tidyr包

本章小结

课后习题

第2章 R语言可视化技术

学习目标

应用背景介绍

2.1 ggplot2的图层语法

2.1.1 图像的组成

2.1.2 散点图示例

2.2 图层

2.2.1 绘图对象

2.2.2 几何对象

2.2.3 统计变换

2.2.4 位置调整

2.3 图像细节调整

2.3.1 标度

2.3.2 坐标系

2.3.3 分面

2.3.4 主题

2.4 常用工具图的绘制

2.4.1 条形图与直方图

2.4.2 折线图与路线图

2.4.3 饼图

2.4.4 箱线图与小提琴图

2.4.5 QQ图

本章小结

课后习题

第3章 线性回归

学习目标

应用背景介绍

3.1 线性回归模型的基本形式

3.2 线性回归模型参数的估计

3.3 自变量为分类变量的处理

3.4 线性回归模型的显著性检验

3.5 线性回归中的多重共线性

3.6 线性回归模型的拟合优度

3.7 回归诊断

3.7.1 异常点识别

3.7.2 线性关系检验

3.7.3 残差的正态性检验

3.8 线性回归的R语言实现

本章小结

课后习题

第4章 逻辑回归

学习目标

应用背景介绍

4.1 逻辑回归原理

4.1.1 逻辑回归模型简介

4.1.2 逻辑回归函数

4.1.3 逻辑回归推导

4.2 逻辑回归算法示例

4.3 模型理解

4.4 R语言编程

4.4.1 数据导入

4.4.2 数据预处理

4.4.3 逻辑回归模型训练

4.4.4 逻辑回归模型验证

本章小结

课后习题

第5章 决策树与回归树

学习目标

应用背景介绍

5.1 CART算法原理

5.1.1 决策树生成

5.1.2 决策树剪枝

5.2 CART算法示例

5.3 模型理解

5.3.1 决策树模型的优缺点

5.3.2 决策树模型实践建议

5.3.3 连续属性离散化

5.4 R语言编程

5.4.1 数据导入

5.4.2 数据预处理

5.4.3 决策树模型训练

5.4.4 决策树模型验证

本章小结

课后习题

第6章 随机森林

学习目标

应用背景介绍

6.1 随机森林方法原理

6.1.1 bagging介绍

6.1.2 随机森林介绍

6.2 模型理解

6.2.1 随机森林模型的优缺点

6.2.2 随机森林模型应用

6.3 R语言编程

6.3.1 数据导入

6.3.2 数据预处理

6.3.3 随机森林模型训练

6.3.4 随机森林模型验证

本章小结

课后习题

第7章 贝叶斯分类器

学习目标

应用背景介绍

7.1 贝叶斯定理

7.2 朴素贝叶斯分类器

7.2.1 朴素贝叶斯分类器的工作流程

7.2.2 估计类别下属性划分的条件概率

7.2.3 Laplace校准

7.2.4 朴素贝叶斯分类器的特征

7.3 贝叶斯信念网络

7.3.1 模型表示

7.3.2 构建BBN模型

7.3.3 BBN案例分析

7.3.4 贝叶斯网络的特征

7.4 R语言编程

7.4.1 朴素贝叶斯分类器应用实例

7.4.2 贝叶斯网络应用示例

本章小结

课后习题

第8章 层次聚类

学习目标

应用背景介绍

8.1 算法原理

8.1.1 凝聚层次聚类

8.1.2 分裂层次聚类

8.2 算法示例

8.3 模型理解

8.3.1 层次聚类的优缺点

8.3.2 距离度量的选择

8.4 R语言编程

8.4.1 数据导入

8.4.2 数据预处理

8.4.3 聚类分组

8.4.4 结果分析

本章小结

课后习题

第9章 K均值聚类

学习目标

应用背景介绍

9.1 算法原理

9.1.1 算法步骤

9.1.2 最优K值选择

9.1.3 距离度量

9.1.4 K均值聚类算法延伸

9.2 算法示例

9.3 模型理解

9.4 R语言编程

9.4.1 数据导入

9.4.2 数据预处理

9.4.3 确定最佳K值

9.4.4 聚类及可视化

本章小结

课后习题

第10章 关联规则分析

学习目标

应用背景介绍

10.1 关联分析与概率统计

10.2 关联规则的挖掘

10.2.1 关联规则的基本概念

10.2.2 关联规则的挖掘

10.3 Apriori算法原理

10.3.1 Apriori算法的基本框架

10.3.2 Fk-1×Fk-1方法

10.3.3 Fk-1×Fk-1方法的备用方式

10.3.4 规则生成

10.4 R语言编程

10.4.1 数据导入

10.4.2 数据预处理

10.4.3 Apriori算法建模

10.4.4 结果分析

10.4.5 疾病数据分析

本章小结

课后习题

第11章 案例分析之随机森林

学习目标

案例背景

11.1 案例介绍

11.2 描述分析

11.3 模型构建

11.4 结果分析

本章小结

第12章 案例分析之K均值聚类

学习目标

案例背景

12.1 案例介绍

12.2 客户细分变量提取

12.2.1 客户意愿细分变量

12.2.2 客户价值细分变量

12.3 数据收集

12.3.1 客户意愿数据

12.3.2 客户价值数据

12.4 数据预处理

12.4.1 数据清洗与整理

12.4.2 离群值处理

12.4.3 标准化处理

12.4.4 One-Hot编码

12.4.5 Binary编码

12.5 K均值聚类

12.5.1 K值确定

12.5.2 聚类及可视化

12.6 对策与建议

本章小结

参考文献

数据挖掘与数据分析:基于R语言是2023年由机械工业出版社出版,作者王阳 主编。

得书感谢您对《数据挖掘与数据分析:基于R语言》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
R语言编程:基于tidyverse 电子书
一本基于tidyverse入门R语言编程的书。
大数据时代的数据挖掘 电子书
(1)内容全面,覆盖当前数据挖掘的主要应用。在介绍每个应用案例时,详细阐述应用的背景,该领域中数据的来源和特点,数据采集与预处理方式,应用领域中数据挖掘的任务和实施数据挖掘技术的难点。同时提供相应的数据挖掘算法分析、工具设计以及系统实现。 (2)条理清晰、便于理解。一方面,面向热爱和关心数据挖掘技术的学术界和工业界读者,帮助他们更好地理解研究的目的和应用的基础;另一方面,让没有太多相关技术背景的读者可以通过阅读本书能够了解数据挖掘的意义和价值,可以看出数据挖掘是如何被广泛地应用于实际案例并成为解决各种问题的核心工具。
大数据:挖掘数据背后的真相 电子书
无须数学、统计学基础,轻松掌握大数据。
Python数据分析与应用 电子书
本书采用了以任务为导向的教学模式,按照解决实际任务的工作流程路线,逐步展开介绍相关的理论知识点,推导生成可行的解决方案, 后落实在任务实现环节。 全书大部分章节紧扣任务需求展开,不堆积知识点,着重于解决问题时思路的启发与方案的实施。通过从任务需求到实现这一完整工作流程的体验,帮助读者真正理解与消化Python数据分析与应用。 书中案例全部源于企业真实项目,可操作性强,引导读者融会贯通,并提供源代码等相关学习资源,帮助读者快速掌握大数据相关技能。
Excel数据分析与处理 电子书
全书分为4篇:第1篇为应用基础篇,主要介绍Excel的基本功能和基本操作;第2篇为数据处理篇,主要介绍使用公式和函数实现数据处理的方法,以及直观显示数据的方法;第3篇为数据分析篇,主要介绍Excel数据管理、数据分析方面的基本功能和分析方法;第4篇为拓展应用篇,主要介绍宏和协同功能。