数据分析与挖掘:R语言

数据分析与挖掘:R语言

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

本书以R语言简介、数据挖掘基础为开篇,旨在让读者对所用工具及数据挖掘方法有所了解。

内容简介

本书深入地介绍了利用R语言进行数据分析及构建预测模型的多种实用方法,包括回归、聚类、关联和分类分析等常用学习算法的实现,每一种算法都通过具体案例详细说明构建模型、实现模型以及评价模型的过程。

本书系统讲解了相关的R语言的基础知识,包括环境准备以及数据转换、分析和结果可视化的方法等。

本书既可以作为相关专业数据分析的教材,也可以作为大数据网络培训或技术人员自学的参考资料。

作者简介

作者蔡银英,女,副教授,就职于重庆第二师范学院,主持市级重点项目一项,主研市级项目四项,主要负责数据分析,模型构建相关的工作。

章节目录

版权信息

内容简介

前言

第1章 R语言简介

1.1 获取R

1.2 R使用入门

1.2.1 R操作界面

1.2.2 RStudio窗口介绍

1.2.3 R的常用操作

1.3 R的简单操作

1.3.1 基本数学运算

1.3.2 变量

1.3.3 数据结构

1.4 R数据分析包

1.5 小结

参考文献

第2章 数据挖掘基础

2.1 数据挖掘的定义

2.2 数据探索及预处理

2.2.1 脏数据分析

2.2.2 数据特征分析

2.2.3 数据预处理

2.3 模型简介

2.3.1 聚类模型

2.3.2 回归模型

2.3.3 决策树

2.3.4 人工神经网络

2.3.5 关联规则分析模型

2.4 小结

参考文献

第3章 数据挖掘网站用户行为分析及网页智能推荐

3.1 背景与挖掘目标

3.2 用户分群

3.2.1 用户分群的分析方法

3.2.2 数据的抽取

3.2.3 数据的预处理与探索分析

3.2.4 用户分群结果

3.2.5 用户分群的应用

3.3 网页智能推荐

3.3.1 网页智能推荐的分析方法

3.3.2 数据的预处理

3.3.3 组合推荐模型

3.3.4 组合推荐结果

3.4 总结

3.4.1 相关结论及应用

3.4.2 相关的问题思考

参考文献

第4章 生活服务点评网站客户分群

4.1 背景与挖掘目标

4.2 分析方法与过程

4.2.1 数据抽取

4.2.2 数据探索

4.2.3 数据预处理

4.2.4 模型构建

4.3 小结

第5章 水冷中央空调系统的优化控制策略

5.1 背景及挖掘目标

5.2 分析的方法及流程

5.3 数据预处理

5.3.1 变量选取

5.3.2 数据探索

5.3.3 数据变换

5.4 优化控制模型

5.4.1 总耗电量与可控变量

5.4.2 冷却负载与可控变量

5.5 模型求解

5.5.1 工作日模型求解

5.5.2 确定状态值

5.6 总结

参考文献

第6章 电商评价文本的主题特征词分析

6.1 背景与挖掘目标

6.2 分析的方法及过程

6.2.1 评论数据采集

6.2.2 文本数据预处理

6.2.3 基于LDA主题模型的特征词分析

6.3 小结

参考文献

第7章 均线投资策略

7.1 背景及投资策略介绍

7.1.1 移动平均线相关理论介绍

7.1.2 名词及概念介绍

7.2 基于移动平均线的投资策略

7.2.1 单均线投资策略

7.2.2 双均线投资策略

7.3 双均线投资策略实际应用

7.3.1 双均线投资策略总体流程

7.3.2 数据获取

7.3.3 简单的K线图实现

7.3.4 均线模型

7.3.5 其他双均线策略的收益

7.4 主要结论及展望

7.4.1 结论

7.4.2 后续策略的展望

参考文献

致谢

数据分析与挖掘:R语言是2021年由电子工业出版社出版,作者蔡银英。

得书感谢您对《数据分析与挖掘:R语言》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
R语言编程基础 电子书
《R语言学习手册》:7章全面介绍R语言及Rattle工具,附课后习题。
R语言编程:基于tidyverse 电子书
一本基于tidyverse入门R语言编程的书。
大数据时代的数据挖掘 电子书
(1)内容全面,覆盖当前数据挖掘的主要应用。在介绍每个应用案例时,详细阐述应用的背景,该领域中数据的来源和特点,数据采集与预处理方式,应用领域中数据挖掘的任务和实施数据挖掘技术的难点。同时提供相应的数据挖掘算法分析、工具设计以及系统实现。 (2)条理清晰、便于理解。一方面,面向热爱和关心数据挖掘技术的学术界和工业界读者,帮助他们更好地理解研究的目的和应用的基础;另一方面,让没有太多相关技术背景的读者可以通过阅读本书能够了解数据挖掘的意义和价值,可以看出数据挖掘是如何被广泛地应用于实际案例并成为解决各种问题的核心工具。
大数据:挖掘数据背后的真相 电子书
无须数学、统计学基础,轻松掌握大数据。
R语言高效能实战:更多数据和更快速度 电子书
本书将目标设定为“在一台笔记本电脑上能够运行”,从单机大型数据集处理策略、提升计算性能、其他工具和技巧3个方面介绍了使用R语言处理数据时的实用方法。主要内容包括数据集占用空间、善用data.table处理数据、数据分块处理、提升硬盘资源使用效率、并行编程技术、提升机器学习性能,以及其他资源管理和提高性能的实用策略。