R语言编程:基于tidyverse

R语言编程:基于tidyverse

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

编辑推荐

一本基于tidyverse入门R语言编程的书。

内容简介

这是一本基于tidyverse入门R语言编程的书,本书从基本的编程语法讲起,适合编程零基础的读者阅读。本书结合新的R语言编程范式,让读者学习更高效率的R编程,尤其是真正用整洁优雅的数据化编程思维解决一系列数据问题,包括数据清洗、数据处理、数据可视化、统计建模、文档沟通等,并在附录中将透视表、网络爬虫、高性能计算、机器学习等典型应用囊括其中,为读者提供了丰富的R实用编程案例,也可作为一本R语言语法大全的工具书。 本书面向热爱R语言编程的读者,适合统计学、数据分析、数据可视化等领域的读者阅读参考,也可以作为高等院校相关专业的R语言教材。

作者简介

作者张敬信,哈尔滨工业大学基础数学博士,哈尔滨商业大学数学与应用数学系主任、副教授、应用统计硕导、数学建模主教练。

主研方向为数据挖掘、数学建模等,热爱编程、擅长R语言。常驻知乎平台。发表SCI论文4篇,主持黑龙江省社科项目1项。

章节目录

版权信息

内容提要

彩图

前言

导语

0.1 怎么学习编程语言

0.2 R语言与数据科学

0.2.1 什么是数据科学

0.2.2 什么是R语言

0.2.3 改变了R的人

0.3 R语言编程思想

0.3.1 面向对象

0.3.2 面向函数

0.3.3 向量化编程

资源与支持

1 基础语法

1.1 搭建R环境及常用操作

1.1.1 搭建R环境

1.1.2 常用操作

1.2 数据结构:向量、矩阵、多维数组

1.2.1 向量(一维数据)

1.2.2 矩阵(二维数据)

1.2.3 多维数组(多维数据)

1.3 数据结构:列表、数据框、因子

1.3.1 列表

1.3.2 数据框(数据表)

1.3.3 因子

1.4 数据结构:字符串、日期时间

1.4.1 字符串

1.4.2 日期时间

1.4.3 时间序列

1.5 正则表达式

1.5.1 基本语法

1.5.2 若干实例

1.6 控制结构

1.6.1 分支结构

1.6.2 循环结构

1.7 自定义函数

1.7.1 自定义函数

1.7.2 R自带的函数

2 数据操作

2.1 tidyverse简介与管道

2.1.1 tidyverse包简介

2.1.2 管道操作

2.2 数据读写

2.2.1 用于数据读写的包与函数

2.2.2 数据读写实例

2.2.3 连接数据库

2.2.4 关于中文编码

2.3 数据连接

2.3.1 合并行与合并列

2.3.2 根据值匹配合并数据框

2.3.3 集合运算

2.4 数据重塑

2.4.1 什么是整洁的数据

2.4.2 宽表变长表

2.4.3 长表变宽表

2.4.4 拆分列与合并列

2.4.5 方形化

2.5 基本数据操作

2.5.1 选择列

2.5.2 修改列

2.5.3 筛选行

2.5.4 对行排序

2.5.5 分组操作

2.6 其他数据操作

2.6.1 按行汇总

2.6.2 窗口函数

2.6.3 滑窗迭代

2.6.4 整洁计算

2.7 数据处理神器:data.table包

2.7.1 通用语法

2.7.2 数据读写

2.7.3 数据连接

2.7.4 数据重塑

2.7.5 数据操作

2.7.6 分组操作

3 可视化与建模技术

3.1 ggplot2基础语法

3.1.1 ggplot2概述

3.1.2 数据、映射、几何对象

3.1.3 标度

3.1.4 统计变换、坐标系、位置调整

3.1.5 分面、主题、输出

3.2 ggplot2图形示例

3.2.1 类别比较图

3.2.2 数据关系图

3.2.3 数据分布图

3.2.4 时间序列图

3.2.5 局部整体图

3.2.6 地理空间图

3.2.7 动态交互图

3.3 统计建模技术

3.3.1 整洁模型结果

3.3.2 辅助建模

3.3.3 批量建模

4 应用统计

4.1 描述性统计

4.1.1 统计量

4.1.2 统计图

4.1.3 列联表

4.2 参数估计

4.2.1 点估计与区间估计

4.2.2 最小二乘估计

4.2.3 最大似然估计

4.3 假设检验

4.3.1 假设检验原理

4.3.2 基于理论的假设检验

4.3.3 基于重排的假设检验

4.4 回归分析

4.4.1 线性回归

4.4.2 回归诊断

4.4.3 多元线性回归实例

4.4.4 梯度下降法

5 探索性数据分析

5.1 数据清洗

5.1.1 缺失值

5.1.2 异常值

5.2 特征工程

5.2.1 特征缩放

5.2.2 特征变换

5.2.3 特征降维

5.3 探索变量间的关系

5.3.1 两个分类变量

5.3.2 分类变量与连续变量

5.3.3 两个连续变量

6 文档沟通

6.1 R Markdown

6.1.1 Markdown简介

6.1.2 R Markdown基础

6.1.3 表格输出

6.2 R与Latex交互

6.2.1 Latex开发环境

6.2.2 Latex嵌入Rmd

6.2.3 期刊论文、幻灯片、书籍模板

6.3 R与Git版本控制

6.3.1 Git版本控制

6.3.2 RStudio与Git/GitHub交互

6.4 R Shiny

6.4.1 Shiny基本语法

6.4.2 响应表达式

6.4.3 案例:探索性数据展板

6.5 开发R包

6.5.1 准备开发环境

6.5.2 编写R包工作流

6.5.3 发布到CRAN

6.5.4 推广包(可选)

附录A R6类面向对象编程简单实例

附录B 错误与调试

B.1 解决报错的一般策略

B.2 错误调试技术

B.3 异常处理

附录C 用R实现Excel中的VLOOKUP与透视表

C.1 VLOOKUP查询

C.2 数据透视表

附录D 非等连接与滚动连接

D.1 非等连接

D.2 滚动连接

附录E R与网络爬虫

E.1 rvest爬取静态网页

E.2 用httr包爬取动态网页

附录F R与高性能计算

F.1 并行计算

F.2 运行C++代码

F.3 对超出内存容量的数据集进行处理

F.4 大型矩阵运算

附录G R机器学习框架

G.1 mlr3verse

G.2 tidymodels

R语言编程:基于tidyverse是2022年由人民邮电出版社出版,作者张敬信。

得书感谢您对《R语言编程:基于tidyverse》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

你可能喜欢
Go语言趣学指南 电子书
Go是谷歌公司为了解决重大问题而设计的一种小型编程语言。完成大型项目需要大型团队,而大型团队中团队成员的经验水平往往各不相同。Go是一种小巧却功能强大的语言,它能够被任何人理解和使用,无论其经验如何。 快速、现代的编程语言能让业余爱好者、初学者和专业人员都受益。你需要的正是这样的语言。本书针对Go语言基础知识提供了实操性的指导,使你能够掌握Go语法,使用类型和函数,探索状态和并发等更重要的概念,并通过大量练习来巩固学到的知识。 本书包括以下内容: ●切片、接口、指针和并发等重要语言概念; ●地鼠太空航行、火星探测器、文本加密以及人类繁衍模拟等7个单元实验; ●无须安装即可在Go Playground中运行的示例。 本书面向所有熟悉计算机编程以及渴望获得这一技能的人。
嵌入式Linux与物联网软件开发——C语言内核深度解析 电子书
  针对性强:面向嵌入式Linux内核源码、底层驱动软件开发等技术方向。   精华原创:凝结作者多年研发及教学经验,帮助读者真正深度理解难点。   求职必读:详解常见面试题,完全应对 “嵌入式软件工程师”岗位需求。
现代C++语言核心特性解析 电子书
通过理论结合实践的内容编排,深入探讨C11到C20引入的语言核心特性。
第一行代码  C语言(视频讲解版) 电子书
学习程序设计,初学者往往遇到这样的困境:语言规则可以倒背如流,但写出的代码总是编译通不过,即使编译通过了却也得不出想要的结果。怎么办?《行代码 C语言》可以给你提供帮助。 你不需要具备高深的数学和电子学知识,只需要训练自己以计算机能够理解的方式去表达自己的逻辑,也就是要具备“计算思维”,寻找到解决问题的方法,然后用编程语言去指挥计算机执行即可。因此,本书与常规的C语言书不同,除了C语言本身的语法规则外,本书更关注的是培养初学者具有程序设计的思想,掌握程序设计的方法。 另外,计蒜客在线教育团队,为本书的读者提供了伴随式的在线编程平台支持,读者可以将图书和线上编程结合起来学习。 提供扫码看视频服务,全书94个微视频,总时长超过1000分钟。 提供辅助教学资源包,包括实验、试卷及答案、教学大纲、PPT等。
从零开始:C语言快速入门教程 电子书
以服务零基础读者为宗旨,图文并茂、通俗易懂,以实例引导读者学习C语言相关知识和实战技能。