本书以理论结合示例操作的方式,全面介绍了R语言编程基础及其知识的应用,讲解了利用R语言解决部分实际问题的方法。全书共7章:第1章为R语言概述,包括学习R语言的优势、R语言的编译环境、R包的获取及加载、R包的内置数据等;第2~6章主要介绍R语言的数据对象与数据读写、数据集基本处理、函数与控制流、初级绘图、高级绘图;第7章主要介绍可视化数据挖掘工具Rattle。本书的每章都包含了课后习题,通过练习帮助读者巩固所学的内容。
本书可以作为高校大数据技术类专业教材,也可作为大数据技术爱好者自学用书。
编委会主任:余明辉 聂 哲
编委会成员(按姓氏笔画排序):
王玉宝 王宏刚 王 海 王雪松 王 熠
石坤泉 叶提芳 冯健文 刘名军 刘晓玲
刘晓勇 江吉彬 许志伟 许 昊 麦国炫
李 红 李怡婷 李 倩 李程文 杨 坦
杨 征 杨 惠 肖永火 肖 刚 肖 芳
吴 勇 邱伟绵 何小苑 何贤斌 何 燕
汪作文 张玉虹 张 红 张良均 张 健
张 凌 张 敏 张澧生 陈 胜 陈 浩
林 昆 林智章 林碧娴 林耀进 欧阳国军
易琳琳 周 龙 周东平 郑素铃 官金兰
赵文启 胡大威 胡 坚 胡 洋 柳 扬
钟阳晶 施 兴 姜鹏辉 敖新宇 莫 芳
莫济成 徐圣兵 高 杨 郭信佑 郭艳文
黄 华 黄红梅 梁同乐 程 丹 焦正升
雷俊丽 詹增荣 樊 哲 潘 强
PREFACE
随着大数据时代的到来,移动互联网络和智能手机迅速普及,多种形态的移动互联应用蓬勃发展,电子商务、云计算、互联网金融、物联网等不断渗透并重塑传统产业,大数据当之无愧地成了新的产业革命核心。
未来5~10年,我国大数据产业将会是一个飞速发展时期,社会对大数据相关专业人才有着巨大的需求。目前,国内各大高校都在争相设立或准备设立大数据相关专业,以适应地方产业发展对战略性新兴产业的人才需求。
人才培养离不开教材,大数据专业是2016年才获批的新专业,目前还没有成套的系列教材,已有教材也存在企业案例缺失等亟须解决的问题。由广州泰迪智能科技有限公司和人民邮电出版社策划,校企联合编写的这套图书,犹如大旱中的甘露,可以有效解决高校大数据相关专业教材紧缺的困难。
实践教学是在一定的理论指导下,通过引导学习者的实践活动,从而传承实践知识、形成技能、发展实践能力、提高综合素质的教学活动。目前,高校教学体系的设置有诸多限制因素,过多地偏向理论教学,课程设置与企业实际应用契合度不高,学生无法把理论转化为实践应用技能。课程内容设置方面看似繁多又各自为“政”,课程冗余、缺漏,体系不健全。本套图书的第一大特点就是注重学生的实践能力培养,根据高校实践教学中的痛点,首次提出“鱼骨教学法”的概念。以企业真实需求为导向,学生所学技能紧紧围绕企业实际应用需求,将学生需掌握的理论知识,通过企业案例的形式进行衔接,达到知行合一、以用促学的目的。
大数据专业应该以大数据技术应用为核心,紧紧围绕大数据应用闭环的流程进行教学,才能够使学生从宏观上理解大数据技术在行业中的具体应用场景及应用方法。高校现有的大数据课程集中在如何进行数据处理、建模分析、参数调整,使得模型的结果更加准确。但是,完整的大数据应用却是一个容易被忽视的部分。本套图书的第二大特点就是围绕大数据应用的整个流程,从数据采集、数据迁移、数据存储、数据分析与挖掘,最终到数据可视化,覆盖完整的大数据应用流程,涵盖企业大数据应用中的各个环节,符合企业大数据应用真实场景。
我很高兴看到这套书的出版,也希望这套书能给更多的高校师生带来教学上的便利,帮助读者尽快掌握本领,成为有用之才!
教育部长江学者特聘教授
国家杰出青年基金获得者
IEEE Fellow
华南理工大学计算机与工程学院院长
2017年12月
FORRWORD
随着云时代的来临,数据分析技术将帮助企业在合理时间内获取、管理海量数据,为企业经营决策提供积极的帮助。数据分析作为一门前沿技术,广泛应用于物联网、云计算、移动互联网等领域。虽然大数据目前在国内还处于初级阶段,但是其商业价值已经显现出来,特别是有实践经验的数据分析人才,更是各企业争夺的热门。为了满足日益增长的数据分析人才需求,很多高校开始尝试开设数据分析课程。“数据分析”作为大数据时代的核心技术,必将成为高校大数据相关专业的重要课程之一。