本书以任务为导向,全面地介绍数据分析的流程和 Python 数据分析库的应用,详细讲解利用Python解决企业实际问题的方法。全书共9章,第1章介绍了数据分析的基本概念等相关知识;第2~6章介绍了Python数据分析的常用库及其应用,涵盖NumPy数值计算、Matplotlib数据可视化、pandas统计分析、使用pandas进行数据预处理、使用scikit-learn构建模型,较为全面地阐述了Python数据分析方法;第7~9章结合之前所学的数据分析技术,进行企业综合案例数据分析。除第1章外,本书各章都包含了实训与课后习题,通过练习和操作实践,帮助读者巩固所学的内容。
本书可以作为高校大数据技术类专业的教材,也可作为大数据技术爱好者的自学用书。
编委会主任:余明辉 聂 哲
编委会成员(按姓氏笔画排序):
王玉宝 王宏刚 王 海 石坤泉 冯健文
刘名军 刘晓玲 刘晓勇 许 昊 麦国炫
李 红 李怡婷 杨 坦 杨 征 杨 惠
肖永火 肖 刚 肖 芳 吴 勇 邱伟绵
何小苑 何贤斌 何 燕 汪作文 张玉虹
张 红 张良均 张 健 张 凌 张 敏
张澧生 陈 胜 陈 浩 林志章 林 昆
林碧娴 欧阳国军 易琳琳 周 龙 周东平
郑素铃 官金兰 赵文启 胡大威 胡 坚
胡 洋 钟阳晶 施 兴 姜鹏辉 敖新宇
莫 芳 莫济成 徐圣兵 高 杨 郭信佑
黄 华 黄红梅 梁同乐 焦正升 雷俊丽
詹增荣 樊 哲
PREFACE
随着大数据时代的到来,移动互联网络和智能手机迅速普及,多种形态的移动互联应用蓬勃发展,电子商务、云计算、互联网金融、物联网等不断渗透并重塑传统产业,大数据当之无愧地成为了新的产业革命核心。
未来5~10年,我国大数据产业将会是一个飞速发展时期,社会对大数据相关专业人才有着巨大的需求。目前,国内各大高校都在争相设立或准备设立大数据相关专业,以适应地方产业发展对战略性新兴产业的人才需求。
人才培养离不开教材,大数据专业是2016年才获批的新专业,目前还没有成套的系列教材,已有教材也存在企业案例缺失等亟须解决的问题。由广州泰迪智能科技有限公司和人民邮电出版社策划,校企联合编写的这套图书,尤如大旱中的甘露,可以有效解决高校大数据相关专业教材紧缺的困境。
实践教学是在一定的理论指导下,通过引导学习者的实践活动,从而传承实践知识、形成技能、发展实践能力、提高综合素质的教学活动。目前,高校教学体系的设置有诸多限制因素,过多地偏向理论教学,课程设置与企业实际应用切合度不高,学生无法把理论转化为实践应用技能。课程内容设置方面看似繁多又各自为“政”,课程冗余、缺漏,体系不健全。本套图书的第一大特点就是注重学生的实践能力培养,根据高校实践教学中的痛点,首次提出“鱼骨教学法”的概念。以企业真实需求为导向,学生学习技能紧紧围绕企业实际应用需求,将学生需掌握的理论知识,通过企业案例的形式进行衔接,达到知行合一、以用促学的目的。
大数据专业应该以大数据技术应用为核心,紧紧围绕大数据应用闭环的流程进行教学,才能够使学生从宏观上理解大数据技术在行业中的具体应用场景及应用方法。高校现有的大数据课程集中在如何进行数据处理、建模分析、调整参数,使得模型的结果更加准确。但是,完整的大数据应用却是一个容易被忽视的部分。本套图书的第二大特点就是围绕大数据应用的整个流程,从数据采集、数据迁移、数据存储、数据分析与挖掘,最终到数据可视化,覆盖完整的大数据应用流程,涵盖企业大数据应用中的各个环节,符合企业大数据应用真实场景。
我很高兴看到这套书的出版,也希望这套书能给更多的高校师生带来教学上的便利,帮助读者尽快掌握本领,成为有用之才!
FOREWORD
随着云时代的来临,数据分析技术将帮助企业用户在合理时间内获取、管理、处理以及整理海量数据,为企业经营决策提供积极的帮助。数据分析作为一门前沿技术,广泛应用于物联网、云计算、移动互联网等战略性新兴产业。虽然大数据目前在国内还处于初级阶段,但是其商业价值已经显现出来,特别是有实践经验的数据分析人才更是各企业争夺的热门。为了满足日益增长的数据分析人才需求,很多高校开始尝试开设不同程度的数据分析课程。“数据分析”作为大数据时代的核心技术,必将成为高校大数据相关专业的重要课程之一。