大数据分析与挖掘mobi电子书提取码

简介: 数据科学与大数据技术专业系列规划教材。强调概念+算法实践,让你“小数据”上会“算”,“大数据”上“算得快”。

内容提要

本书是大数据分析与挖掘领域的入门教材,全书共6章,内容主要涵盖大数据分析与挖掘过程中用到的基本算法,目的是通过算法原理的介绍,使学生能更高效地将它们运用于数据分析与挖掘的实践中。第1章主要介绍大数据分析与挖掘技术发展与应用的特点,以及三种主流的工具。第2章主要讲解数据特征分析与预处理,详细介绍了数据各种特征的描述方法、预处理技术,以及Spark机器学习库中的数据预处理功能。第3章详细介绍频繁模式挖掘的几种经典算法,并结合Spark机器学习库进行实践,对序列模式挖掘进行了讲解。第4章详细介绍几种基本的分类与回归算法,并结合Sklearn和Spark机器学习库进行实践。第5章详细介绍主流的聚类算法。第6章综合运用多种数据挖掘算法进行异常检测。

本书可作为高等院校数据科学与大数据技术、计算机科学与技术等相关专业的本科生教材,也可作为大数据分析与挖掘技术初学者的参考书。

编委会

主任 陈钟 北京大学

副主任 杜小勇 中国人民大学

周傲英 华东师范大学

马殿富 北京航空航天大学

李战怀 西北工业大学

冯宝帅 华为技术有限公司

张立科 人民邮电出版社

秘书长 王翔 华为技术有限公司

戴思俊 人民邮电出版社

委员(按姓名拼音排序)

崔立真 山东大学

高小鹏 北京航空航天大学

侯宾 北京邮电大学

林子雨 厦门大学

刘耀林 华为技术有限公司

沈刚 华中科技大学

嵩天 北京理工大学

汪卫 复旦大学

王宏志 哈尔滨工业大学

王兴伟 东北大学

印鉴 中山大学

张志峰 华为技术有限公司

邹北骥 中南大学

段立新 电子科技大学

桂劲松 中南大学

黄岚 吉林大学

刘博 人民邮电出版社

乔亚男 西安交通大学

石胜飞 哈尔滨工业大学

唐卓 湖南大学

王伟 同济大学

王建民 清华大学

薛志东 华中科技大学

袁晓如 北京大学

赵卫东 复旦大学

邹文波 人民邮电出版社

丛书序一

毫无疑问,我们正处在一个新时代。新一轮科技革命和产业变革正在加速推进,技术创新日益成为重塑经济发展模式和促进经济增长的重要驱动力量,而“大数据”无疑是第一核心推动力。

当前,发展大数据已经成为国家战略,大数据在引领经济社会发展中的新引擎作用更加突显。大数据重塑了传统产业的结构和形态,催生了众多的新产业、新业态、新模式,推动了共享经济的蓬勃发展,也给我们的衣食住行带来根本改变。同时,大数据是带动国家竞争力整体跃升和跨越式发展的巨大推动力,已成为全球科技和产业竞争的重要制高点。可以大胆预测,未来,大数据将会进一步激起全球科技和产业发展浪潮,进一步渗透到我们国计民生的各个领域,其发展扩张势不可挡。可以说,我们处在一个“大数据”时代。

大数据不仅仅是单一的技术发展领域和战略新兴产业,它还涉及科技、社会、伦理等诸多方面。发展大数据是一个复杂的系统工程,需要科技界、教育界和产业界等社会各界的广泛参与和通力合作,需要我们以更加开放的心态,以进步发展的理念,积极主动适应大数据时代所带来的深刻变革。总体而言,从全面协调可持续健康发展的角度,推动大数据发展需要注重以下五个方面的辩证统一和统筹兼顾。

一是要注重“长与短结合”。所谓“长”就是要目标长远,要注重制定大数据发展的顶层设计和中长期发展规划,明确发展方向和总体目标;所谓“短”就是要着眼当前,注重短期收益,从实处着手,快速起效,并形成效益反哺的良性循环。

二是要注重“快与慢结合”。所谓“快”就是要注重发挥新一代信息技术产业爆炸性增长的特点,发展大数据要时不我待,以实际应用需求为牵引加快推进,力争快速占领大数据技术和产业制高点;所谓“慢”就是防止急功近利,欲速而不达,要注重夯实大数据发展的基础,着重积累发展大数据基础理论与核心共性关键技术,培养行业领域发展中的大数据思维,潜心培育大数据专业人才。

三是要注重“高与低结合”。所谓“高”就是要打造大数据创新发展高地,要结合国家重大战略需求和国民经济主战场核心需求,部署高端大数据公共服务平台,组织开展国家级大数据重大示范工程,提升国民经济重点领域和标志性行业的大数据技术水平和应用能力;所谓“低”就是要坚持“润物细无声”,推进大数据在各行各业和民生领域的广泛应用,推进大数据发展的广度和深度。

版权:人民邮电出版社