大数据技术让我们以一种前所未有的方式,对海量数据进行分析,从中获得有巨大价值的产品和服务,最终形成变革之力。本书围绕Hadoop和Spark两个主流大数据技术进行讲解,主要内容包括Hadoop环境配置、Hadoop分布式文件系统(HDFS)、Hadoop分布式计算框架Map Reduce、Hadoop资源调度框架YARN与Hadoop新特性、Hadoop分布式数据库HBase、数据仓库Hive、大数据离线处理辅助系统、Spark Core、Spark SQL、Spark Streaming等知识。
本书紧密结合实际应用,运用大量案例说明和实践,提炼含金量十足的开发经验。另外,本书配以多元的学习资源和支持服务,包括视频教程、案例素材下载、学习交流社区、讨论组等学习内容,为读者带来全方位的学习体验。
本书适合作为计算机、大数据相关专业的教材使用,也适合具有一定Linux、Java开发经验,并且想从事大数据开发的人员使用,也可作为大数据分析与运维人员的参考用书。
主 任:肖 睿
副主任:相洪波 韩 露
委 员:孙 苹 李 娜 张惠军 杨 欢
潘贞玉 庞国广 张德平 王丙辰
课工场:周 嵘 孙正哲 刘 尧 董 海
崔建瑞 冯娜娜 李 真 陈 璇
尚永祯 于学杰 陈 燕 刁志星
刘校锋 吉志星 曹紫涵 霍荣慧
丛书设计
准备好了吗?进入大数据时代!大数据已经并将继续影响人类生产生活的方方面面。2015年8月31日,国务院正式下发《关于印发促进大数据发展行动纲要的通知》。企业资本则以BAT互联网公司为首,不断进行大数据创新,实现大数据的商业价值。本丛书根据企业人才的实际需求,参考以往学习难度曲线,选取“Java+大数据”技术集作为学习路径,首先从Java语言入手,深入学习理解面向对象的编程思想、Java高级特性以及数据库技术,并熟练掌握企业级应用框架——SSM、SSH,熟悉Java Web应用和Hadoop大数据开发,积累企业实战经验,通过实战项目对大型分布式应用有所了解和认知,为“大数据核心技术系列”的学习打下坚实基础。本丛书旨在为读者提供一站式实战型大数据应用开发学习指导,帮助读者踏上由开发入门到大数据实战的“互联网+大数据”开发之旅!
丛书特点
1.以企业需求为设计导向
满足企业对人才的技能需求是本丛书的核心设计原则,为此课工场大数据开发教研团队,通过对数百位BAT一线技术专家进行访谈、上千家企业人力资源情况进行调研、上万个企业招聘岗位进行需求分析,从而实现对技术的准确定位,达到课程与企业需求的强契合度。
2.以任务驱动为讲解方式
丛书中的技能点和知识点都由任务驱动,读者在学习知识时不仅可以知其然,而且可以知其所以然,帮助读者融会贯通、举一反三。
3.以实战项目来提升技术
每本书均增设项目实战环节,以综合运用每本书的知识点,帮助读者提升项目开发能力。每个实战项目都有相应的项目思路指导、重难点讲解、实现步骤总结和知识点梳理。
4.以“互联网+”实现终身学习
本丛书可配合使用课工场APP进行二维码扫描,观看配套视频的理论讲解和案例操作。同时课工场(www.kgc.cn)开辟教材配套版块,提供案例代码及作业素材下载。此外,课工场也为读者提供了体系化的学习路径、丰富的在线学习资源以及活跃的学习社区,欢迎广大读者进入学习。
读者对象
1.大中专院校学生
2.编程爱好者
3.初中级程序开发人员
4.相关培训机构的老师和学员
致谢
本丛书由课工场大数据开发教研团队编写。课工场是北京大学旗下专注于互联网人才培养的高端教育品牌。作为国内互联网人才教育生态系统的构建者,课工场依托北京大学优质的教育资源,重构职业教育生态体系,以学员为本,以企业为基,构建“教学大咖、技术大咖、行业大咖”三咖一体的教学矩阵,为学员提供高端、实用的学习内容!