基于Hadoop与Spark的大数据开发实战读后感

计算机与互联网 工业技术 肖睿 丁科 吴刚山
简介: 大数据技术让我们以一种前所未有的方式,对海量数据进行分析,从中获得有巨大价值的产品和服务,最终形成变革之力。本书围绕Hadoop和Spark两个主流大数据技术进行讲解,主要内容包括Hadoop环境配置、Hadoop分布式文件系统(HDFS)、Hadoop分布式计算框架MapReduce、Hadoop资源调度框架YARN与Hadoop新特性、Hadoop分布式数据库HBase、数据仓库Hive、大数

大数据技术让我们以一种前所未有的方式,对海量数据进行分析,从中获得有巨大价值的产品和服务,最终形成变革之力。本书围绕Hadoop和Spark两个主流大数据技术进行讲解,主要内容包括Hadoop环境配置、Hadoop分布式文件系统(HDFS)、Hadoop分布式计算框架Map Reduce、Hadoop资源调度框架YARN与Hadoop新特性、Hadoop分布式数据库HBase、数据仓库Hive、大数据离线处理辅助系统、Spark Core、Spark SQL、Spark Streaming等知识。

本书紧密结合实际应用,运用大量案例说明和实践,提炼含金量十足的开发经验。另外,本书配以多元的学习资源和支持服务,包括视频教程、案例素材下载、学习交流社区、讨论组等学习内容,为读者带来全方位的学习体验。

本书适合作为计算机、大数据相关专业的教材使用,也适合具有一定Linux、Java开发经验,并且想从事大数据开发的人员使用,也可作为大数据分析与运维人员的参考用书。

主 任:肖 睿

副主任:相洪波  韩 露

委 员:孙 苹  李 娜  张惠军  杨 欢

潘贞玉  庞国广  张德平  王丙辰

课工场:周 嵘  孙正哲  刘 尧  董 海

崔建瑞  冯娜娜  李 真  陈 璇

尚永祯  于学杰  陈 燕  刁志星

刘校锋  吉志星  曹紫涵  霍荣慧

丛书设计

准备好了吗?进入大数据时代!大数据已经并将继续影响人类生产生活的方方面面。2015年8月31日,国务院正式下发《关于印发促进大数据发展行动纲要的通知》。企业资本则以BAT互联网公司为首,不断进行大数据创新,实现大数据的商业价值。本丛书根据企业人才的实际需求,参考以往学习难度曲线,选取“Java+大数据”技术集作为学习路径,首先从Java语言入手,深入学习理解面向对象的编程思想、Java高级特性以及数据库技术,并熟练掌握企业级应用框架——SSM、SSH,熟悉Java Web应用和Hadoop大数据开发,积累企业实战经验,通过实战项目对大型分布式应用有所了解和认知,为“大数据核心技术系列”的学习打下坚实基础。本丛书旨在为读者提供一站式实战型大数据应用开发学习指导,帮助读者踏上由开发入门到大数据实战的“互联网+大数据”开发之旅!

丛书特点

1.以企业需求为设计导向

满足企业对人才的技能需求是本丛书的核心设计原则,为此课工场大数据开发教研团队,通过对数百位BAT一线技术专家进行访谈、上千家企业人力资源情况进行调研、上万个企业招聘岗位进行需求分析,从而实现对技术的准确定位,达到课程与企业需求的强契合度。

2.以任务驱动为讲解方式

丛书中的技能点和知识点都由任务驱动,读者在学习知识时不仅可以知其然,而且可以知其所以然,帮助读者融会贯通、举一反三。

3.以实战项目来提升技术

每本书均增设项目实战环节,以综合运用每本书的知识点,帮助读者提升项目开发能力。每个实战项目都有相应的项目思路指导、重难点讲解、实现步骤总结和知识点梳理。

4.以“互联网+”实现终身学习

本丛书可配合使用课工场APP进行二维码扫描,观看配套视频的理论讲解和案例操作。同时课工场(www.kgc.cn)开辟教材配套版块,提供案例代码及作业素材下载。此外,课工场也为读者提供了体系化的学习路径、丰富的在线学习资源以及活跃的学习社区,欢迎广大读者进入学习。

读者对象

1.大中专院校学生

2.编程爱好者

3.初中级程序开发人员

4.相关培训机构的老师和学员

致谢

本丛书由课工场大数据开发教研团队编写。课工场是北京大学旗下专注于互联网人才培养的高端教育品牌。作为国内互联网人才教育生态系统的构建者,课工场依托北京大学优质的教育资源,重构职业教育生态体系,以学员为本,以企业为基,构建“教学大咖、技术大咖、行业大咖”三咖一体的教学矩阵,为学员提供高端、实用的学习内容!

版权:人民邮电出版社