Hadoop是目前比较流行的大数据框架之一,可使用简单的高级编程模型实现大型数据集的分布式存储和处理。本书以Hadoop的概念、集群搭建、核心组件、实战案例等为主线,较为全面地介绍了Hadoop大数据存储及处理技术的相关知识。全书共10章,前9章主要讲解Hadoop基础,内容包括初识Hadoop、Hadoop的安装与配置、高可用与联邦、分布式文件系统HDFS、集群资源管理系统YARN、分布式计算框
本书介绍了Hadoop技术的相关知识,并将理论知识与实际项目相结合。全书共分为三个部分:基础篇、应用篇和总结篇。基础篇详细介绍了Hadoop、MapReduce、HDFS、Hive和Sqoop,并深入探讨了 Hadoop 的运维和调优;应用篇则包含了一个具有代表性的完整的基于 Hadoop 的商业智能系统的设计和实现;结束篇对全书进行总结,并对技术发展做了展望。
本书结构针对学习曲线进行了优化,由浅至深,从理论基础到项目实战,适合Hadoop的初学者阅读,也适合作为高等院校相关课程的教学参考书。
Hadoop海量数据处理:技术详解与项目实战是2015年由人民邮电出版社出版,作者范东来。
温馨提示:
得书感谢您对《Hadoop海量数据处理:技术详解与项目实战》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。