本书以任务驱动为主线,围绕企业级应用进行项目任务设计,主要内容包括数据采集与预处理准备、网络爬虫实践、日志数据采集实践和数据预处理实践,全面地讲述了Scrapy、Flume、Pig、Kettle、Pandas、OpenRefine等技术,以及urllib、Selenium基本库和BeautifulSoup解析库的相关知识与应用案例。本书内容实用,可操作性强,语言精练、通俗易懂,可作为高等院校计算机
本书以任务驱动为主线,围绕企业级应用进行项目任务设计,介绍了平台的本地模式安装、伪分布式模式安装及完全分布式模式安装,并基于Hadoop 2.X生态系统,全面讲解了Hive环境搭建与基本操作、ZooKeeper环境搭建与基本操作、HBase环境搭建与基本操作、Hadoop常用工具组件的安装与应用、集群搭建与管理,以及Hadoop平台应用综合案例等相关知识及操作技能。
Hadoop平台搭建与应用是2020年由人民邮电出版社出版,作者米洪 张鸰。
温馨提示:
1.本电子书已获得正版授权,由出版社通过知传链发行。
2.该电子书为虚拟物品,付费之后概不接收任何理由退款。电子书内容仅支持在线阅读,不支持下载。
3.您在本站购买的阅读使用权仅限于您本人阅读使用,您不得/不能给任何第三方使用,由此造成的一切相关后果本平台保留向您追偿索赔的权利!版权所有,后果自负!
得书感谢您对《Hadoop平台搭建与应用》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。