本书以任务驱动为主线,围绕企业级应用进行项目任务设计,主要内容包括数据采集与预处理准备、网络爬虫实践、日志数据采集实践和数据预处理实践,全面地讲述了Scrapy、Flume、Pig、Kettle、Pandas、OpenRefine等技术,以及urllib、Selenium基本库和BeautifulSoup解析库的相关知识与应用案例。本书内容实用,可操作性强,语言精练、通俗易懂,可作为高等院校计算机应用技术、大数据技术与应用、软件技术、云计算技术与应用等计算机相关专业的教材,也可作为大数据分析、云计算应用领域技术人员的参考用书。
数据采集与预处理是2019年由人民邮电出版社出版,作者米洪 张鸰。
版权说明:本电子书已获得正版授权,由出版社通过知传链发行。
得书感谢您对《数据采集与预处理》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。