数据采集与预处理 电子书

数据采集与预处理

手机扫码阅读
  • 微信扫一扫

    关注微信公众号

内容简介

本书共8章,内容包括概述、大数据实验环境搭建、网络数据采集、分布式消息系统Kafka、日志采集系统Flume、数据仓库中的数据集成、ETL工具Kettle、使用pandas进行数据清洗。

章节目录

展开全部

数据采集与预处理是2022年由人民邮电出版社出版,作者林子雨 编著。

版权说明:本电子书已获得正版授权,由出版社通过知传链发行。
得书感谢您对《数据采集与预处理》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

你可能喜欢
数据采集与预处理 电子书
本书以任务驱动为主线,围绕企业级应用进行项目任务设计,主要内容包括数据采集与预处理准备、网络爬虫实践、日志数据采集实践和数据预处理实践,全面地讲述了Scrapy、Flume、P...
大数据采集、预处理与可视化(微课版) 电子书
为了适应数字经济时代的新发展趋势,培养新时代大数据专业人才,编者通过总结多年的教学经验,借鉴国内外相关领域的教学优势,详细剖析大数据采集、预处理与可视化的基础理论、关键技术、相...
大数据采集与爬虫 电子书
《大数据采集与爬虫》主要讲解了如何使用Python编写网络爬虫程序,内容包括Python环境搭建、Python的基础语法、爬虫基础知识、网络基础知识、常用爬虫库和解析库、数据持...
Python数据预处理 电子书
全书共8章,其中第1章介绍数据预处理的入门知识;第2-6章介绍科学计算库numpy和数据分析库pandas,以及通过pandas库实现数据获取、数据清理、数据集成、数据变换和数...
Python网络爬虫与数据采集 电子书
本书的主旨是介绍如何结合Python进行网络爬虫程序的开发,从Python语言的基本特性入手,详细介绍了Python爬虫开发的各个方面,涉及包括HTTP、HTML、JavaSc...
Python程序设计与数据采集(微课版) 电子书
本书知识框架可分为三部分。第一部分(第1章)阐述Python开发环境的搭建与使用;第二部分(第2章~第7章)阐述Python程序设计的基础知识,包括内置类型、运算符与内置函数,...