数据采集与预处理 电子书

数据采集与预处理

9.9 开通会员

内容简介

本书共8章,内容包括概述、大数据实验环境搭建、网络数据采集、分布式消息系统Kafka、日志采集系统Flume、数据仓库中的数据集成、ETL工具Kettle、使用pandas进行数据清洗。

章节目录

展开全部

数据采集与预处理是2022年由人民邮电出版社出版,作者林子雨 编著。

版权说明:本电子书已获得正版授权,由出版社通过知传链发行。
得书感谢您对《数据采集与预处理》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

你可能喜欢
大数据技术原理与应用(第3版) 电子书
本书系统介绍了大数据的相关知识,分为大数据基础篇、大数据存储与管理篇、大数据处理与分析篇、大数据应用篇。
数据采集与预处理 电子书
本书以任务驱动为主线,围绕企业级应用进行项目任务设计,主要内容包括数据采集与预处理准备、网络爬虫实践、日志数据采集实践和数据预处理实践,全面地讲述了Scrapy、Flume、P...
数据采集及预处理基础与应用 电子书
本书主要介绍如何利用Kettle和Python这两个具有代表性的工具进行数据预处理的相关技术与方法,包括数据抽取、数据清洗、数据集成、数据变换等。全书有9章,内容涉及数据采集、...
大数据采集、预处理与可视化(微课版) 电子书
为了适应数字经济时代的新发展趋势,培养新时代大数据专业人才,编者通过总结多年的教学经验,借鉴国内外相关领域的教学优势,详细剖析大数据采集、预处理与可视化的基础理论、关键技术、相...
大数据采集与爬虫 电子书
《大数据采集与爬虫》主要讲解了如何使用Python编写网络爬虫程序,内容包括Python环境搭建、Python的基础语法、爬虫基础知识、网络基础知识、常用爬虫库和解析库、数据持...
Python数据预处理 电子书
全书共8章,其中第1章介绍数据预处理的入门知识;第2-6章介绍科学计算库numpy和数据分析库pandas,以及通过pandas库实现数据获取、数据清理、数据集成、数据变换和数...
Python网络爬虫与数据采集 电子书
本书的主旨是介绍如何结合Python进行网络爬虫程序的开发,从Python语言的基本特性入手,详细介绍了Python爬虫开发的各个方面,涉及包括HTTP、HTML、JavaSc...
Python数据预处理(微课版) 电子书
本书以JupyterNotebook为主要开发工具,全面地介绍数据预处理的相关知识。全书共分8章,内容分别为初识Python数据预处理、数据获取与存储、数据清洗、数据集成、数据...