数据采集及预处理基础与应用

数据采集及预处理基础与应用

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

内容简介

本书主要介绍如何利用Kettle和Python这两个具有代表性的工具进行数据预处理的相关技术与方法,包括数据抽取、数据清洗、数据集成、数据变换等。全书有9章,内容涉及数据采集、环境部署、Kettle安装及应用、pandas应用,以及数据可视化的基础内容。本书采用任务式编写形式,将大数据预处理技术的理论和实现分解到一个个任务中,融入到一个个典型案例中,让读者在完成各任务的同时掌握和理解相关内容。 本书既有技术的深度,也有行业应用的广度,适合作为高等院校计算机、数据科学与大数据技术等相关专业课程的教材,也适合作为数据处理行业从业人员的参考用书。

数据采集及预处理基础与应用是2024年由人民邮电出版社出版,作者陈瑛。

得书感谢您对《数据采集及预处理基础与应用》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

你可能喜欢
Python网络爬虫与数据采集 电子书
本书的主旨是介绍如何结合Python进行网络爬虫程序的开发,从Python语言的基本特性入手,详细介绍了Python爬虫开发的各个方面,涉及包括HTTP、HTML、JavaScript、正则表达式、自然语言处理、数据科学等不同领域的内容。全书共分为15章,包括了Python基础知识、网站分析、网页解析、Python文件读写、Python与数据库、AJAX技术、模拟登录、文本与数据分析、网站测试、S
用电信息采集通信技术及应用 电子书
本书内容包括:概述、远程通信技术、本地通信技术、通信关键芯片、综合应用分析、策略及建议。具体介绍了用电信息采集系统、技术概述、无限专用通信网、有线电视通信网等内容。
大数据技术与应用基础 电子书
本书在介绍大数据发展背景、特点及主要技术层面的基础上,对大数据的数据采集、数据存储、常见计算模式和典型系统工具进行了分析介绍。本书同时对各种典型系统工具进行了讲解,包括大数据查询分析计算及典型工具(HBase、Hive)、批处理计算及典型工具(MapReduce、Spark)、流式计算及典型工具(Storm、Apex、Flink)、事件流及典型工具(Druid)等。本书提供了大量的实例和源代码供读
Python基础与大数据应用 电子书
本书分为11章,前6章讲解了Python基本语法和基本应用,后5章系统地讲解了用Python爬取数据、处理数据、分析数据的方法与过程。每章除了丰富的实例外,还设计了来源于实践的项目训练及拓展训练项目。
Python基础及应用 电子书
《Python基础及应用》完全为零基础的初学者量身定做,配合大量实例介绍了Python的基本语法、编码规范和一些编程思想。《Python基础及应用》共分为两部分,第1~6章为Python语言基础,主要介绍Python的基本用法。第7~10章介绍一些Python的实际应用,第7章介绍了如何用Python进行GUI开发,第8章介绍了如何用Python开发网络爬虫,第9章介绍了如何用Python进行We