电子书

米洪张鸰

本书以任务驱动为主线，围绕企业级应用进行项目任务设计，主要内容包括数据采集与预处理准备、网络爬虫实践、日志数据采集实践和数据预处理实践，全面地讲述了Scrapy、Flume、Pig、Kettle、Pandas、OpenRefine等技术，以及urllib、Selenium基本库和BeautifulSoup解析库的相关知识与应用案例。本书内容实用，可操作性强，语言精练、通俗易懂，可作为高等院校计算机

电子书

数据采集与预处理

林子雨编著

本书共8章，内容包括概述、大数据实验环境搭建、网络数据采集、分布式消息系统Kafka、日志采集系统Flume、数据仓库中的数据集成、ETL工具Kettle、使用pandas进行数据清洗。

电子书

大数据采集、预处理与可视化（微课版）

葛继科

为了适应数字经济时代的新发展趋势，培养新时代大数据专业人才，编者通过总结多年的教学经验，借鉴国内外相关领域的教学优势，详细剖析大数据采集、预处理与可视化的基础理论、关键技术、相关工具和应用案例，进而编成本书。本书是集理论与实践于一体的应用型教材。全书共7章，包括大数据概述、Python程序设计、大数据采集、大数据预处理技术、Excel数据获取与预处理、Python数据预处理、数据可视化技术。本书在

电子书

Python数据预处理

黑马程序员

全书共8章，其中第1章介绍数据预处理的入门知识；第2-6章介绍科学计算库numpy和数据分析库pandas，以及通过pandas库实现数据获取、数据清理、数据集成、数据变换和数据规约的功能；第7章介绍数据清理工具OpenRefine的安装及使用；第8章结合前期的核心知识进行实战演练。除第1章外，其他章均配置了丰富的示例或案例，读者可以一边学习一边练习，巩固所学的知识，并在实践中提升实际开发能力。本

电子书

大数据采集与爬虫

主编李俊翰付雯副主编王正霞胡心雷

《大数据采集与爬虫》主要讲解了如何使用Python编写网络爬虫程序，内容包括Python环境搭建、Python的基础语法、爬虫基础知识、网络基础知识、常用爬虫库和解析库、数据持久化存储、WebAPI和异步数据抓取技术、Selenium和ChromeDriver的用法，以及Scrapy爬虫框架的基本原理和操作。*后介绍了一个网络爬虫的综合案例，以巩固前面所学的知识。《大数据采集与爬虫》适合作为高等职

电子书

21世纪全国高职高专计算机教育“十一五”规划教材计算机应用基础实训指导及习题集

《计算机应用基础实训指导及习题集》编委会

本书共分六章，包括计算机基础知识，中文Windows2000操作系统、中文Word2000的使用、中文Excel2000的使用、中文Powerpoint2000的使用。

电子书

Python网络爬虫与数据采集

主编

本书的主旨是介绍如何结合Python进行网络爬虫程序的开发，从Python语言的基本特性入手，详细介绍了Python爬虫开发的各个方面，涉及包括HTTP、HTML、JavaScript、正则表达式、自然语言处理、数据科学等不同领域的内容。全书共分为15章，包括了Python基础知识、网站分析、网页解析、Python文件读写、Python与数据库、AJAX技术、模拟登录、文本与数据分析、网站测试、S

电子书

用电信息采集通信技术及应用

杜新纲

本书内容包括：概述、远程通信技术、本地通信技术、通信关键芯片、综合应用分析、策略及建议。具体介绍了用电信息采集系统、技术概述、无限专用通信网、有线电视通信网等内容。

得书 - 好书推荐、正版图书免费阅读

数据采集及预处理基础与应用

陈瑛

内容简介

章节目录

Python基础与大数据应用

大数据技术与应用基础

21世纪全国高职高专计算机教育“十一五”规划教材.计算机应用基础

数据可视化基础与应用

数据库基础及应用（第二版）