大数据采集与爬虫 电子书

大数据采集与爬虫

手机扫码阅读
  • 微信扫一扫

    关注微信公众号

内容简介

《大数据采集与爬虫》主要讲解了如何使用Python编写网络爬虫程序,内容包括Python环境搭建、Python的基础语法、爬虫基础知识、网络基础知识、常用爬虫库和解析库、数据持久化存储、Web API和异步数据抓取技术、Selenium和ChromeDriver的用法,以及Scrapy爬虫框架的基本原理和操作。*后介绍了一个网络爬虫的综合案例,以巩固前面所学的知识。 《大数据采集与爬虫》适合作为高等职业院校大数据技术与应用专业的教材,也适合有一定Python编程经验并且对爬虫技术感兴趣的读者阅读。

章节目录

展开全部

大数据采集与爬虫是2020年由机械工业出版社出版,作者主 编 李俊翰 付雯副主编 王正霞 胡心雷。

版权说明:本电子书已获得正版授权,由出版社通过知传链发行。
得书感谢您对《大数据采集与爬虫》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

你可能喜欢
Python网络爬虫与数据采集 电子书

本书的主旨是介绍如何结合Python进行网络爬虫程序的开发,从Python语言的基本特性入手,详细介绍了Python爬虫开发的各个方面,涉及包括HTTP、HTML、JavaSc...
数据采集与预处理 电子书

本书以任务驱动为主线,围绕企业级应用进行项目任务设计,主要内容包括数据采集与预处理准备、网络爬虫实践、日志数据采集实践和数据预处理实践,全面地讲述了Scrapy、Flume、P...
数据采集与预处理 电子书

本书共8章,内容包括概述、大数据实验环境搭建、网络数据采集、分布式消息系统Kafka、日志采集系统Flume、数据仓库中的数据集成、ETL工具Kettle、使用pandas进行...
Python程序设计与数据采集(微课版) 电子书

本书知识框架可分为三部分。第一部分(第1章)阐述Python开发环境的搭建与使用;第二部分(第2章~第7章)阐述Python程序设计的基础知识,包括内置类型、运算符与内置函数,...
大数据测试技术 数据采集、分析与测试实践(在线实验+在线自测 ) 电子书

本书从工程角度出发,阐述了运用大数据技术进行软件测试的方法和实现过程。全书共11章,介绍了大数据测试思维、手机联网数据的收集方法、数据格式的转换方法、大数据的处理方法、软件缺陷...
大数据采集、预处理与可视化(微课版) 电子书

为了适应数字经济时代的新发展趋势,培养新时代大数据专业人才,编者通过总结多年的教学经验,借鉴国内外相关领域的教学优势,详细剖析大数据采集、预处理与可视化的基础理论、关键技术、相...