得书 - 好书推荐、正版图书免费阅读
发现
热门
排行榜
VIP会员
🔍
➜
注册 | 登录
Python网络爬虫(Scrapy框架)
肖睿 陈磊
评分
0
(1 人读过)
2020 年出版
工业技术
¥25.20
免费读
VIP 专享
立即开始阅读
加入书架
已加书架
反馈
超值推荐:
首月9.9开通会员,本书及全站
10,000+
好书无限畅读。
开通会员 >
内容简介
本书以主流的Scrapy爬虫框架为例,运用了大量案例和实践,介绍了Python网络爬虫的组成、爬虫框架的使用以及分布式爬虫等内容。
展开全文
第1 章使用第三方库实现信息抓取
任务1 使用第三方库实现北京公交站点页面信息抓取
1.1.1 介绍爬虫
1.1.2 HTTP
1.1.3 HTML
1.1.4 使用第三方库实现爬虫功能
1.1.5 技能实训
任务2 使用第三方库实现北京公交站点详细信息抓取
1.2.1 lxml 库
1.2.2 第三方库数据抓取及保存
1.2.3 技能实训
本章小结
本章作业
第2 章初探Scrapy 爬虫框架
任务1 安装Scrapy 爬虫框架并创建爬虫工程
2.1.1 根据使用场景划分爬虫种类
2.1.2 开发基于Scrapy 爬虫框架的工程
任务2 学习并掌握Scrapy 爬虫框架各模块的功能
2.2.1 Scrapy 爬虫工程组成
2.2.2 Scrapy 爬虫框架架构
本章小结
本章作业
第3 章提取网页数据
任务1 使用Scrapy 的选择器提取豆瓣电影信息
3.1.1 Response 对象
3.1.2 css 选择器
3.1.3 多层级网页爬取
3.1.4 技能实训
任务2 使用正则表达式从电影介绍详情中提取指定信息
3.2.1 正则表达式
3.2.2 技能实训
本章小结
本章作业
第4 章Scrapy 数据保存(文件、MySQL、MongoDB)
任务1 使用Feed exports将爬取的电影信息保存到常见数据格式文件中
4.1.1 Feed exports
4.1.2 技能实训
任务2 使用pipeline 将爬取的电影信息数据保存到数据库中
4.2.1 Python 操作MySQL 数据库
4.2.2 pipeline 模块
4.2.3 将数据保存到MongoDB 中
4.2.4 技能实训
本章小结
本章作业
第5 章Scrapy 反反爬技术
任务1 学习反爬虫和反反爬虫策略
5.1.1 反爬虫方法和反反爬虫策略
5.1.2 Scrapy 设置实现反反爬
5.1.3 技能实训
任务2 学习Scrapy 框架中更多常用的设置
5.2.1 抓取需要登录的网站
5.2.2 Scrapy 常用扩展设置
本章小结
本章作业
第6 章Selenium+浏览器加载动态数据
任务1 使用Selenium和第三方浏览器驱动完成搜狐网页信息爬取
6.1.1 静态网页与动态网页
6.1.2 爬虫抓取动态网页的常用方法
6.1.3 Selenium+Chrome driver
6.1.4 技能实训
任务2 使用Selenium+Chrome+Scrapy完成京东商品信息爬取
6.2.1 Selenium 的使用
6.2.2 Selenium 提高效率的方法
6.2.3 技能实训
本章小结
本章作业
第7 章App 数据爬取
任务1 使用Scrapy 爬虫框架爬取雪球App 基金频道新闻列表数据
7.1.1 App 数据爬取介绍
7.1.2 App 数据接口分析方法
7.1.3 使用Scrapy 爬取App 数据
7.1.4 技能实训
任务2 使用Scrapy 爬虫框架爬取知乎App 推荐栏目列表数据
7.2.1 爬取使用证书校验技术的App 数据
7.2.2 技能实训
本章小结
本章作业
第8 章分布式爬虫Scrapy-Redis
任务1 搭建分布式爬虫运行环境
8.1.1 分布式爬虫框架介绍
8.1.2 搭建分布式爬虫运行环境
任务2 使用分布式爬虫完成对火车信息的爬取
8.2.1 Scrapy-Redis 分布式爬虫
8.2.2 技能实训
本章小结
本章作业
第9 章Python 数据分析
任务1 使用Pandas 统计招聘信息中城市名称出现的次数
9.1.1 Python 数据分析
9.1.2 NumPy
9.1.3 Pandas
9.1.4 技能实训
任务2 使用Matplotlib 实现招聘信息中城市名称出现次数的可视化展示
9.2.1 数据可视化
9.2.2 技能实训
本章小结
本章作业
第10 章项目实训——爬取招聘网站数据
10.1 项目准备
10.2 难点分析
10.3 项目实现思路
本章小结
本章作业
展开全部
版权信息
出版社:人民邮电出版社
出版时间:2020
作者:肖睿 陈磊
温馨提示:
1.本电子书已获得正版授权,由出版社通过知传链发行。
2.该电子书为虚拟物品,付费之后概不接收任何理由退款。电子书内容仅支持在线阅读,不支持下载。
3.您在本站购买的阅读使用权仅限于您本人阅读使用,您不得/不能给任何第三方使用,由此造成的一切相关后果本平台保留向您追偿索赔的权利!版权所有,后果自负!
得书感谢您对《
Python网络爬虫(Scrapy框架)
》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。
实时热榜
Hot
查看全部 >
1
认知觉醒:开启自我改变的原动力
周岭
2
被讨厌的勇气
岸见一郎
3
自渡
墨多先生
读过此书的人也喜欢
Python网络爬虫基础教程
黑马程序员 编著
立即试读 >
Python网络爬虫与数据采集
主编
立即试读 >
Python网络爬虫技术(第2版)(微课版)
张良均 主编
立即试读 >
Python网络爬虫:从入门到精通(附微课)
吕云翔
立即试读 >
Python 3反爬虫原理与绕过实战
韦世东 著
立即试读 >
用Python实现深度学习框架
陈震
立即试读 >
读者好评
查看更多真实评价 >
Python网络爬虫(Scrapy框架)
免费读
(VIP)
开通会员,更多好书免费读
单本购买 ¥25.20
意见反馈
我的书架
公众号
关注微信公众号