Python网络爬虫 Scrapy框架
温馨提示:5折以下图书主要为出版社尾货,大部分为全新(有塑封/无塑封),个别图书品相8-9成新、切口有划线标记、光盘等附件不全详细品相说明>>
- ISBN:9787115527295
- 装帧:简裝本
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:199
- 出版时间:2020-01-01
- 条形码:9787115527295 ; 978-7-115-52729-5
内容简介
互联网上存在着大量值得收集的公共信息,而爬虫技术就是获取这些公共信息的主要工具。《Python网络爬虫(Scrapy框架)》以主流的Scrapy爬虫框架为例,介绍了Python网络爬虫的组成、爬虫框架的使用以及分布式爬虫等内容。《Python网络爬虫(Scrapy框架)》运用了大量案例和实践,融入了含金量十足的开发经验,使得内容紧密结合实际应用。在此基础上,《Python网络爬虫(Scrapy框架)》还通过丰富的练习和操作实践,帮助读者巩固所学的内容。《Python网络爬虫(Scrapy框架)》配以多元的学习资源和支持服务,包括视频、案例素材、学习社区等,为读者提供全方位的学习体验。 《Python网络爬虫(Scrapy框架)》适合作为计算机、大数据等相关专业的教材,也适合具有一定Linux或Python开发基础的人员阅读,还可以作为爬虫工程师的学习用书。
目录
任务1 使用第三方库实现北京公交站点页面信息抓取
1.1.1 介绍爬虫
1.1.2 HTTP
1.1.3 HTML
1.1.4 使用第三方库实现爬虫功能
1.1.5 技能实训
任务2 使用第三方库实现北京公交站点详细信息抓取
1.2.1 lxml库
1.2.2 第三方库数据抓取及保存
1.2.3 技能实训
本章小结
本章作业
第2章 初探Scrapy爬虫框架
任务1 安装Scrapy爬虫框架并创建爬虫工程
2.1.1 根据使用场景划分爬虫种类
2.1.2 开发基于Scrapy爬虫框架的工程
任务2 学习并掌握Scrapy爬虫框架各模块的功能
2.2.1 Scrapy爬虫工程组成
2.2.2 Scrapy爬虫框架架构
本章小结
本章作业
第3章 提取网页数据
任务1 使用Scrapy的选择器提取豆瓣电影信息
3.1.1 Response对象
3.1.2 css选择器
3.1.3 多层级网页爬取
3.1.4 技能实训
任务2 使用正则表达式从电影介绍详情中提取信息
3.2.1 正则表达式
3.2.2 技能实训
本章小结
本章作业
第4章 Scrapy数据保存(文件、MySQL、MongoDB)
任务一 使用Feed exports将爬取的电影信息保存到常见数据格式文件中
4.1.1 Feed exports
4.1.2 技能实训
任务2 使用pipeline将爬取的电影信息数据保存到数据库中
4.2.1 Python操作MySQL数据库
4.2.2 pipeline模块
4.2.3 将数据保存到MongoDB中
4.2.4 技能实训
本章小结
本章作业
第5章 Scrapy反反爬技术
任务1 学习反爬虫和反反爬虫策略
5.1.1 反爬虫方法和反反爬虫策略
5.1.2 Scrapy设置实现反反爬
5.1.3 技能实训
任务2 学习Scrapy框架中*多常用的设置
……
-
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
全图解零基础word excel ppt 应用教程
¥12.0¥48.0 -
机器学习
¥59.4¥108.0 -
深度学习的数学
¥43.5¥69.0 -
智能硬件项目教程:基于ARDUINO(第2版)
¥37.7¥65.0 -
硅谷之火-人与计算机的未来
¥14.3¥39.8 -
元启发式算法与背包问题研究
¥38.2¥49.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥62.9¥89.8 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
剪映AI
¥52.8¥88.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥77.4¥109.0 -
UG NX 12.0数控编程
¥24.8¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
界面交互设计理论研究
¥30.8¥56.0 -
UN NX 12.0多轴数控编程案例教程
¥25.8¥38.0 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0 -
明解C语言:实践篇
¥62.9¥89.8 -
Linux服务器架设实战(Linux典藏大系)
¥84.5¥119.0 -
Visual Basic 语言程序设计基础(第6版)
¥32.0¥45.0