暂无评论
图文详情
- ISBN:9787113303587
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:240
- 出版时间:2023-10-01
- 条形码:9787113303587 ; 978-7-113-30358-7
内容简介
本书以项目的形式讲授了静态网页数据的爬取和数据解析,抓取动态网页的数据并解析、利用Scrapy框架进行爬虫、爬取APP数据、模拟登录、代理爬虫等爬虫技术,教材以就业为导向,以能力为本位,为培养高素质技能型专业人才服务,同时教材对接1+X职业技能标准,是基于工作过程的形式开发完成的活页教材,依据“任务导向”“目标先行”、“兴趣诱发”的学习动机发展条件来进行的组织形式课程内容。. 本书可作为高职大数据相关专业的教材,也可以作为Python爬虫与数据采集相关教学和培训教材,也可作为相关技术人员的自学参考书。
目录
项目一 静态网页爬取与解析
任务1 搭建静态网页爬虫环境
任务分析
导学
学习资料
1.爬虫基本概念
2.爬虫实现原理
3.静态网页爬虫环境搭建
任务实施
任务评价
任务2 爬取北京市旅游景点信息
任务分析
导学
学习资料
1.HTTP
2.网页组成
3.urllib库
4.Requests模块
任务实施
任务评价
任务3 解析并保存北京市旅游景点
数据
任务分析
导学
学习资料
1.正则表达式
2.使用XPath
3.Beautiful Soup库
任务实施
任务评价
项目二 爬取动态内容
任务1 安装Selenium
任务分析
导学
学习资料
任务实施
任务评价
任务2 利用Selerlium爬取京东商品信息数据
任务分析
导学
学习资料
1.Selenium简介
2.Selenium的应用
任务实施
任务评价
项目三 利用爬虫框架Scrapy爬虫
任务1 安装Scrapy框架
任务分析
导学
学习资料
1.Anaconda安装
2.Windows下的安装
任务实施
任务评价
任务2 利用Scrapy框架制作Spiders爬取网页数据
任务分析
导学
学习资料
1.Scrapy框架介绍
2.Scrapy的数据流
3.Scrapy常用命令
任务实施
任务评价
项目四 爬虫代理和模拟登录
任务1 爬虫代理
任务分析
导学
学习资料
1.代理基本原理
2.代理的作用
3.代理分类
4.Requests库使用IP代理的方法
5.构建代理池
任务实施
任务评价
任务2 模拟登录
任务分析
导学
学习资料
1.用户登录
2.Cookie
3.Session
4.JWT
5.基于Session和Cookie的模拟登录
6.基于Session和Cookie的模拟登录实例
任务实施
任务评价
项目五 App的爬取
任务1 App爬虫环境搭建
任务分析
导学
学习资料
1.App爬取的主要流程
2.Charles的安装
3.安装JAVA JDK
4.安装Android SDK Tools
5.Appium的安装
任务实施
任务评价
任务2 爬取微博主页推荐信息
任务分析
导学
学习资料
1.Charles简介
2.Appium简介
任务实施
任务评价
参考文献
展开全部
作者简介
方水平,男,1970年2月生,教授,近几年主编了多部教材,多种图书被评为“十二五”“十三五”职业教育国家规划教材,主持多项信息化教学设计项目获得北京市二等奖。指导学生参加技能大赛获得良好的成绩,连续获得5个 职业院校学生技能大赛一等奖,被北京市教w授予“ 席指导教师称号”,2018年主持课题获北京市教育成果二等奖。
本类五星书
本类畅销
-
MySQL数据库案例教程
¥34.9¥49.8 -
硅谷之火-人与计算机的未来
¥12.7¥39.8 -
删繁就简-单片机入门到精通
¥27.3¥39.0 -
计算
¥92.2¥128.0 -
秒懂剪映应用技巧
¥43.7¥59.8 -
抖音短视频
¥18.1¥42.0 -
C语言程序设计
¥31.9¥45.5 -
C程序设计(第五版)
¥34.3¥49.0 -
C语言程序设计(第4版)
¥41.3¥59.0 -
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
人工智能
¥17.6¥55.0 -
UNIX环境高级编程(第3版)
¥174.0¥229.0 -
中文版PHOTOSHOP 2024完全自学教程
¥83.9¥119.8 -
智能控制与强化学习先进值迭代评判设计
¥104.9¥139.8 -
实战数据可视化Excel篇
¥27.4¥49.8 -
人工智能应用基础(第2版)
¥32.7¥46.0 -
做好课题申报:AI辅助申请书写作
¥48.9¥69.8 -
企业AI之旅
¥43.5¥79.0 -
高效写论文:AI辅助学术论文写作
¥48.9¥69.8 -
因果漫步
¥65.0¥89.0