×
暂无评论
图文详情
  • ISBN:9787113303587
  • 装帧:一般胶版纸
  • 册数:暂无
  • 重量:暂无
  • 开本:16开
  • 页数:240
  • 出版时间:2023-10-01
  • 条形码:9787113303587 ; 978-7-113-30358-7

内容简介

本书以项目的形式讲授了静态网页数据的爬取和数据解析,抓取动态网页的数据并解析、利用Scrapy框架进行爬虫、爬取APP数据、模拟登录、代理爬虫等爬虫技术,教材以就业为导向,以能力为本位,为培养高素质技能型专业人才服务,同时教材对接1+X职业技能标准,是基于工作过程的形式开发完成的活页教材,依据“任务导向”“目标先行”、“兴趣诱发”的学习动机发展条件来进行的组织形式课程内容。. 本书可作为高职大数据相关专业的教材,也可以作为Python爬虫与数据采集相关教学和培训教材,也可作为相关技术人员的自学参考书。

目录

项目一 静态网页爬取与解析 任务1 搭建静态网页爬虫环境 任务分析 导学 学习资料 1.爬虫基本概念 2.爬虫实现原理 3.静态网页爬虫环境搭建 任务实施 任务评价 任务2 爬取北京市旅游景点信息 任务分析 导学 学习资料 1.HTTP 2.网页组成 3.urllib库 4.Requests模块 任务实施 任务评价 任务3 解析并保存北京市旅游景点 数据 任务分析 导学 学习资料 1.正则表达式 2.使用XPath 3.Beautiful Soup库 任务实施 任务评价 项目二 爬取动态内容 任务1 安装Selenium 任务分析 导学 学习资料 任务实施 任务评价 任务2 利用Selerlium爬取京东商品信息数据 任务分析 导学 学习资料 1.Selenium简介 2.Selenium的应用 任务实施 任务评价 项目三 利用爬虫框架Scrapy爬虫 任务1 安装Scrapy框架 任务分析 导学 学习资料 1.Anaconda安装 2.Windows下的安装 任务实施 任务评价 任务2 利用Scrapy框架制作Spiders爬取网页数据 任务分析 导学 学习资料 1.Scrapy框架介绍 2.Scrapy的数据流 3.Scrapy常用命令 任务实施 任务评价 项目四 爬虫代理和模拟登录 任务1 爬虫代理 任务分析 导学 学习资料 1.代理基本原理 2.代理的作用 3.代理分类 4.Requests库使用IP代理的方法 5.构建代理池 任务实施 任务评价 任务2 模拟登录 任务分析 导学 学习资料 1.用户登录 2.Cookie 3.Session 4.JWT 5.基于Session和Cookie的模拟登录 6.基于Session和Cookie的模拟登录实例 任务实施 任务评价 项目五 App的爬取 任务1 App爬虫环境搭建 任务分析 导学 学习资料 1.App爬取的主要流程 2.Charles的安装 3.安装JAVA JDK 4.安装Android SDK Tools 5.Appium的安装 任务实施 任务评价 任务2 爬取微博主页推荐信息 任务分析 导学 学习资料 1.Charles简介 2.Appium简介 任务实施 任务评价 参考文献
展开全部

作者简介

方水平,男,1970年2月生,教授,近几年主编了多部教材,多种图书被评为“十二五”“十三五”职业教育国家规划教材,主持多项信息化教学设计项目获得北京市二等奖。指导学生参加技能大赛获得良好的成绩,连续获得5个 职业院校学生技能大赛一等奖,被北京市教w授予“ 席指导教师称号”,2018年主持课题获北京市教育成果二等奖。

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航