- ISBN:9787576325201
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:29cm
- 页数:133页
- 出版时间:2023-06-01
- 条形码:9787576325201 ; 978-7-5763-2520-1
内容简介
本书收集了大数据采集与爬虫相关的编程案例,分4个单元进行讲解,包括单元一爬虫与网页、单元二文本类网站的爬虫、单元三图片资源的爬虫、单元四JupyterNotebook(anaconda3)爬虫编程基础,共讲解了28个编程案例。本书案例内容包括爬虫程序的工作原理,从网站爬取收集有需要的代码、文字、图片等资源的技能,讲解以案例应用的形式呈现,并把技能应用结合案例实现过程,以效果目标引领编程,同时,注重理论知识贯穿于案例中。
目录
标签的内容
任务五 爬取网页多个标签的所有文本
任务六 根据标签类名爬取网页标签内容
任务七 用getall()方法爬取网页标签内容
任务八 爬取网页中所有超链接的网址
任务九 爬取网页中超链接目标的标题
任务十 爬取网页中所有标签
项目二 文本类网站的爬虫
任务一 爬取网页特定区域的内容
任务二 爬取网页两个特定区域的内容并分别保存于两个文件中
任务三 爬取网页招聘信息
任务四 爬取两个网页内容合并保存
任务五 从网页爬取商品销售信息并排序保存
任务六 爬取网站的小说文本
作者简介
孔令勇,男,2014.9―2020.10重庆市永川职业教育中心党委委员、副校长;2020.10―重庆市永川职业教育中心党委书记、校长。参加了重庆市教委的重点课题《职业教育产教融合研究》;牵头开展了重庆市科协组织的《中职教师发展现状与需求研究》。曾在《科学咨询》《重庆文理学院校报》《永川观察》上发表了论文;参与《中职计算机应用专业》教材编写;参与重庆市职业教育有关政策、规划的起草等。
-
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
全图解零基础word excel ppt 应用教程
¥12.0¥48.0 -
机器学习
¥59.4¥108.0 -
深度学习的数学
¥43.5¥69.0 -
智能硬件项目教程:基于ARDUINO(第2版)
¥37.7¥65.0 -
硅谷之火-人与计算机的未来
¥14.3¥39.8 -
元启发式算法与背包问题研究
¥38.2¥49.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥62.9¥89.8 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
剪映AI
¥52.8¥88.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥77.4¥109.0 -
UG NX 12.0数控编程
¥24.8¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
界面交互设计理论研究
¥30.8¥56.0 -
UN NX 12.0多轴数控编程案例教程
¥25.8¥38.0 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0 -
明解C语言:实践篇
¥62.9¥89.8 -
Linux服务器架设实战(Linux典藏大系)
¥84.5¥119.0 -
PREMIERE PRO 2023全面精通:视频剪辑+颜色调整+转场特效+字幕制作+案例实战
¥69.3¥99.0