- ISBN:9787302619109
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:其他
- 页数:140
- 出版时间:2022-11-01
- 条形码:9787302619109 ; 978-7-302-61910-9
本书特色
本书在内容编排上采用“基础知识” “代码示例” “应用案例”的模式,涵盖了互联网数据采集中*主要的知识点,通过真实的案例使用场景,让读者能举一反三,从而将技术应用到实际工作中。
内容简介
本书基于“基础知识” +“代码示例” +“应用案例”的模式编写,共包括 7个项目。项目 1主要介绍互联网数据采集的入门知识;项目 2通过一个入门级的简单案例,介绍互联网数据采集的基本流程;项目 3通过一个进阶的案例,详细介绍在没有给出官方开放 API的情况下,如何通过抓包工具获取 XHR请求地址;项目 4主要介绍 HTML文档数据的采集,对 HTML进行解析,以及如何提取数据的属性与文本;项目 5主要讲解批量获取数据的整理与合并技巧;项目 6重点讲解如何通过 Python的 pymysql库对 MySQL进行读写;项目 7给出了对半结构化数据进行处理的**实践。 本书内容条理清晰、案例丰富,可以作为职业院校大数据、人工智能、云计算等相关专业的教材,也可以作为行业从业人员的参考用书。 本书封面贴有清华大学出版社防伪标签,无标签者不得销售。
目录
作者简介
目录 Contents 项目 1.基础开发环境的安装与配置 ………………………………… 1 任务 1.1.通过 Anaconda3安装基础开发环境 ………………………………………… 4 任务 1.2.常见问题与解决方案 ……………………………………………………………13 项目总结 ………………………………………………………………………………………20 项目巩固与提高 ………………………………………………………………………………20 项目 2.通过国务院新闻网官方 API获取时政新闻 ……………… 21 任务 2.1.从开放的 API采集数据 …………………………………………………………23 任务 2.2.将数据存储到 Excel文件 ………………………………………………………27 项目总结 ………………………………………………………………………………………28 项目巩固与提高 ………………………………………………………………………………29 项目 3.采集巨潮资讯网的股票财经信息 ………………………… 30 任务 3.1. Chrome网络抓包工具的使用 …………………………………………………33 任务 3.2. 通过截获 XHR请求采集数据 ……………………………………………………35 任务 3.3. 采集更多信息 ……………………………………………………………………41 项目总结 ………………………………………………………………………………………44 项目巩固与提高 ………………………………………………………………………………45 IV 互联网数据采集技术与应用 项目4 采集网络个性头像… ………………………………………… 46 任务4.1 采集图片数据… ……………………………………………………………………52 任务4.2 二进制数据的存储… ………………………………………………………………60 项目总结…………………………………………………………………………………………76 项目巩固与提高…………………………………………………………………………………77 项目5 获取全国主要城市未来5 天的天气情况… ………………… 78 任务5.1 申请API 接口… ……………………………………………………………………79 任务5.2 采集天气数据… ……………………………………………………………………81 项目总结…………………………………………………………………………………………89 项目巩固与提高…………………………………………………………………………………90 项目6 对多个MySQL 数据库进行数据整合… …………………… 91 任务6.1 数据读取与合并… ……………………………………………………………… 104 项目总结……………………………………………………………………………………… 109 项目巩固与提高……………………………………………………………………………… 110 项目7 通过MongoDB 对半结构化Excel 数据进行高效存储… … 111 任务7.1 MongoDB 安装… ……………………………………………………………… 113 任务7.2 MongoDB shell 工具… ………………………………………………………… 122 任务7.3 pymongo 的安装与使用………………………………………………………… 124 任务7.4 批量将Excel 数据存入MongoDB… ………………………………………… 128 项目总结……………………………………………………………………………………… 130 项目巩固与提高……………………………………………………………………………… 130 参考文献… ……………………………………………………………… 131
-
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
硅谷之火-人与计算机的未来
¥14.3¥39.8 -
全图解零基础word excel ppt 应用教程
¥12.0¥48.0 -
机器学习
¥59.4¥108.0 -
深度学习的数学
¥43.5¥69.0 -
智能硬件项目教程:基于ARDUINO(第2版)
¥37.7¥65.0 -
元启发式算法与背包问题研究
¥38.2¥49.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥62.9¥89.8 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
剪映AI
¥52.8¥88.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥77.4¥109.0 -
UG NX 12.0数控编程
¥24.8¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
界面交互设计理论研究
¥30.8¥56.0 -
UN NX 12.0多轴数控编程案例教程
¥25.8¥38.0 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0 -
Go 语言运维开发 : Kubernetes 项目实战
¥48.2¥79.0 -
明解C语言:实践篇
¥62.9¥89.8 -
Linux服务器架设实战(Linux典藏大系)
¥84.5¥119.0