- ISBN:9787302619109
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:其他
- 页数:140
- 出版时间:2022-11-01
- 条形码:9787302619109 ; 978-7-302-61910-9
本书特色
本书在内容编排上采用“基础知识” “代码示例” “应用案例”的模式,涵盖了互联网数据采集中*主要的知识点,通过真实的案例使用场景,让读者能举一反三,从而将技术应用到实际工作中。
内容简介
本书基于“基础知识” +“代码示例” +“应用案例”的模式编写,共包括 7个项目。项目 1主要介绍互联网数据采集的入门知识;项目 2通过一个入门级的简单案例,介绍互联网数据采集的基本流程;项目 3通过一个进阶的案例,详细介绍在没有给出官方开放 API的情况下,如何通过抓包工具获取 XHR请求地址;项目 4主要介绍 HTML文档数据的采集,对 HTML进行解析,以及如何提取数据的属性与文本;项目 5主要讲解批量获取数据的整理与合并技巧;项目 6重点讲解如何通过 Python的 pymysql库对 MySQL进行读写;项目 7给出了对半结构化数据进行处理的**实践。 本书内容条理清晰、案例丰富,可以作为职业院校大数据、人工智能、云计算等相关专业的教材,也可以作为行业从业人员的参考用书。 本书封面贴有清华大学出版社防伪标签,无标签者不得销售。
目录
作者简介
目录 Contents 项目 1.基础开发环境的安装与配置 ………………………………… 1 任务 1.1.通过 Anaconda3安装基础开发环境 ………………………………………… 4 任务 1.2.常见问题与解决方案 ……………………………………………………………13 项目总结 ………………………………………………………………………………………20 项目巩固与提高 ………………………………………………………………………………20 项目 2.通过国务院新闻网官方 API获取时政新闻 ……………… 21 任务 2.1.从开放的 API采集数据 …………………………………………………………23 任务 2.2.将数据存储到 Excel文件 ………………………………………………………27 项目总结 ………………………………………………………………………………………28 项目巩固与提高 ………………………………………………………………………………29 项目 3.采集巨潮资讯网的股票财经信息 ………………………… 30 任务 3.1. Chrome网络抓包工具的使用 …………………………………………………33 任务 3.2. 通过截获 XHR请求采集数据 ……………………………………………………35 任务 3.3. 采集更多信息 ……………………………………………………………………41 项目总结 ………………………………………………………………………………………44 项目巩固与提高 ………………………………………………………………………………45 IV 互联网数据采集技术与应用 项目4 采集网络个性头像… ………………………………………… 46 任务4.1 采集图片数据… ……………………………………………………………………52 任务4.2 二进制数据的存储… ………………………………………………………………60 项目总结…………………………………………………………………………………………76 项目巩固与提高…………………………………………………………………………………77 项目5 获取全国主要城市未来5 天的天气情况… ………………… 78 任务5.1 申请API 接口… ……………………………………………………………………79 任务5.2 采集天气数据… ……………………………………………………………………81 项目总结…………………………………………………………………………………………89 项目巩固与提高…………………………………………………………………………………90 项目6 对多个MySQL 数据库进行数据整合… …………………… 91 任务6.1 数据读取与合并… ……………………………………………………………… 104 项目总结……………………………………………………………………………………… 109 项目巩固与提高……………………………………………………………………………… 110 项目7 通过MongoDB 对半结构化Excel 数据进行高效存储… … 111 任务7.1 MongoDB 安装… ……………………………………………………………… 113 任务7.2 MongoDB shell 工具… ………………………………………………………… 122 任务7.3 pymongo 的安装与使用………………………………………………………… 124 任务7.4 批量将Excel 数据存入MongoDB… ………………………………………… 128 项目总结……………………………………………………………………………………… 130 项目巩固与提高……………………………………………………………………………… 130 参考文献… ……………………………………………………………… 131
-
乡村振兴新技术:新时代农村短视频编辑技术基础入门
¥12.8¥32.0 -
AI绘画+AI摄影+AI短视频从入门到精通
¥45.5¥79.8 -
企业AI之旅
¥43.5¥79.0 -
机器学习
¥59.4¥108.0 -
基于知识蒸馏的图像去雾技术
¥61.6¥88.0 -
软件设计的哲学(第2版)
¥51.0¥69.8 -
智能算法优化及其应用
¥52.4¥68.0 -
Photoshop图像处理
¥25.5¥49.0 -
R语言医学数据分析实践
¥72.3¥99.0 -
大模型推荐系统:算法原理、代码实战与案例分析
¥62.3¥89.0 -
剪映 从入门到精通
¥25.7¥59.8 -
游戏造梦师----游戏场景开发与设计
¥67.6¥98.0 -
SAR图像处理与检测
¥35.4¥49.8 -
人工智能
¥29.4¥42.0 -
中文版PHOTOSHOP 2024+AI修图入门教程
¥59.3¥79.0 -
WPS办公软件应用
¥25.2¥36.0 -
格拉斯曼流行学习及其在图像集分类中的应用
¥13.7¥28.0 -
轻松上手AIGC:如何更好地向CHATGPT提问
¥40.3¥62.0 -
元宇宙的理想与现实:数字科技大成的赋能与治理逻辑
¥61.6¥88.0 -
云原生安全:攻防与运营实战
¥66.8¥89.0