包邮网络爬虫与数据采集

1星价 ¥42.3 (7.2折)

2星价￥42.3 定价￥59.0

作者：陈静

出版社：天津大学出版社

本类榜单：计算机/网络

分类：计算机/网络 > 计算机教材

暂无评论

图文详情

ISBN：9787561876770
装帧：一般胶版纸
册数：暂无
重量：暂无
开本：16开
页数：200
出版时间：2024-02-01
条形码：9787561876770 ; 978-7-5618-7677-0

内容简介

随着互联网的迅速发展，网络上的资源和信息呈现爆发式增长。此外，越来越多的网站和应用程序提供了丰富的数据，并为开发者提供了接口，以便让他们使用和利用这些数据。在这种情况下，网络爬虫作为一种能够自动采集并处理互联网上的信息的工具，逐渐成为了数据采集和分析过程中不可或缺的一部分。在数据采集方面，网络爬虫可以用于获取互联网上的各种数据，例如新闻、评论、商品信息、用户数据等。通过网络爬虫，研究人员、企业和个人都可以快速、准确地获取大量数据，并对其进行分析和挖掘。这些数据可以被用来制定商业决策、预测市场趋势、评估产品竞争力、推荐产品或服务等。本书由七个项目组成，分为初识网络爬虫、基于Python库实现静态数据采集、基于urllib实现客户端数据采集、基于Requests-HTML实现动态数据采集、基于Scrapy框架实现网页数据采集、基于 Scrapy-redis分布式实现网页数据采集以及基于自动化测试工具实现网页数据采集，内容简明扼要，由浅入深，循序渐进。

项目一初识网络爬虫项目导言任务一网络爬虫概述任务描述任务技能任务实施任务二网络爬虫技术及平台任务描述任务技能任务实施项目总结英语角课后习题项目二基于Python库实现静态数据采集项目导言任务一使用Requests库发起HTTP请求任务描述任务技能任务实施任务二使用BeautifulSoup库提取新闻数据任务描述任务技能任务实施任务三使用LXML解析器提取新闻数据任务描述任务技能任务实施项目总结英语角课后习题项目三基于urllib实现客户端数据采集项目导言任务一安装Fiddler并对APP抓包任务描述任务技能任务实施任务二使用urllib采集APP数据任务描述任务技能任务实施项目总结英语角课后习题项目四基于Requests-HTML实现动态数据采集项目导言任务一使用Requests-HTML库爬取静态网站任务描述任务技能任务实施任务二使用Requests-HTML库清洗数据

展开全部

作者简介

山东劳动职业技术学院：山东劳动职业技术学院始建于1955年，坐落于风景秀丽的历史文化名城山东济南市，新校区位于长清大学科技园区，占地1400余亩是一所具有鲜明办学特色的全日制普通高等院校，学院是“全国职业教育先进单位”、“国家高技能人才培养示范基地”、“山东省高校首批技能型特色名校”、并被人社部等十部委授予“国家技能人才培育突出贡献奖”。天津滨海迅腾科技集团有限公司：公司系国家高新技术企业、天津市**批产教融合型企业、天津市瞪羚企业，主营业务包括信息化集成、IT服务、产教融合服务等；公司党建带群建工作走在全是非公企业前列，荣获全国模范和谐企业、天津市五一劳动奖状先进单位、天津市文明单位等数十项殊荣；多年中自主研发天津市科技成果3项，软件著作权43项，发明专利3项，开发基于工作过程项目式教材70余种。2020-2021年编写《数据可视化项目实战》《TensorFlow项目式案例实战》《Spark应用技术与处理》《Photoshop核心技术项目实战》《职业能力与就业指导教程》《网店运营案例分析项目实战》《Adobe After Effects CC 2018视频后期效果处理》《基于Vue的JavaWeb项目实战》《大数据应用开发案例实践教程》《全景效果图案例设计教程》等20余本教材。 2021-2022年编写《软件测试项目实战》《人工智能系统平台实施中级》《三维动画制作任务式教程——MAYA从入门到精通》《大学生职业素质与就业指导教程》《网络管理与配置》《Python项目实战》《新媒体营销综合案例教程》《工业互联网综合项目实战》《网页设计与制作—HTML5+CSS3项目实战》《Django Web项目实战》等10余本教材。

本类五星书

更多>>

浏览历史

网络爬虫与数据采集

陈静

¥42.3¥59.0

本类畅销

×

包邮网络爬虫与数据采集

内容简介

目录

作者简介

预估到手价 ×