面向新工科专业建设计算机系列教材大数据分析技术与应用实践/王宇新等
- ISBN:9787302547211
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:其他
- 页数:221
- 出版时间:2020-06-01
- 条形码:9787302547211 ; 978-7-302-54721-1
本书特色
u 在数据时代,任何IT公司本质上都是数据公司,*核心的技能就是大数据技术,本书将带领你了解什么是大数据技术。 u 本书带领读者在Hadoop、MapReduce、Hive、Hbase、Spark这些耳熟能详的大数据名词中一探究竟,理解大数据分析与应用开发的核心理念。 u 本书以大数据中*炙手可热的互联网广告为实践应用,让大家充分领略到大数据技术的独特魅力。 u 本书有配套的教学课件、源代码、课程计划和教学大纲等资源,方便教学。
内容简介
本书首先从大数据技术概述出发,给出大数据领域的技术概貌及相关应用场景,从而使读者对大数据概念有清晰的认识;其次,本书采取topdown模式,先从计算广告这一具有代表性的应用实践着手,阐明大数据技术是如何应用并发挥效用的;再次,依次介绍大数据采集与处理、大数据存储与查询、大数据计算与分析等关键技术;很后,将关键技术引申到两类重要的大数据应用技术: 一类是Spark和机器学习应用,另一类是数据可视化应用。以此构建了一个大数据分析技术的基本闭环。除了内容的闭环体系之外,本书的另一大特色是将项目实践拆解融入各项关键技术中,从而实现理论与实践的有机融合,满足“新工科”建设的首要需求。 本书可作为高等院校计算机类专业的大数据分析、应用方面的理论或实践课程的教材,也可供自学者及从事计算机应用、大数据开发等的工程技术人员参考。
目录
第1章 大数据技术概述
1.1 大数据产品诞生
1.2 什么是大数据
1.3 大数据解决的问题场景
1.4 大数据与Google
习题1
第2章 计算广告介绍与课程应用实践
2.1 计算广告
2.1.1 互联网广告介绍
2.1.2 互联网广告效果评估
2.1.3 如何计算
2.1.4 计算广告系统
2.2 应用实践
2.2.1 应用实践数据
2.2.2 CTR预测
2.2.3 项目实践1:了解应用实践数据
2.2.4 项目实践2:实践环境搭建
习题2
第3章 大数据采集与处理
3.1 网络爬虫
3.1.1 网络爬虫介绍
3.1.2 构建一个网络爬虫的实践经验
3.1.3 HTTP介绍
3.1.4 网页解析与CSS选择器
3.1.5 项目实践3:抓取网页并提取标题和正文
3.2 ApacheKafka
3.2.1 系统架构
3.2.2 消息、主题和Schema
3.2.3 分区
3.2.4 生产者与消费者
3.2.5 代理
3.2.6 Kafka关键特性
3.2.7 项目实践4:通过Kafka进行数据处理
3.2.8 构建一个真实数据通道需要考虑的问题
3.3 ETL、ApacheFlume和其他框架
3.3.1 ETL
3.3.2 ApacheFlume
3.3.3 其他大数据采集处理框架
习题3
……
第4章 大数据存储与查询
第5章 大数据计算与分析
第6章 Spark和机器学习
第7章 数据可视化
作者简介
王宇新,博士,大连理工大学计算机科学与技术学院副教授,主管教学副院长,主要从事并行与分布式计算、人工智能异构计算、大数据分析与应用等领域的研究和实践工作、作为教学副院长重点关注大数据、人工智能和区块链等新兴技术在传统计算机专业中的教学推广,组织计算机科学与技术专业两次以6年有效期的成绩通过工程教育专业认证,汁算机科学与技术专业获得辽宁省本科教育示范专业,入选全国首批国家本科专业建设点。 齐恒,博士,大连理工大学计算机科学与技术学院副教授,博士生导师。主要从事未来网络体系及大数据汁算相关研究工作。承担并参与国家重点研发计划,国家自然科学基金重点项目、面上项强、青年基金及博士后特别资助等10余项科研项目。获得日本学术振兴会外国人特别研究员、辽宁省优秀科技工作者、ACM大连分会新展奖、首届“大连市青年科技之星”等荣誉称号。 杨鑫,博士,大连理工大学计算机科学与技术学院教授,博士生导师。主要从事计算机图形学与视觉、大数据技术、智能机器人技术等领域的研究。主持军口863项目、国家自然科学基金重大支持汁划培育项目、面上项目等熏要国家项目,研究成果发表在NeurIPS、CVPR、IJCAI,13D、EGSR、ICME、IEEE Transactionson Multimedia等领域会议和期刊上,入选中国科协“青年人才托举工程”和国家“香江学者计划”。
-
认识电竞
¥36.0¥58.0 -
物联网应用路线图
¥8.2¥39.0 -
整理优先:小改进,大回报,整洁代码设计指南
¥37.7¥49.0 -
开启创意之门 AIGC创作一本通
¥70.0¥89.8 -
生物特征识别算法研究
¥22.2¥39.0 -
计算机视觉:从感知到重建
¥108.8¥149.0 -
AI时代程序员开发之道:CHATGPT让程序员插上翅膀
¥60.0¥79.0 -
一本书玩转MIDJOURNEY:人人都可以体验AI绘画的魅力
¥102.9¥139.0 -
和秋叶一起学EXCEL(第3版)
¥76.9¥109.9 -
矩阵力量:线性代数全彩图解+微课+Python编程
¥206.4¥258.0 -
技术为径:带领公司走向卓越的工程师
¥46.6¥79.0 -
图神经网络:基础、前沿与应用
¥139.5¥178.8 -
这才是服务设计
¥123.9¥199.8 -
全国计算机等级考试一本通 二级MS Office高级应用与设计
¥54.5¥69.9 -
设计机器学习系统
¥103.5¥138.0 -
中望CAD实用教程
¥62.3¥79.9 -
软件性能测试——LoadRunner性能监控与分析实例详解
¥63.2¥79.0 -
走进智能家居
¥35.6¥44.0 -
Autodesk Fusion 360 官方标准教程
¥119.2¥149.0 -
HCIA-Datacom网络技术学习指南/华为ICT认证系列丛书
¥124.6¥159.8