暂无评论
图文详情
- ISBN:9787563559152
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:26cm
- 页数:180页
- 出版时间:2020-01-01
- 条形码:9787563559152 ; 978-7-5635-5915-2
内容简介
本书是大数据方向本科生的专业选修课教材。教材包括综述性内容、技术性内容和实践性内容。其中, 综述性内容包括大数据技术综述、流数据分析技术综述。技术性内容包括流数据采集技术、流数据处理技术、流数据存储技术、流数据分析技术等。
目录
第1章 流数据与流计算
1.1 大数据
1.1.1 大数据的发展
1.1.2 大数据的概念
1.1.3 大数据思维
1.2 流数据
1.2.1 流数据的场景
1.2.2 流数据的特点
1.2.3 流数据的概念
1.3 流数据处理
1.3.1 批处理模型
1.3.2 流式处理模型
1.3.3 流式处理与窗口模型
1.3.4 流式处理与概要结构
1.3.5 批处理与流式处理的对比
1.4 流数据分析
1.4.1 频繁项挖掘算法
1.4.2 聚类算法
1.4.3 分类算法
1.4.4 回归算法
1.5 流数据机器学习
1.6 小结
本章知识点
扩展阅读
习题1
第2章 流数据概要结构构建技术
2.1 流数据处理的概要结构
2.2 抽样概要结构
2.2.1 抽样
2.2.2 伯努利抽样
2.2.3 水库抽样
2.2.4 简明抽样
2.3 草图概要结构
2.3.1 草图
2.3.2 计数草图
2.3.3 增广草图
2.3.4 布隆过滤器
2.3.5 FM基数估计草图
2.4 小波概要结构
2.5 直方图概要结构
2.5.1 直方图
2.5.2 等宽直方图
2.6 小结
本章知识点
扩展阅读
习题2
第3章 流数据频繁模式挖掘技术
3.1 频繁模式挖掘问题的定义
3.2 不同窗口模型的频繁模式挖掘
3.3 频繁项挖掘算法
3.3.1 黏性抽样算法
3.3.2 KPS算法
3.4 频繁模式挖掘算法
3.4.1 有损计数算法
3.4.2 有损计数算法扩展
3.5 频繁模式挖掘的其他相关问题
3.6 小结
本章知识点
扩展阅读
习题3
第4章 流数据聚类分析技术
4.1 聚类算法
4.2 流数据聚类的评价
4.2.1 内部度量
4.2.2 外部度量
4.3 不同窗口模型的聚类分析
4.4 基于划分的流数据聚类算法
4.4.1 STREAM算法
4.4.2 K-Center算法
4.5 基于层次的流数据聚类算法
4.6 基于密度的流数据聚类算法
4.7 基于网格的流数据聚类算法
4.8 其他流数据聚类算法
4.8.1 K-Median算法
4.8.2 BIRCH算法
4.9 小结
本章知识点
扩展阅读
习题4
第5章 流数据分类分析技术
5.1 。分类算法
5.2 流数据分类的评价
5.2.1 误差估计
5.2.2 性能评价指标
5.2.3 统计显著性
5.2.4 成本度量
5.3 基于贝叶斯的分类算法
5.4 基于决策树的分类算法
5.4.1 快速决策树算法
5.4.2 概念自适应快速决策树算法
5.5 其他流数据分类算法
5.5.1 VFDTc和UFFT算法
5.5.2 Hoeffding自适应树算法
5.6 小结
本章知识点
扩展阅读
习题5
第6章 流数据学习与时间序列分析技术
6.1 时间序列
6.1.1 时间序列的分类与特征
6.1.2 时间序列的表示与拟合
6.1.3 时间序列的预测
6.2 在线学习模型
6.3 流数据学习评价
6.3.1 误差
6.3.2 Regret界
6.4 模型学习算法
6.4.1 ARIMA算法
6.4.2 在线ARIMA算法
6.5 实例学习算法
6.5.1 岭回归与LASSO回归
6.5.2 FIMT算法
6.5.3 AMRules算法
6.6 *优化算法
6.6.1 SGD算法
6.6.2 FTRL算法
6.7 小结
本章知识点
扩展阅读
习题6
第7章 流数据处理模型与框架
7.1 流数据处理计算模型
7.2 流计算的状态与一致性
7.2.1 流计算的状态
7.2.2 流计算的一致性
7.3 流计算处理中的时间
7.4 流计算实现框架
7.5 Storm流处理框架
7.5.1 基于流的处理拓扑结构
7.5.2 记录级容错
7.5.3 Storm的系统架构
7.6 Spark流处理框架
7.6.1 基于RDD的微批处理结构
7.6.2 基于RDD依赖的容错
7.6.3 Spark的系统架构
7.7 Flink流处理框架
7.7.1 基于流水线的处理结构
7.7.2 基于分布式快照的容错
7.7.3 Flink的系统架构
7.8 小结
本章知识点
扩展阅读
习题7
参考文献
1.1 大数据
1.1.1 大数据的发展
1.1.2 大数据的概念
1.1.3 大数据思维
1.2 流数据
1.2.1 流数据的场景
1.2.2 流数据的特点
1.2.3 流数据的概念
1.3 流数据处理
1.3.1 批处理模型
1.3.2 流式处理模型
1.3.3 流式处理与窗口模型
1.3.4 流式处理与概要结构
1.3.5 批处理与流式处理的对比
1.4 流数据分析
1.4.1 频繁项挖掘算法
1.4.2 聚类算法
1.4.3 分类算法
1.4.4 回归算法
1.5 流数据机器学习
1.6 小结
本章知识点
扩展阅读
习题1
第2章 流数据概要结构构建技术
2.1 流数据处理的概要结构
2.2 抽样概要结构
2.2.1 抽样
2.2.2 伯努利抽样
2.2.3 水库抽样
2.2.4 简明抽样
2.3 草图概要结构
2.3.1 草图
2.3.2 计数草图
2.3.3 增广草图
2.3.4 布隆过滤器
2.3.5 FM基数估计草图
2.4 小波概要结构
2.5 直方图概要结构
2.5.1 直方图
2.5.2 等宽直方图
2.6 小结
本章知识点
扩展阅读
习题2
第3章 流数据频繁模式挖掘技术
3.1 频繁模式挖掘问题的定义
3.2 不同窗口模型的频繁模式挖掘
3.3 频繁项挖掘算法
3.3.1 黏性抽样算法
3.3.2 KPS算法
3.4 频繁模式挖掘算法
3.4.1 有损计数算法
3.4.2 有损计数算法扩展
3.5 频繁模式挖掘的其他相关问题
3.6 小结
本章知识点
扩展阅读
习题3
第4章 流数据聚类分析技术
4.1 聚类算法
4.2 流数据聚类的评价
4.2.1 内部度量
4.2.2 外部度量
4.3 不同窗口模型的聚类分析
4.4 基于划分的流数据聚类算法
4.4.1 STREAM算法
4.4.2 K-Center算法
4.5 基于层次的流数据聚类算法
4.6 基于密度的流数据聚类算法
4.7 基于网格的流数据聚类算法
4.8 其他流数据聚类算法
4.8.1 K-Median算法
4.8.2 BIRCH算法
4.9 小结
本章知识点
扩展阅读
习题4
第5章 流数据分类分析技术
5.1 。分类算法
5.2 流数据分类的评价
5.2.1 误差估计
5.2.2 性能评价指标
5.2.3 统计显著性
5.2.4 成本度量
5.3 基于贝叶斯的分类算法
5.4 基于决策树的分类算法
5.4.1 快速决策树算法
5.4.2 概念自适应快速决策树算法
5.5 其他流数据分类算法
5.5.1 VFDTc和UFFT算法
5.5.2 Hoeffding自适应树算法
5.6 小结
本章知识点
扩展阅读
习题5
第6章 流数据学习与时间序列分析技术
6.1 时间序列
6.1.1 时间序列的分类与特征
6.1.2 时间序列的表示与拟合
6.1.3 时间序列的预测
6.2 在线学习模型
6.3 流数据学习评价
6.3.1 误差
6.3.2 Regret界
6.4 模型学习算法
6.4.1 ARIMA算法
6.4.2 在线ARIMA算法
6.5 实例学习算法
6.5.1 岭回归与LASSO回归
6.5.2 FIMT算法
6.5.3 AMRules算法
6.6 *优化算法
6.6.1 SGD算法
6.6.2 FTRL算法
6.7 小结
本章知识点
扩展阅读
习题6
第7章 流数据处理模型与框架
7.1 流数据处理计算模型
7.2 流计算的状态与一致性
7.2.1 流计算的状态
7.2.2 流计算的一致性
7.3 流计算处理中的时间
7.4 流计算实现框架
7.5 Storm流处理框架
7.5.1 基于流的处理拓扑结构
7.5.2 记录级容错
7.5.3 Storm的系统架构
7.6 Spark流处理框架
7.6.1 基于RDD的微批处理结构
7.6.2 基于RDD依赖的容错
7.6.3 Spark的系统架构
7.7 Flink流处理框架
7.7.1 基于流水线的处理结构
7.7.2 基于分布式快照的容错
7.7.3 Flink的系统架构
7.8 小结
本章知识点
扩展阅读
习题7
参考文献
展开全部
作者简介
李静林,博士、副教授,2004年获得北京邮电大学计算机应用技术博士学位。现任北京邮电大学网络与交换技术国家重点实验室交换与智能控制研究中心主任。主要研究方向为移动互联网、物联网、车联网等融合网络智能与服务计算。
本类五星书
浏览历史
本类畅销
-
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
硅谷之火-人与计算机的未来
¥14.3¥39.8 -
全图解零基础word excel ppt 应用教程
¥12.0¥48.0 -
机器学习
¥59.4¥108.0 -
深度学习的数学
¥43.5¥69.0 -
智能硬件项目教程:基于ARDUINO(第2版)
¥37.7¥65.0 -
元启发式算法与背包问题研究
¥38.2¥49.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥62.9¥89.8 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
剪映AI
¥52.8¥88.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥77.4¥109.0 -
UG NX 12.0数控编程
¥24.8¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
界面交互设计理论研究
¥30.8¥56.0 -
UN NX 12.0多轴数控编程案例教程
¥25.8¥38.0 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0 -
Go 语言运维开发 : Kubernetes 项目实战
¥48.2¥79.0 -
明解C语言:实践篇
¥62.9¥89.8 -
Linux服务器架设实战(Linux典藏大系)
¥84.5¥119.0