暂无评论
图文详情
- ISBN:9787563559152
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:26cm
- 页数:180页
- 出版时间:2020-01-01
- 条形码:9787563559152 ; 978-7-5635-5915-2
内容简介
本书是大数据方向本科生的专业选修课教材。教材包括综述性内容、技术性内容和实践性内容。其中, 综述性内容包括大数据技术综述、流数据分析技术综述。技术性内容包括流数据采集技术、流数据处理技术、流数据存储技术、流数据分析技术等。
目录
第1章 流数据与流计算
1.1 大数据
1.1.1 大数据的发展
1.1.2 大数据的概念
1.1.3 大数据思维
1.2 流数据
1.2.1 流数据的场景
1.2.2 流数据的特点
1.2.3 流数据的概念
1.3 流数据处理
1.3.1 批处理模型
1.3.2 流式处理模型
1.3.3 流式处理与窗口模型
1.3.4 流式处理与概要结构
1.3.5 批处理与流式处理的对比
1.4 流数据分析
1.4.1 频繁项挖掘算法
1.4.2 聚类算法
1.4.3 分类算法
1.4.4 回归算法
1.5 流数据机器学习
1.6 小结
本章知识点
扩展阅读
习题1
第2章 流数据概要结构构建技术
2.1 流数据处理的概要结构
2.2 抽样概要结构
2.2.1 抽样
2.2.2 伯努利抽样
2.2.3 水库抽样
2.2.4 简明抽样
2.3 草图概要结构
2.3.1 草图
2.3.2 计数草图
2.3.3 增广草图
2.3.4 布隆过滤器
2.3.5 FM基数估计草图
2.4 小波概要结构
2.5 直方图概要结构
2.5.1 直方图
2.5.2 等宽直方图
2.6 小结
本章知识点
扩展阅读
习题2
第3章 流数据频繁模式挖掘技术
3.1 频繁模式挖掘问题的定义
3.2 不同窗口模型的频繁模式挖掘
3.3 频繁项挖掘算法
3.3.1 黏性抽样算法
3.3.2 KPS算法
3.4 频繁模式挖掘算法
3.4.1 有损计数算法
3.4.2 有损计数算法扩展
3.5 频繁模式挖掘的其他相关问题
3.6 小结
本章知识点
扩展阅读
习题3
第4章 流数据聚类分析技术
4.1 聚类算法
4.2 流数据聚类的评价
4.2.1 内部度量
4.2.2 外部度量
4.3 不同窗口模型的聚类分析
4.4 基于划分的流数据聚类算法
4.4.1 STREAM算法
4.4.2 K-Center算法
4.5 基于层次的流数据聚类算法
4.6 基于密度的流数据聚类算法
4.7 基于网格的流数据聚类算法
4.8 其他流数据聚类算法
4.8.1 K-Median算法
4.8.2 BIRCH算法
4.9 小结
本章知识点
扩展阅读
习题4
第5章 流数据分类分析技术
5.1 。分类算法
5.2 流数据分类的评价
5.2.1 误差估计
5.2.2 性能评价指标
5.2.3 统计显著性
5.2.4 成本度量
5.3 基于贝叶斯的分类算法
5.4 基于决策树的分类算法
5.4.1 快速决策树算法
5.4.2 概念自适应快速决策树算法
5.5 其他流数据分类算法
5.5.1 VFDTc和UFFT算法
5.5.2 Hoeffding自适应树算法
5.6 小结
本章知识点
扩展阅读
习题5
第6章 流数据学习与时间序列分析技术
6.1 时间序列
6.1.1 时间序列的分类与特征
6.1.2 时间序列的表示与拟合
6.1.3 时间序列的预测
6.2 在线学习模型
6.3 流数据学习评价
6.3.1 误差
6.3.2 Regret界
6.4 模型学习算法
6.4.1 ARIMA算法
6.4.2 在线ARIMA算法
6.5 实例学习算法
6.5.1 岭回归与LASSO回归
6.5.2 FIMT算法
6.5.3 AMRules算法
6.6 *优化算法
6.6.1 SGD算法
6.6.2 FTRL算法
6.7 小结
本章知识点
扩展阅读
习题6
第7章 流数据处理模型与框架
7.1 流数据处理计算模型
7.2 流计算的状态与一致性
7.2.1 流计算的状态
7.2.2 流计算的一致性
7.3 流计算处理中的时间
7.4 流计算实现框架
7.5 Storm流处理框架
7.5.1 基于流的处理拓扑结构
7.5.2 记录级容错
7.5.3 Storm的系统架构
7.6 Spark流处理框架
7.6.1 基于RDD的微批处理结构
7.6.2 基于RDD依赖的容错
7.6.3 Spark的系统架构
7.7 Flink流处理框架
7.7.1 基于流水线的处理结构
7.7.2 基于分布式快照的容错
7.7.3 Flink的系统架构
7.8 小结
本章知识点
扩展阅读
习题7
参考文献
1.1 大数据
1.1.1 大数据的发展
1.1.2 大数据的概念
1.1.3 大数据思维
1.2 流数据
1.2.1 流数据的场景
1.2.2 流数据的特点
1.2.3 流数据的概念
1.3 流数据处理
1.3.1 批处理模型
1.3.2 流式处理模型
1.3.3 流式处理与窗口模型
1.3.4 流式处理与概要结构
1.3.5 批处理与流式处理的对比
1.4 流数据分析
1.4.1 频繁项挖掘算法
1.4.2 聚类算法
1.4.3 分类算法
1.4.4 回归算法
1.5 流数据机器学习
1.6 小结
本章知识点
扩展阅读
习题1
第2章 流数据概要结构构建技术
2.1 流数据处理的概要结构
2.2 抽样概要结构
2.2.1 抽样
2.2.2 伯努利抽样
2.2.3 水库抽样
2.2.4 简明抽样
2.3 草图概要结构
2.3.1 草图
2.3.2 计数草图
2.3.3 增广草图
2.3.4 布隆过滤器
2.3.5 FM基数估计草图
2.4 小波概要结构
2.5 直方图概要结构
2.5.1 直方图
2.5.2 等宽直方图
2.6 小结
本章知识点
扩展阅读
习题2
第3章 流数据频繁模式挖掘技术
3.1 频繁模式挖掘问题的定义
3.2 不同窗口模型的频繁模式挖掘
3.3 频繁项挖掘算法
3.3.1 黏性抽样算法
3.3.2 KPS算法
3.4 频繁模式挖掘算法
3.4.1 有损计数算法
3.4.2 有损计数算法扩展
3.5 频繁模式挖掘的其他相关问题
3.6 小结
本章知识点
扩展阅读
习题3
第4章 流数据聚类分析技术
4.1 聚类算法
4.2 流数据聚类的评价
4.2.1 内部度量
4.2.2 外部度量
4.3 不同窗口模型的聚类分析
4.4 基于划分的流数据聚类算法
4.4.1 STREAM算法
4.4.2 K-Center算法
4.5 基于层次的流数据聚类算法
4.6 基于密度的流数据聚类算法
4.7 基于网格的流数据聚类算法
4.8 其他流数据聚类算法
4.8.1 K-Median算法
4.8.2 BIRCH算法
4.9 小结
本章知识点
扩展阅读
习题4
第5章 流数据分类分析技术
5.1 。分类算法
5.2 流数据分类的评价
5.2.1 误差估计
5.2.2 性能评价指标
5.2.3 统计显著性
5.2.4 成本度量
5.3 基于贝叶斯的分类算法
5.4 基于决策树的分类算法
5.4.1 快速决策树算法
5.4.2 概念自适应快速决策树算法
5.5 其他流数据分类算法
5.5.1 VFDTc和UFFT算法
5.5.2 Hoeffding自适应树算法
5.6 小结
本章知识点
扩展阅读
习题5
第6章 流数据学习与时间序列分析技术
6.1 时间序列
6.1.1 时间序列的分类与特征
6.1.2 时间序列的表示与拟合
6.1.3 时间序列的预测
6.2 在线学习模型
6.3 流数据学习评价
6.3.1 误差
6.3.2 Regret界
6.4 模型学习算法
6.4.1 ARIMA算法
6.4.2 在线ARIMA算法
6.5 实例学习算法
6.5.1 岭回归与LASSO回归
6.5.2 FIMT算法
6.5.3 AMRules算法
6.6 *优化算法
6.6.1 SGD算法
6.6.2 FTRL算法
6.7 小结
本章知识点
扩展阅读
习题6
第7章 流数据处理模型与框架
7.1 流数据处理计算模型
7.2 流计算的状态与一致性
7.2.1 流计算的状态
7.2.2 流计算的一致性
7.3 流计算处理中的时间
7.4 流计算实现框架
7.5 Storm流处理框架
7.5.1 基于流的处理拓扑结构
7.5.2 记录级容错
7.5.3 Storm的系统架构
7.6 Spark流处理框架
7.6.1 基于RDD的微批处理结构
7.6.2 基于RDD依赖的容错
7.6.3 Spark的系统架构
7.7 Flink流处理框架
7.7.1 基于流水线的处理结构
7.7.2 基于分布式快照的容错
7.7.3 Flink的系统架构
7.8 小结
本章知识点
扩展阅读
习题7
参考文献
展开全部
作者简介
李静林,博士、副教授,2004年获得北京邮电大学计算机应用技术博士学位。现任北京邮电大学网络与交换技术国家重点实验室交换与智能控制研究中心主任。主要研究方向为移动互联网、物联网、车联网等融合网络智能与服务计算。
本类五星书
浏览历史
本类畅销
-
MySQL数据库案例教程
¥34.9¥49.8 -
Java语言程序设计
¥66.5¥95.0 -
Hadoop大数据技术项目化教程
¥48.2¥68.8 -
C语言程序设计
¥31.9¥45.5 -
KUKA(库卡)工业机器人编程与操作
¥59.3¥79.0 -
用户增长方法论:找到产品长盛不衰的增长曲线
¥60.5¥89.0 -
编译原理(第4版)/刘铭
¥31.5¥45.0 -
硅谷之火-人与计算机的未来
¥19.9¥39.8 -
计算机网络技术
¥23.1¥33.0 -
中文版PHOTOSHOP 2024完全自学教程
¥83.9¥119.8 -
智能控制与强化学习先进值迭代评判设计
¥109.0¥139.8 -
实战数据可视化Excel篇
¥27.4¥49.8 -
人工智能应用基础(第2版)
¥32.7¥46.0 -
短视频编辑与制作
¥30.5¥43.0 -
有限元基础与COMSOL案例分析
¥83.9¥119.8 -
企业AI之旅
¥43.5¥79.0 -
系统集成项目管理工程师教程(第3版
¥97.3¥139.0 -
可编程控制器系统应用编程(中级)
¥44.9¥59.8 -
剪映:短视频剪辑从入门到精通
¥20.6¥42.0 -
人工智能极简史
¥49.6¥68.0