4分
高性能数据挖掘(快速项集挖掘算法及性能研究)
温馨提示:5折以下图书主要为出版社尾货,大部分为全新(有塑封/无塑封),个别图书品相8-9成新、切口有划线标记、光盘等附件不全详细品相说明>>
- ISBN:9787517066910
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:161
- 出版时间:2018-08-01
- 条形码:9787517066910 ; 978-7-5170-6691-0
内容简介
《高性能数据挖掘:快速项集挖掘算法及性能研究》主要探讨数据挖掘中的项集挖掘问题,详细介绍了频繁项集、高可用项集、频繁项集、频繁闭项集的定义、挖掘算法、搜索空间剪枝技术、性能优化等方面的内容。《高性能数据挖掘:快速项集挖掘算法及性能研究》的重点在于介绍如何提高挖掘速度、提升挖掘时的内存使用效率;《高性能数据挖掘:快速项集挖掘算法及性能研究》的特色在于不仅对这些挖掘方法与技术在理论上进行描述,同时作者执行了严格的实验用以佐证结论。 《高性能数据挖掘:快速项集挖掘算法及性能研究》可作为高年级本科生、数据挖掘方向的研究生、有兴趣青年学者的参考书。
目录
第1章 概述
1.1 项集:数据挖掘研究领域的焦点之一
1.2 频繁项集挖掘问题的研究历史
1.3 高可用项集挖掘问题的研究历史
1.4 本书的主要内容
第2章 频繁项集挖掘问题
2.1 概述
2.1.1 问题形式化定义
2.1.2 搜索空间与方法
2.2 基础频繁项集挖掘算法介绍
2.2.1 经典的候选生成Apriori算法
2.2.2 以垂直视角处理数据库的Eclat算法
2.2.3 基于前缀树结构的FP-growth算法
2.3 性能测试的软硬件环境
2.3.1 数据库描述
2.3.2 参照算法介绍
2.3.3 其他软硬件设施
2.4 实验一:三种基础算法的性能测试
2.4.1 实验结果
2.4.2 性能评价
第3章 BFP-growth:快速模式增长算法
3.1 经典模式增长算法的性能分析
3.1.1 影响FP-growth性能的三个因素
3.1.2 ICDM*佳算法:FPgrowth
3.2 批量模式增长算法:BFP-growth
3.2.1 性能提升的途径
3.2.2 核心步骤:两次前缀树遍历
3.2.3 算法伪代码
3.3 BFP-growth算法的性能分析
3.3.1 更少的遍历花费
3.3.2 FP-array技术应该集成在BFP-growth中吗
3.3.3 无修饰的前缀树结构
3.4 实验二:BFP-growth的性能测试及讨论
3.4.1 BFP-growth及FPgrowth*与基础算法的对比
3.4.2 实验结果讨论
3.5 小结
第4章 基于结点集合结构的NS算法
4.1 Eclat及FP-growth算法的优缺点
4.2 结点集合结构(Node-set)
4.2.1 条件结点
4.2.2 结点拓扑序号
4.2.3 使用结点集合结构表示前缀树
4.3 NS算法
4.3.1 映射前缀树到结点集合结构
4.3.2 从结点集合结构中挖掘频繁项集
4.3.3 一个例子
4.3.4 NS算法的原子操作
4.4 实验三:NS算法与其他快速挖掘算法的性能对比
4.4.1 实验结果
4.4.2 结果讨论:NS算法的性能优势
4.5 小结
第5章 用Patricia*结构挖掘频繁项集
5.1 研究动机
5.2 Patricia*结构
5.2.1 单孩子结点
5.2.2 构造:Patricia*结构
5.3 用Patricia*结构挖掘频繁项集
5.3.1 先前的挖掘流程
5.3.2 改进的挖掘流程
5.3.3 PatriciaMine*算法
5.4 实验结果
5.4.1 结点数量统计
5.4.2 性能对比
5.5 小结
第6章 频繁项集挖掘算法的内存耗费
6.1 BFP-growth算法内存使用情况分析
6.2 NS算法内存使用情况分析
6.3 实验四:快速挖掘算法的内存耗费
6.4 SP算法
6.4.1 研究动机
6.4.2 基础知识
6.4.3 挖掘频繁项集
6.4.4 实验结果与结论
第7章 高可用项集挖掘问题
7.1 从频繁项集到高可用项集
7.2 问题的形式化定义
7.3 已有挖掘算法概述
第8章 非候选生成高可用项集挖掘算法
8.1 项集有用性列表结构
8.1.1 初始有用性列表
8.1.2 2-项集的有用性列表
8.1.3 缸项集有用性列表(k≥3)
8.2 HUI-Miner算法
8.2.1 剪枝策略
8.2.2 算法伪代码
8.3 HUI-Miner算法的实现细节
8.3.1 有用性列表表头
8.3.2 重新标注tid
8.3.3 交易权重有用性增加的顺序
8.4 实验五:HUI-Miner性能测试
8.4.1 实验设置
8.4.2 HUI-Miner及对比算法的运行时间
8.4.3 HUI-Miner及对比算法的内存耗费
8.4.4 项处理顺序对HUI-Miner性能的影响
8.4.5 可扩展性
8.4.6 实验结果讨论
8.5 小结
第9章 快速识别高可用项集
9.1 先前算法的性能瓶颈
9.2 基本识别算法(BIA)
9.3 基于候选树的快速识别算法(FIA)
9.3.1 候选树结构
9.3.2 快速识别算法
9.4 算法分析:BIA与FIA
9.5 实验六:BIA与FIA的性能对比
9.5.1 高可用项集识别时间
9.5.2 候选项集生成时间
9.5.3 内存耗费
9.5.4 实验结果分析
9.6 实验七:FIA-UP-Growth+和HUI-Miner的性能对比
9.6.1 运行时间&内存耗费
9.6.2 实验结果分析
9.7 小结
第10章 *大频繁项集挖掘
10.1 介绍
10.2 基本概念
10.3 MAFIA算法
10.3.1 深度优先遍历
10.3.2 搜索空间剪枝
10.3.3 有效的MFI超集检查
10.4 挖掘非*大频繁项集
10.4.1 挖掘所有的频繁项集
10.4.2 挖掘所有的频繁闭项集
10.5 实施细节
10.6 结论
第11章 频繁闭项集挖掘
11.1 介绍
11.2 频繁项集挖掘
11.2.1 基本定义
11.2.2 先前的解决方案
11.3 项集-记录标识符集合搜索树与等价类
11.4 CHARM算法设计与实现
11.4.1 快速的闭项集子集合检查
11.4.2 使用差异集合快速进行频繁计数
11.4.3 其他优化及正确性
11.5 实验结果
11.6 结论
参考文献
-
深度学习的数学
¥43.5¥69.0 -
硅谷之火-人与计算机的未来
¥12.7¥39.8 -
全图解零基础word excel ppt 应用教程
¥19.0¥48.0 -
机器学习
¥59.4¥108.0 -
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
智能硬件项目教程:基于ARDUINO(第2版)
¥31.9¥65.0 -
DIRECTX 12 3D 游戏开发实战
¥81.4¥148.0 -
元启发式算法与背包问题研究
¥38.2¥49.0 -
格拉斯曼流行学习及其在图像集分类中的应用
¥13.7¥28.0 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
十二字节
¥41.4¥69.0 -
UG NX 12.0数控编程
¥22.1¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
界面交互设计理论研究
¥30.8¥56.0 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0 -
基于3D打印技术的产品创新设计方法
¥45.8¥88.0 -
Linux服务器架设实战(Linux典藏大系)
¥83.3¥119.0 -
Visual Basic 语言程序设计基础(第6版)
¥32.0¥45.0 -
鸿蒙APP案例开发实战——学习服务与工具助手30例
¥55.3¥79.0