- ISBN:9787111496328
- 装帧:暂无
- 册数:暂无
- 重量:暂无
- 开本:32开
- 页数:322
- 出版时间:2017-10-01
- 条形码:9787111496328 ; 978-7-111-49632-8
本书特色
本书系统介绍了数据挖掘原理、技术、算法和应用。主要内容包括:数据挖掘的过程、数据存储的数据仓库、数据预处理技术和算法、异常数据检测技术和算法、数据分类算法和应用、数据聚类分析的算法及其应用、数据关联分析算法及其应用、模型的评估技术和算法、复杂数据的数据挖掘和技术。本书涵盖了数据挖掘过程的各方面技术、算法,在内容安排上将理论知识和工程技术应用有机结合,并介绍了许多数据挖掘的典型应用方法。
内容简介
梁亚声、徐欣、成小菊、梁佳领、朱霞编著的这本《数据挖掘原理算法与应用》系统介绍了数据挖掘原理、算法和应用的相关知识。主要内容包括数据挖掘的过程、数据存储技术、数据预处理技术和算法、异常数据检测技术和算法、数据分类算法和应用、数据聚类分析的算法及其应用、数据关联分析算法及其应用、模型的评估技术和算法、复杂数据类型的数据挖掘技术。本书涵盖了数据挖掘过程的各方面技术和算法,在内容安排上将理论知识和工程技术应用有机地结合起来,并介绍了许多数据挖掘的典型应用方法。本书可作为高等院校计算机科学与技术、信息管理、数据分析等专业的教科书,也可作为企业管理、信息分析人员的技术参考书。
目录
出版说明
前言
第1章概述
11从数据中获取知识
12数据挖掘的基本概念
13数据挖掘的发展历程
14数据挖掘的功能和数据挖掘
系统的分类
141分类与回归
142聚类分析
143关联规则
144时序模式
145异常检测
146数据挖掘系统的分类
15数据挖掘的过程
151数据挖掘的一般流程
152跨行业数据挖掘标准过程
16数据挖掘与其他学科的关系
161数据挖掘与数据库知识发现
162数据挖掘与数据库查询
163数据挖掘与统计分析
164数据挖掘与数据仓库
165数据挖掘与联机分析处理
166数据挖掘与人工智能、专家系统、
机器学习
17数据挖掘的应用和发展趋势
171商业的数据挖掘
172金融业的数据挖掘
173欺诈侦测中的数据挖掘
174DNA数据分析中的数据挖掘
175电信业中的数据挖掘
176科学和统计数据挖掘
177数据挖掘系统和软件
178数据挖掘的发展趋势
18小结
19习题
第2章数据存储
21关系数据集
22数据仓库
221数据仓库的概念和特点
222数据仓库的数据组织
223数据仓库的关键技术
224数据仓库与数据挖掘的关系
23NoSQL数据库
231NoSQL概念与理论
232NoSQL数据模型
233NoSQL与关系数据库
24分布式文件系统
241分布式文件系统的历史
242分布式文件系统的体系结构
243谷歌文件系统(GoogleFS)
244Hadoop分布式文件系统
(HDFS)
25小结
26习题
第3章数据预处理
31数据预处理的必要性
32数据清理
321缺失数据处理方法
322噪声数据平滑技术
323时间相关数据的处理
33数据集成
331实体识别与匹配
332冗余和相关分析
333元组重复数据的检测
334冲突数据的检测与处理
34数据转换
341数据标准化
342数据泛化
35数据归约
351数据立方体聚集
352维度归约
353数据压缩
354数值归约
36数据离散化
361分箱方法
362直方图分析
363基于熵的离散化
364ChiMerge技术
365人工划分分段
37特征提取、选择和构造
371特征提取
372特征选择
373特征构造
38小结
39习题
第4章数据相似度与异常检测
41相似度度量
411对象与属性类型
412相似度度量的定义
413由距离度量变换而来的
相似度度量
414属性之间的相似度度量
415对象之间的相似度度量
42传统度量方法
421二值属性的相似度度量
422欧氏距离
423余弦距离
424Mahalanobis距离
425Jaccard距离
426海明距离
43大数据度量方法
431文档的Shingling
432局部敏感散列算法
44异常检测
441基于统计的检测方法
442基于距离的检测方法
443基于密度的检测方法
444基于聚类的检测方法
445基于分类的检测方法
446高维数据中的异常点检测
45小结
46习题
第5章数据分类和预测
51分类和预测的基本概念
511准备数据
512分类和预测方法的评估标准
52决策树分类
521ID3算法生成决策树
522C45算法生成决策树
523CART算法和Gini指标
524决策树归纳的可扩展性
525数据仓库与决策树
526决策树和决策规则的局限性
53贝叶斯分类
531贝叶斯定理
532朴素贝叶斯分类
533贝叶斯信念网络
534训练贝叶斯信念网络
54神经网络
541多层前馈神经网络
542定义神经网络的拓扑结构
543后向传播
544后向传播和可理解性
55其他分类方法
551基于关联的分类方法
552K-*近邻分类
553基于案例推理
554遗传算法
555粗糙集方法
556模糊集合方法
56预测算法
561预测算法分类
562预测算法选择
563线性和多元回归
564非线性回归
565其他回归模型
57分类预测应用实例
571样本选取
572建立预测模型
573模型评估
574实用价值
58小结
59习题
第6章数据聚类分析
61基本概念
611对聚类分析的要求
612聚类分析方法分类
62划分聚类算法
621K-means算法(基于
质心的技术)
622K-medoids算法(基于代表
对象的技术)
63层次聚类算法
631BIRCH算法
632CURE算法
633ROCK算法
634Chameleon算法
64基于密度的聚类算法
641DBSCAN算法
642OPTICS算法
643DENCLUE算法
65基于网格的聚类算法
651STING算法
652WaveCluster算法
653CLIQUE算法
66基于模型的聚类算法
661EM算法
662COBWEB算法
663SOM算法
67聚类评估
671估计聚类趋势
672确定簇数
673测定聚类质量
68聚类分析应用实例
681问题理解与提出
682数据收集与选择
683数据预处理
684应用K-means聚类算法建模
69小结
610习题
第7章数据关联分析
71数据关
-
当代中国政府与政治(新编21世纪公共管理系列教材)
¥33.6¥48.0 -
落洼物语
¥8.7¥28.0 -
中国当代文学名篇选读
¥19.1¥53.0 -
中医基础理论
¥50.7¥59.0 -
北大人文课(平装)
¥13.9¥45.0 -
宪法-第二版
¥12.2¥29.0 -
当代中国政府与政治 第二版
¥51.0¥68.0 -
EPLAN电气设计
¥29.9¥39.8 -
闯进数学世界――探秘历史名题
¥21.3¥32.8 -
企业法务教程
¥34.8¥49.0 -
习近平新时代中国特色社会主义思想概论
¥18.2¥26.0 -
金融学
¥29.9¥49.0 -
计算机操作系统教程(第4版)(清华大学计算机系列教材)
¥31.9¥49.0 -
三国史
¥27.5¥50.0 -
陶瓷坯釉料制备技术/高职高专材料工程技术专业
¥37.4¥45.0 -
陶瓷工艺技术
¥41.7¥49.0 -
飞机总体设计
¥46.8¥78.0 -
陶瓷工艺学/焦宝祥
¥41.7¥49.0 -
古代汉语(第四册)
¥16.1¥35.0 -
编辑审稿实务教程
¥35.1¥45.0