暂无评论
图文详情
- ISBN:9787030754844
- 装帧:平装
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:212
- 出版时间:2023-06-01
- 条形码:9787030754844 ; 978-7-03-075484-4
内容简介
本书全面系统地介绍数据挖掘的概念、技术、算法及应用,力求为初学者构建一个合适的学习框架。全书将数据挖掘归纳成数据预处理、数据探索、决策树、贝叶斯分类、人工神经网络、支持向量机、关联规则分析、聚类、时间序列预测等几个主题,不仅详解技术原理和算法实现,而且结合复杂多样的实际数据环境,探讨其应用场景和使用方法。本书通过对大量图表、示例、算法的简洁描述,使读者尽可能摆脱技术细节的干扰而聚焦于数据挖掘本身。书中所有示例都采用Python实现,此外还提供电子教学课件、习题答案及实践练习代码。
目录
目录前言第1章 引言 11.1 数据挖掘的定义 11.2 数据挖掘的起源 21.3 数据挖掘的类型 21.3.1 数据库数据 21.3.2 数据仓库 31.3.3 事务数据 31.3.4 时间序列数据 31.3.5 文本和多媒体数据 41.3.6 空间数据 41.4 数据挖掘的功能与模式 41.4.1 数据特征化与数据区分 51.4.2 频繁模式、关联和相关性分析 61.4.3 分类和回归 61.4.4 聚类分析 61.4.5 离群点分析 71.5 数据挖掘常用技术及其优缺点 71.6 数据挖掘的步骤 71.7 数据挖掘的应用 81.7.1 数据统计应用现状 81.7.2 个性化技术应用现状 81.7.3 预测技术应用现状 91.7.4 分类和回归技术应用现状 91.7.5 辅助决策系统应用现状 91.8 数据挖掘面临的困难与挑战 10习题 11第2章 数据预处理 122.1 认识数据 122.1.1 数据对象与属性的类型 122.1.2 数据集的类型 152.2 原始数据存在的问题 162.3 数据预处理方法 182.3.1 数据预处理的步骤 182.3.2 数据清理 192.3.3 数据集成 222.3.4 数据归约 242.3.5 数据变换 28习题 31实践练习 31第3章 数据探索 323.1 数据的基本统计描述 323.1.1 中心趋势度量 323.1.2 数据散布度量 353.2 可视化分析 363.2.1 一般概念 363.2.2 不同数据的可视化 383.3 联机分析处理 443.3.1 OLAP的概念 443.3.2 OLAP的多维数据概念 453.3.3 OLAP的多维数据结构 453.3.4 OLAP的多维数据库 473.3.5 OALP的多维数据分析 48习题 48实践练习 48第4章 决策树 494.1 决策树概述 494.1.1 决策树的含义及相关概念 494.1.2 决策树算法构造基本流程 524.1.3 决策树的特点 534.2 ID3算法 534.2.1 ID3算法原理 534.2.2 ID3算法代码实现 554.3 C4.5算法 564.3.1 C4.5算法原理 564.3.2 C4.5算法代码实现 574.4 随机森林 634.4.1 基本原理 634.4.2 随机森林构造步骤 634.4.3 随机森林代码实现 64习题 70实践练习 71第5章 贝叶斯分类 725.1 贝叶斯定理 725.2 朴素贝叶斯分类器 735.2.1 朴素贝叶斯分类器工作原理 735.2.2 朴素贝叶斯分类器应用案例 745.3 半朴素贝叶斯分类器 755.4 贝叶斯网络 765.4.1 贝叶斯网络的结构 775.4.2 贝叶斯网络的建立 775.4.3 贝叶斯网络的特点 785.5 贝叶斯分类器实例分析 78习题 79实践练习 80第6章 人工神经网络 816.1 人工神经网络概述 816.2 人工神经网络基本原理 826.2.1 人工神经元模型 826.2.2 激活函数 836.2.3 人工神经网络的拓扑结构 866.2.4 人工神经网络的学习与工作 896.2.5 感知机模型 906.2.6 误差反向传播算法 936.3 算法改进 1016.3.1 交叉熵—神经元饱和 1016.3.2 正则化—过拟合 1026.3.3 权值初始化—隐藏层神经元饱和 1026.4 应用及实例分析 103习题 106实践练习 106第7章 支持向量机 1077.1 SVM分类 1077.1.1 *大间隔分类器 1077.1.2 软间隔优化 1127.1.3 线性规划SVM 1137.2 SVM回归 1147.2.1 ε不敏感损失函数 1147.2.2 SVR实现原理及过程 1157.3 SVM实例应用 117习题 119实践练习 119第8章 关联规则分析 1218.1 关联规则分析概述 1218.1.1 关联规则基本概念 1228.1.2 关联规则度量及基本过程 1228.2 关联规则分类 1248.2.1 单层关联规则—频繁项集的产生 1248.2.2 不产生候选频繁项集的算法 1308.3 多层多维关联规则挖掘 1398.3.1 事务型数据库挖掘多层关联规则 1398.3.2 兴趣度度量 1398.3.3 关联挖掘与相关分析 1398.3.4 有约束的关联挖掘 1408.4 关联规则分析应用场景 140习题 143实践练习 144第9章 聚类 1459.1 聚类概述 1459.1.1 聚类的含义 1459.1.2 聚类算法的分类 1459.2 相似性测度指标 1469.2.1 距离测度指标 1469.2.2 非距离测度指标 1489.3 k-means算法 1499.3.1 k-means算法原理 1499.3.2 k-means算法特点 1519.3.3 k-means实例分析 1519.4 k-中心点算法 1539.4.1 算法原理 1539.4.2 k-中心点算法特点 1549.4.3 k-中心点实例分析 155习题 157实践练习 158第10章 时间序列预测 15910.1 时间序列概述 15910.2 预测的定量方法 16610.2.1 平滑法 16610.2.2 趋势推测法 16910.3 预测的定性方法 17110.3.1 德尔菲法 17110.3.2 专家判断法 17110.3.3 主观概率预测法 17110.3.4 情景预测法 17210.4 常用模型介绍 17210.4.1 平稳性检验 17210.4.2 差分法 17310.4.3 白噪声检验 17410.4.4 时间序列模型预测的基本步骤 17510.4.5 AR模型 17610.4.6 MA模型 18410.4.7 ARMA模型 18810.4.8 ARIMA模型 191习题 200实践练习 200参考文献 201
展开全部
本类五星书
浏览历史
本类畅销
-
当代中国政府与政治(新编21世纪公共管理系列教材)
¥33.6¥48.0 -
落洼物语
¥8.7¥28.0 -
中国当代文学名篇选读
¥19.1¥53.0 -
中医基础理论
¥50.7¥59.0 -
北大人文课(平装)
¥13.9¥45.0 -
外国教育史-第2版
¥24.4¥40.0 -
宪法-第二版
¥12.2¥29.0 -
当代中国政府与政治 第二版
¥57.8¥68.0 -
EPLAN电气设计
¥29.9¥39.8 -
闯进数学世界――探秘历史名题
¥21.3¥32.8 -
企业法务教程
¥34.8¥49.0 -
习近平新时代中国特色社会主义思想概论
¥18.2¥26.0 -
金融学
¥29.9¥49.0 -
计算机操作系统教程(第4版)(清华大学计算机系列教材)
¥31.9¥49.0 -
三国史
¥27.5¥50.0 -
飞机总体设计
¥46.8¥78.0 -
古代汉语(第四册)
¥16.1¥35.0 -
编辑审稿实务教程
¥35.1¥45.0 -
管理学:原理与方法(第7版)(博学.大学管理类)/周三多
¥30.9¥49.0 -
(平装)北大必修课:北大口才课
¥12.2¥45.0