- ISBN:9787302596493
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:461
- 出版时间:2022-01-01
- 条形码:9787302596493 ; 978-7-302-59649-3
本书特色
《数据挖掘原理(第4版)》的重点是介绍基本技术,而不是展示当今的数据挖掘技术。一旦掌握了基本技术,就可通过多种渠道了解该领域的进展。本书共23章,分别介绍了概述、用于挖掘的数据、朴素贝叶斯和*近邻算法、使用决策树进行分类、决策树归纳、估计分类器的预测精度、连续属性、避免决策树的过度拟合、关于熵的更多信息、归纳分类的模块化规则、度量分类器的性能、处理大量数据、集成分类、比较分类器、关联规则挖掘、聚类、文本挖掘、分类流数据、神经网络。 《数据挖掘原理(第4版)》涉及大量数据集、属性和值,也涉及不少数学公式,字母繁多,格式复杂。为便于检查对所学知识的掌握情况,每章都包含自我评估练习。所以本书末尾还有5个附录,分别介绍了基本数学知识、数据集、更多信息来源、词汇表和符号、自我评估练习题答案。 《数据挖掘原理(第4版)》面向计算机科学、商业研究、市场营销、人工智能、生物信息学和法医学专业的学生,可用作本科生或硕士研究生的入门教材。同时,对于那些希望进-一步提高自身能力的技术或管理人员来说,本书也是很好的自学书籍。
内容简介
本书解释、探索了数据挖掘的主要技术,可以从数据中自动提取隐式和潜在有用的信息。数据挖掘越来越多地用于商业、科学和其他应用领域,它侧重于分类、关联规则挖掘和聚类。 书中对每个主题都进行了清晰的解释,重点是算法而不是数学公式,并通过详细的有效示例加以说明。本书是为没有强数学或统计学背景的读者写的,并详细解释了使用的所有公式。 本书适合作为本科生或研究生层次的教材,适用专业包括计算机科学、商业研究、市场营销、人工智能、生物信息学和法医学。 为了帮助读者自学,本书旨在帮助普通读者理解什么是“黑盒”,这样他们就可以有差别地使用商业数据挖掘包,高级读者或学术研究者可以对未来该领域的技术进步做出贡献。 书中每一章都有实践练习,让读者检查自己的进度。附录还包括所使用的技术术语的完整术语表。 数据挖掘原理包括对流数据分类算法的介绍,包括平稳数据(底层模型是固定的)和依赖时间的数据(底层模型不时变化)——这种现象称为概念漂移。 本书提供了前馈神经网络与反向传播的详细描述,并显示它如何可以用于分类。
目录
第1章 数据挖掘简介
1.1 数据爆炸
1.2 知识发现
1.3 数据挖掘的应用
1.4 标签数据和无标签数据
1.5 监督学习:分类
1.6 监督学习:数值预测
1.7 无监督学习:关联规则
1.8 无监督学习:聚类
第2章 用于挖掘的数据
2.1 标准制定
2.2 变量的类型
2.3 数据准备
2.4 缺失值
2.4.1 丢弃实例
2.4.2 用*频繁值/平均值替换
2.5 减少属性个数
2.6 数据集的UCI存储库
2.7 本章小结
2.8 自我评估练习
第3章 分类简介:朴素贝叶斯和*近邻算法
3.1 什么是分类
3.2 朴素贝叶斯分类器
3.3 *近邻分类
3.3.1 距离测量
3.3.2 标准化
3.3.3 处理分类属性
3.4 急切式和懒惰式学习
3.5 本章小结
3.6 自我评估练习
第4章 使用决策树进行分类
4.1 决策规则和决策树
4.1.1 决策树:高尔夫示例
4.1.2 术语
4.1.3 degrees数据集
4.2 TDIDT算法
4.3 推理的类型
4.4 本章小结
4.5 自我评估练习
第5章 决策树归纳:使用熵进行属性选择
5.1 属性选择:一个实验
5.2 替代决策树
5.2.1 足球/无板篮球示例
5.2.2 匿名数据集
5.3 选择要分裂的属性:使用熵
……
第6章 决策树归纳:使用频率表进行属性选择
第7章 估计分类器的预测精度
第8章 连续属性
第9章 避免决策树的过度拟合
第10章 关于熵的更多信息
第11章 归纳分类的模块化规则
第12章 度量分类器的性能
第13章 处理大量数据
第14章 集成分类
第15章 比较分类器
第16章 关联规则挖掘Ⅰ
第17章 关联规则挖掘Ⅱ
第18章 关联规则挖掘Ⅲ:频繁模式树
第19章 聚类
第20章 文本挖掘
第21章 分类流数据
第22章 分类流数据Ⅱ:时间权关数据
第23章 神经网络概论
附录A 基本数学知识
附录B 数据集
附录C 更多信息来源
附录D 词汇表和符号
附录E 自我评估练习题答案
作者简介
麦克斯·布拉默是英国朴次茅斯大学信息技术系荣誉教授、IFIP副主席、英国计算机学会AI专家组主席。 自从 “数据挖掘”“数据库中的知识发现”“大数据”和“预测分析”等技术兴起以来,Max积极参与了多个数据挖掘项目,尤其是与数据自动分类相关的项目。Max发表了大量技术文章,曾撰写Research and Development in Intelligent Systems等著作。Max具有多年的本科和研究生教学经验。
-
落洼物语
¥8.9¥28.0 -
当代中国政府与政治(新编21世纪公共管理系列教材)
¥33.6¥48.0 -
中国当代文学名篇选读
¥17.0¥53.0 -
中医基础理论
¥50.7¥59.0 -
长征记忆(八品)
¥9.5¥45.0 -
北大人文课(平装)
¥12.2¥45.0 -
世界现代设计史-[第二版]
¥63.6¥120.0 -
断代(八品)
¥13.4¥42.0 -
宪法-第二版
¥20.3¥29.0 -
先进防伪技术
¥81.3¥98.0 -
当代中国政府与政治 第二版
¥57.8¥68.0 -
企业法务教程
¥34.8¥49.0 -
习近平新时代中国特色社会主义思想概论
¥18.2¥26.0 -
毛泽东思想和中国特色社会主义理论体系概论(2021年版)
¥8.5¥25.0 -
新闻学概论(第七版)(新闻与传播学系列教材(新世纪版))
¥30.0¥50.0 -
办公室工作实务(第4版)/黄海
¥27.8¥48.0 -
全国压力管道设计和审批人员培训教材(第四版)
¥160.4¥198.0 -
习近平总书记教育重要论述讲义
¥13.3¥35.0 -
无人机概论
¥37.2¥59.0 -
(平装)北大必修课:北大口才课
¥18.2¥45.0