- ISBN:9787111771579
- 装帧:平装-胶订
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:245
- 出版时间:2024-12-01
- 条形码:9787111771579 ; 978-7-111-77157-9
本书特色
本书遵循教指委相关指导文件和高等院校学生学习规律编写而成。践行四新理念,融入思政元素,注重理论与实践相结合。
内容简介
全书共9 章,主要内容如下:第1 章介绍了数据挖掘的基本知识,讲解了数据获取的关键环节以及数据挖掘流程;第2 章讲解了数据清洗、数据集成、数据转换与规范化,以及数据规约等数据预处理方法,重视数据挖掘的数据准备工作,强调数据质量对数据挖掘算法性能的影响;第3 章讲解了数据仓库和数据立方体的基本概念和系统架构,为处理和分析大规模数据集提供有效工具;第4 章讲解了关联规则挖掘的相关知识;第5 章讲解了经典的分类算法、回归预测算法、性能评估指标和模型调优方法;第6 章讲解了经典的聚类算法;第7 章讲解了图数据挖掘、时间序列数据挖掘、大数据与分布式数据挖掘等高级数据挖掘技术,展示了该领域的*新进展;第8 章介绍了数据可视化的基本概念、常用工具与技术;第9 章介绍了自然语言智能挖掘、医疗大数据智能挖掘、遥感图像智能挖掘等案例,培养学生数据挖掘理论与实践结合的技能。 本书适合作为人工智能、计算机科学与技术、自动化等相关专业本科生相关课程的配套教材或参考书,也可作为相关领域技术人员的参考书。本书有以下配套教学资源:PPT 课件、习题答案、教学视频、教学大纲、配套实验,欢迎选用本书作教材的教师登录www.cmpedu.com 注册后下载,或发邮件至jinacmp@163.com 索取。
前言
前言
【编写目的】数据挖掘是计算机科学领域中一门重要的课程,它位于数据科学、统计学、机器学习和人工智能的交汇点。这门课程不仅教授学生如何从大量数据中提取有价值的信息和知识,还涉及数据预处理、关联规则挖掘、数据仓库、识别预测和结果评估等关键技术。数据挖掘课程的地位之所以重要,是因为它为学生提供了解决现实世界复杂数据分析问题所需的工具和方法,使他们能够在商业智能、金融分析、医疗诊断、社会科学研究等多个领域发挥重要作用。此外,随着大数据时代的到来,掌握数据挖掘的知识和技能变得越来越重要,这对于培养能够适应未来数据驱动型经济的人才具有不可替代的作用。
【教材特点】本教材以数据挖掘基础知识、经典算法、应用案例为基础,介绍了工业界数据挖掘*新发展趋势,注重学生实践技能的培养。具体来说,本教材通过介绍业务背景、数据获取与处理、模型选择、模型评估与调优、结果分析应用等环节,使学生系统、全面地掌握数据挖掘的基本知识,具备一定的对数据挖掘相关实际应用问题进行建模并编程实现的能力。
本教材的主要特点如下。
目录
前言
第1章绪论
1.1数据挖掘概述
1.1.1数据挖掘的定义
1.1.2数据挖掘的基本任务
1.1.3数据挖掘的应用领域
1.1.4数据挖掘的学习资源
1.1.5数据挖掘的常用工具
1.1.6数据挖掘的主要算法
1.2数据获取
1.2.1数据类型与来源
1.2.2数据采集技术
1.2.3数据标注技术
1.2.4数据存储与管理
1.2.5数据质量评估
1.3数据挖掘的流程
1.3.1业务理解与问题定义
1.3.2数据获取与预处理
1.3.3数据挖掘
1.3.4结果分析与应用
1.4本章小结
第2章数据预处理
2.1数据清洗
2.1.1数据缺失值处理
2.1.2冗余去重
2.1.3数据去噪
2.1.4异常值处理
2.2数据集成
2.2.1实体识别
2.2.2冗余和相关性分析
2.3数据转换与规范化
2.3.1离散化、标准化
2.3.2二值化、归一化
2.3.3正则化
2.3.4特征编码
2.4数据归约
2.4.1子空间法
2.4.2粗糙集规约
2.4.3流形学习
2.5本章小结
第3章数据仓库与数据立方体
3.1数据仓库概述
3.1.1数据仓库产生的背景
3.1.2数据仓库的定义与特征
3.1.3数据仓库与数据库
3.2数据仓库的系统架构
3.2.1数据仓库系统基本架构
3.2.2数据仓库系统分层的意义
3.2.3数据仓库的分层结构
3.3数据立方体
3.3.1数据立方体的基本概念
3.3.2数据立方体的组成元素
3.3.3多维数据模型的模式
3.4在线分析处理
3.4.1在线分析处理的基本概念
3.4.2在线分析处理的基本操作
3.4.3在线分析处理系统的实现
3.5本章小结
第4章关联规则挖掘
4.1关联规则挖掘的基本概念
4.2频繁项集挖掘算法
4.2.1格结构
4.2.2朴素法
4.2.3先验算法
4.2.4频繁模式增长算法
4.3关联规则挖掘方法
4.3.1基于置信度的剪枝
4.3.2从关联分析到相关性分析
4.4高级关联规则挖掘
4.4.1多层模式挖掘
4.4.2非频繁模式挖掘
4.5推荐系统中的关联规则挖掘
4.5.1召回层的作用和意义
4.5.2基于内容的召回层挖掘
4.5.3基于协同过滤的召回层挖掘
4.5.4排序层的作用和意义
4.5.5排序层的挖掘算法
4.5.6基于逻辑回归的排序层挖掘
4.6本章小结
第5章分类与回归预测
5.1分类算法
5.1.1分类的基本概念
5.1.2决策树分类器
5.1.3贝叶斯分类法
5.1.4人工神经网络方法
5.1.5支持向量机
5.1.6文本分类算法
5.2回归预测算法
5.2.1回归分析的基本概念
5.2.2线性回归
5.2.3非线性回归
5.2.4逻辑回归
5.3性能评估指标
5.3.1分类模型评估
5.3.2预测模型评估
5.4模型调优
5.4.1组合方法
5.4.2类不平衡优化
5.5本章小结
第6章聚类分析
6.1大数据聚类分析
6.2性能度量
6.2.1外部指标
6.2.2内部指标
6.3距离计算
6.4聚类算法
6.4.1划分聚类算法
6.4.2层次聚类算法
6.4.3密度聚类算法
6.4.4谱聚类算法
6.5大数据挖掘中的聚类拓展学习
6.6本章小结
第7章高级数据挖掘
7.1图数据挖掘
7.1.1图数据
7.1.2凝聚子图挖掘
7.1.3图模式挖掘
7.2时间序列数据挖掘
7.2.1时间序列数据介绍
7.2.2时间序列异常检测
7.2.3时间序列的分类与聚类
7.3大数据与分布式数据挖掘
7.3.1分布式文件系统
7.3.2MapReduce大数据处理框架
7.3.3Spark大数据处理框架
7.4本章小结
第8章数据可视化与分析
8.1数据可视化的基本概念
8.1.1数据可视化的背景
8.1.2数据可视化的定义及基本步骤
8.1.3数据可视化的常用图表类型
8.1.4数据可视化实例
8.2可视化工具与技术
8.2.1Python可视化常用类库
8.2.2JavaScript可视化开发工具
8.2.3软件类可视化工具
8.3本章小结
第9章数据挖掘案例分析
9.1自然语言智能挖掘
9.1.1文本挖掘
9.1.2语音数据挖掘
9.1.3文本-视觉多模态挖掘
9.2医疗大数据智能挖掘
9.2.1电子病历数据挖掘
9.2.2医学影像数据挖掘
9.3遥感图像智能挖掘
9.3.1地理信息数据挖掘
9.3.2无人机遥感数据挖掘
9.3.3卫星数据挖掘
9.4本章小结
参考文献
-
大数据技术导论(第2版)
¥28.9¥41.0 -
机器学习
¥69.0¥108.0 -
微信小程序开发教程
¥37.7¥49.0 -
大模型应用开发极简入门 基于GPT-4和ChatGPT
¥41.9¥59.8 -
C程序设计(第五版)
¥34.5¥59.9 -
数据结构教程(第6版·微课视频·题库版)
¥42.6¥65.0 -
计算机组成原理实验指导与习题解析
¥34.8¥52.0 -
C程序设计(第五版)
¥22.1¥49.0 -
有限与无限的游戏:一个哲学家眼中的竞技世界
¥36.4¥68.0 -
大数据丛书数据可视化(第2版)
¥163.2¥259.0 -
数据结构基础(C语言版)(第2版)
¥42.6¥49.0 -
工业互联网安全创新技术及应用
¥73.0¥128.0 -
AI办公助手 ChatGPT+Office智能办公从入门到实践 80集视频课
¥64.8¥79.8 -
计算机网络基础(微课版)
¥45.6¥55.0 -
零信任架构
¥71.2¥89.0 -
剪映:即梦AI绘画与视频制作从新手到高手
¥62.3¥89.0 -
红蓝攻防 技术与策略(原书第3版)
¥111.2¥139.0 -
RFID与智能卡技术实验指导书
¥29.4¥36.0 -
人工智能导论(第2版)
¥32.8¥39.8 -
Web前端开发基础
¥37.5¥57.0