暂无评论
图文详情
- ISBN:9787030709929
- 装帧:暂无
- 册数:暂无
- 重量:暂无
- 开本:其他
- 页数:320
- 出版时间:2022-02-01
- 条形码:9787030709929 ; 978-7-03-070992-9
内容简介
本书总结编者多年教学经验,依据学生的学习特点,深入浅出地介绍数据挖掘过程中涉及的常见操作要点,包括数据挖掘相关概念、开发环境的使用、基础库、数据预处理、特征选择和降维、使用机器学习算法进行预测、模型评估等内容。各章在介绍基本原理之后,配有相关的操作实例,以巩固学习效果。 本书适合人工智能基础应用相关专业的教师和学生使用,也适合准备成为数据挖掘工程师的相关人员阅读。
目录
第1章 绪论
1.1 数据挖掘与大数据概述
1.2 我国大数据行业发展现状
1.3 数据挖掘预备知识
1.4 数据挖掘的基本流程
1.5 数据挖掘工作环境
第2章 科学计算库NumPy
2.1 ndarray 对象
2.1.1 ndarray的属性
2.1.2 ndarray的数据类型
2.1.3 ndarray 的创建
2.1.4 ndarray的操作
2.2 伪随机数生成
2.2.1 rand函数
2.2.2 randn函数
2.2.3 randint函数
2.2.4 uniform函数
2.2.5 normal函数
2.2.6 choice函数
2.3 索引和切片
2.3.1 索引
2.3.2 花式索引
2.3.3 切片
2.3.4 布尔型索引
2.4 NumPy运算
2.4.1 元素级运算
2.4.2 广播
2.4.3 通用函数
2.4.4 meshgrid函数
2.4.5 排序
2.4.6 统计函数
2.5 线性代数工具
2.5.1 diag函数
2.5.2 矩阵乘积
2.5.3 矩阵行列式
2.5.4 特征值和特征向量
2.5.5 求解线性方程组
2.6 数组的文件输入和输出
2.6.1 读写文本文件
2.6.2 读写二进制文件
第3章 绘图与可视化
3.1 可视化的基本概念
3.2 Matplotlib绘图
3.2.1 线型图
3.2.2 散点图
3.2.3 条形图
3.2.4 直方图
3.2.5 饼图
3.2.6 箱线图
3.2.7 等高线图
3.3 Seaborn绘图
3.3.1 分布图
3.3.2 关系图
3.3.3 分类图
3.3.4 回归图
3.3.5 热力图
3.3.6 分面网格图
第4章 数据分析库Pandas
4.1 数据类型
4.1.1 Series类型
4.1.2 DataFrame类型
4.2 统计函数
4.2.1 常用统计函数
4.2.2 面元划分
4.2.3 相关系数
4.3 缺失值处理
4.3.1 查看缺失数据
4.3.2 删除缺失数据
4.3.3 填充缺失数据
4.4 重复值处理
4.4.1 查询重复数据
4.4.2 删除重复数据
4.5 异常值处理
4.6 随机采样
4.7 数据转换
4.7.1 map
4.7.2 apply
4.7.3 applymap
4.7.4 replace
4.8 合并与拼接
4.8.1 merge
4.8.2 concat
4.8.3 combine_first
4.9 数据重塑
4.9.1 stack
4.9.2 unstack
4.10 数据分组与聚合
4.10.1 分组
4.10.2 聚合
4.11 透视表
4.12 数据加载与存储
4.12.1 文本文件的加载与存储
4.12.2 电子表格文件的加载与存储
第5章 数据预处理
5.1 数据清洗
5.1.1 缺失值处理
5.1.2 异常值处理
5.1.3 重复值处理
5.2 不均衡数据处理
5.2.1 过采样
5.2.2 欠采样
5.3 数据变换
5.3.1 特征缩放
5.3.2 特征编码
5.3.3 数值离散化
第6章 特征工程
6.1 特征选择
6.1.1 过滤法
6.1.2 包装法
6.1.3 嵌入法
6.2 特征降维
6.2.1 主成分分析
6.2.2 线性判别分析
第7章 数据建模
7.1 基础知识
7.1.1 数据集划分
7.1.2 抽样方法
7.1.3 偏差和方差
7.1.4 过拟合和欠拟合
7.1.5 算法分类
7.2 回归算法
7.2.1 线性回归
7.2.2 岭回归
7.2.3 套索回归
7.2.4 多项式回归
7.3 分类算法
7.3.1 决策树
7.3.2 随机森林
7.3.3 逻辑回归
7.3.4 k近邻
7.3.5 朴素贝叶斯
7.4 聚类算法
7.4.1 k均值
7.4.2 DBSCAN
第8章 参数优化与模型评估
8.1 参数优化
8.2 模型评估
8.2.1 回归模型评估
8.2.2 分类模型评估
8.2.3 聚类模型评估
参考文献
1.1 数据挖掘与大数据概述
1.2 我国大数据行业发展现状
1.3 数据挖掘预备知识
1.4 数据挖掘的基本流程
1.5 数据挖掘工作环境
第2章 科学计算库NumPy
2.1 ndarray 对象
2.1.1 ndarray的属性
2.1.2 ndarray的数据类型
2.1.3 ndarray 的创建
2.1.4 ndarray的操作
2.2 伪随机数生成
2.2.1 rand函数
2.2.2 randn函数
2.2.3 randint函数
2.2.4 uniform函数
2.2.5 normal函数
2.2.6 choice函数
2.3 索引和切片
2.3.1 索引
2.3.2 花式索引
2.3.3 切片
2.3.4 布尔型索引
2.4 NumPy运算
2.4.1 元素级运算
2.4.2 广播
2.4.3 通用函数
2.4.4 meshgrid函数
2.4.5 排序
2.4.6 统计函数
2.5 线性代数工具
2.5.1 diag函数
2.5.2 矩阵乘积
2.5.3 矩阵行列式
2.5.4 特征值和特征向量
2.5.5 求解线性方程组
2.6 数组的文件输入和输出
2.6.1 读写文本文件
2.6.2 读写二进制文件
第3章 绘图与可视化
3.1 可视化的基本概念
3.2 Matplotlib绘图
3.2.1 线型图
3.2.2 散点图
3.2.3 条形图
3.2.4 直方图
3.2.5 饼图
3.2.6 箱线图
3.2.7 等高线图
3.3 Seaborn绘图
3.3.1 分布图
3.3.2 关系图
3.3.3 分类图
3.3.4 回归图
3.3.5 热力图
3.3.6 分面网格图
第4章 数据分析库Pandas
4.1 数据类型
4.1.1 Series类型
4.1.2 DataFrame类型
4.2 统计函数
4.2.1 常用统计函数
4.2.2 面元划分
4.2.3 相关系数
4.3 缺失值处理
4.3.1 查看缺失数据
4.3.2 删除缺失数据
4.3.3 填充缺失数据
4.4 重复值处理
4.4.1 查询重复数据
4.4.2 删除重复数据
4.5 异常值处理
4.6 随机采样
4.7 数据转换
4.7.1 map
4.7.2 apply
4.7.3 applymap
4.7.4 replace
4.8 合并与拼接
4.8.1 merge
4.8.2 concat
4.8.3 combine_first
4.9 数据重塑
4.9.1 stack
4.9.2 unstack
4.10 数据分组与聚合
4.10.1 分组
4.10.2 聚合
4.11 透视表
4.12 数据加载与存储
4.12.1 文本文件的加载与存储
4.12.2 电子表格文件的加载与存储
第5章 数据预处理
5.1 数据清洗
5.1.1 缺失值处理
5.1.2 异常值处理
5.1.3 重复值处理
5.2 不均衡数据处理
5.2.1 过采样
5.2.2 欠采样
5.3 数据变换
5.3.1 特征缩放
5.3.2 特征编码
5.3.3 数值离散化
第6章 特征工程
6.1 特征选择
6.1.1 过滤法
6.1.2 包装法
6.1.3 嵌入法
6.2 特征降维
6.2.1 主成分分析
6.2.2 线性判别分析
第7章 数据建模
7.1 基础知识
7.1.1 数据集划分
7.1.2 抽样方法
7.1.3 偏差和方差
7.1.4 过拟合和欠拟合
7.1.5 算法分类
7.2 回归算法
7.2.1 线性回归
7.2.2 岭回归
7.2.3 套索回归
7.2.4 多项式回归
7.3 分类算法
7.3.1 决策树
7.3.2 随机森林
7.3.3 逻辑回归
7.3.4 k近邻
7.3.5 朴素贝叶斯
7.4 聚类算法
7.4.1 k均值
7.4.2 DBSCAN
第8章 参数优化与模型评估
8.1 参数优化
8.2 模型评估
8.2.1 回归模型评估
8.2.2 分类模型评估
8.2.3 聚类模型评估
参考文献
展开全部
本类五星书
本类畅销
-
AI绘画+AI摄影+AI短视频从入门到精通
¥45.5¥79.8 -
企业AI之旅
¥43.5¥79.0 -
乡村振兴新技术:新时代农村短视频编辑技术基础入门
¥12.8¥32.0 -
机器学习
¥59.4¥108.0 -
C Primer Plus 第6版 中文版
¥62.6¥108.0 -
基于知识蒸馏的图像去雾技术
¥61.6¥88.0 -
粒子群算法在优化选取问题中的应用研究
¥40.8¥68.0 -
Web前端开发基础
¥36.5¥57.0 -
智能算法优化及其应用
¥49.0¥68.0 -
Photoshop图像处理
¥25.5¥49.0 -
SNS信息传播分析
¥48.3¥69.0 -
R语言医学数据分析实践
¥72.3¥99.0 -
大模型推荐系统:算法原理、代码实战与案例分析
¥66.8¥89.0 -
HARMONYOS NEXT启程:零基础构建纯血鸿蒙应用
¥75.6¥108.0 -
剪映 从入门到精通
¥25.7¥59.8 -
游戏造梦师----游戏场景开发与设计
¥68.6¥98.0 -
SAR图像处理与检测
¥35.4¥49.8 -
生成式人工智能(AIGC)应用
¥71.1¥90.0 -
人工智能
¥29.4¥42.0 -
中文版PHOTOSHOP 2024+AI修图入门教程
¥59.3¥79.0