买过本商品的人还买了
暂无评论
图文详情
- ISBN:9787568049351
- 装帧:一般铜版纸
- 册数:暂无
- 重量:暂无
- 开本:26cm
- 页数:162页
- 出版时间:2019-01-01
- 条形码:9787568049351 ; 978-7-5680-4935-1
本书特色
《数据科学与数学建模》从大数据挖掘中提炼出了科学的、可教学的、有模型的内容,本教材从立足于理论联系案例,从学习者的角度出发,渐进式地把数据挖掘的技术和方法展示出来。本教材除了介绍算法的理论,还为每一类算法配备了具有代表性的、贴近实际应用的典型案例,以大程度地帮助学生做到学以致用。
内容简介
本书内容分为八章, 基本涵盖了目前较为常用的数据科学建模方法, 包括现在热门的深度学习。书中不仅介绍模型的理论基础, 还以大量案例结合现实数据为读者展示了数据分析中常见任务的处理流程, 如分类、回归、聚类、推荐、图片识别等, 帮助读者应用这些模型和方法解决实际问题。
目录
目录
**章 绪论 6
1.1数据科学概述 6
1.2 数据科学的建模流程 8
1.3 Python语言开发环境与库入门 12
1.3.1 开发环境 12
1.3.2 Python基本语法 15
1.3.3 Python常用库和功能 16
1.4本书内容介绍 19
第二章 回归模型 21
2.1概述 21
2.2线性回归 22
2.2.1 一元线性回归 22
2.2.2 多元线性回归 25
2.3线性回归案例 28
2.3.1儿童体表面积预测 28
2.3.2波士顿房价因素分析 32
附录:scikit-learn库中的LinearRegression 34
2.4逻辑回归 35
2.4.1 逻辑回归模型 35
2.4.2 逻辑回归方程中回归系数的估计及含义 37
2.4.3 逻辑回归方程的统计检验 38
2.5逻辑回归案例 40
2.5.1考试成绩预测 40
2.5.2鸢尾花分类 42
附录:scikit-learn库中的LogisticsRegression 44
第三章 聚类模型 46
3.1概述 46
3.1.1聚类分析概述 46
3.1.2基于距离的聚类相似度 49
3.2 K-means聚类 50
3.2.1 K-means聚类算法 50
3.2.2 K-means聚类实例 51
3.2.3 K-means聚类的优缺点 56
3.3 密度聚类 56
3.3.1 DBSCAN密度定义 56
3.3.2 DBSCAN聚类算法 56
3.3.3 DBSCAN聚类的优缺点 57
3.4 层次聚类 57
3.4.1系统聚类 58
3.4.2 DIANA算法 64
3.4.3 层次聚类算法的优缺点 67
3.5 案例 67
3.5.1 一个二维数据集聚类 67
3.5.2一个居民家庭情况案例 69
3.5.3一个医疗建设评价案例 75
附录:scikit-learn库中的KMeans 77
第四章 关联规则 80
4.1 概述 80
4.1.1 问题概述 80
4.1.2 关联规则概述 80
4.1.3 关联分析的基本概念 81
4.2 Apriori算法 84
4.3 基于Apriori算法的改进算法 88
4.4 FP-Growth算法 90
4.5 关联规则案例 94
4.5.1一个销售记录的关联分析案例 94
4.5.2商品购买记录分析 98
4.5.3电影推荐 100
第五章 决策树 104
5.1概述 104
5.1.1 决策树基本算法 104
5.1.2 CLS算法 105
5.1.3 信息熵 106
5.2 ID3算法 107
5.2.1基本思想 107
5.2.2 ID3算法应用实例 109
5.3 C4.5算法 112
5.3.1 基本思想 112
5.3.2 基于信息增益率建模的决策树 113
5.4 CART算法 114
5.4.1 基本思想 114
5.4.2 基于CART算法建模的决策树 115
5.5 决策树的剪枝 117
5.6 案例 121
5.6.1泰坦尼克号乘客幸存预测 121
5.6.2乳腺癌诊断 125
附录:scikit-learn库中的DecisionTreeClassifier 129
第六章 支持向量机 132
6.1概述 132
6.2线性支持向量机 132
6.2.1 硬间隔线性支持向量机 133
6.2.2 软间隔线性支持向量机 135
6.3非线性支持向量机 138
6.3.1特征空间硬间隔支持向量机 140
6.3.2特征空间软间隔支持向量机 141
6.4 支持向量机的求解和多分类问题 142
6.4.1 支持向量机的求解 142
6.4.2 多分类问题 142
6.5新闻文本分类案例 144
附录:scikit-learn库中的SVM 147
第七章 贝叶斯网络 150
7.1概述 150
7.1.1 贝叶斯网络定义 150
7.1.2 贝叶斯网络的知识推理模式 151
7.1.3 贝叶斯网络建立的主要步骤 151
7.1.4贝叶斯网络的结构学习 152
7.1.5 贝叶斯网络的参数学习 153
7.1.6 主要贝叶斯网络模型 156
7.2 朴素贝叶斯网络 156
7.3 TAN贝叶斯网络 162
7.4 无约束贝叶斯网络 167
7.5 朴素贝叶斯进行垃圾邮件过滤 170
附录 scikit-learn库中的Naive-Bayes分类 174
第八章 深度学习 176
8.1概述 176
8.1.1 深度学习的发展历史 176
8.1.2 神经网络的基本模型 176
8.2多层感知机 180
8.2.1感知机 180
8.2.2多层感知机 184
8.3卷积神经网络 190
8.3.1基本网络结构 191
8.3.2反向传播训练算法 192
8.3.3 AlexNet网络结构 193
8.4循环神经网络 194
8.4.1基本网络结构 195
8.4.2反向传播训练算法 195
8.4.3长短时间记忆单元 196
8.5 构建卷积神经网络模型对CIFAR图片数据集分类 197
附录:TensorFlow基本用法 203
参考文献 207
**章 绪论 6
1.1数据科学概述 6
1.2 数据科学的建模流程 8
1.3 Python语言开发环境与库入门 12
1.3.1 开发环境 12
1.3.2 Python基本语法 15
1.3.3 Python常用库和功能 16
1.4本书内容介绍 19
第二章 回归模型 21
2.1概述 21
2.2线性回归 22
2.2.1 一元线性回归 22
2.2.2 多元线性回归 25
2.3线性回归案例 28
2.3.1儿童体表面积预测 28
2.3.2波士顿房价因素分析 32
附录:scikit-learn库中的LinearRegression 34
2.4逻辑回归 35
2.4.1 逻辑回归模型 35
2.4.2 逻辑回归方程中回归系数的估计及含义 37
2.4.3 逻辑回归方程的统计检验 38
2.5逻辑回归案例 40
2.5.1考试成绩预测 40
2.5.2鸢尾花分类 42
附录:scikit-learn库中的LogisticsRegression 44
第三章 聚类模型 46
3.1概述 46
3.1.1聚类分析概述 46
3.1.2基于距离的聚类相似度 49
3.2 K-means聚类 50
3.2.1 K-means聚类算法 50
3.2.2 K-means聚类实例 51
3.2.3 K-means聚类的优缺点 56
3.3 密度聚类 56
3.3.1 DBSCAN密度定义 56
3.3.2 DBSCAN聚类算法 56
3.3.3 DBSCAN聚类的优缺点 57
3.4 层次聚类 57
3.4.1系统聚类 58
3.4.2 DIANA算法 64
3.4.3 层次聚类算法的优缺点 67
3.5 案例 67
3.5.1 一个二维数据集聚类 67
3.5.2一个居民家庭情况案例 69
3.5.3一个医疗建设评价案例 75
附录:scikit-learn库中的KMeans 77
第四章 关联规则 80
4.1 概述 80
4.1.1 问题概述 80
4.1.2 关联规则概述 80
4.1.3 关联分析的基本概念 81
4.2 Apriori算法 84
4.3 基于Apriori算法的改进算法 88
4.4 FP-Growth算法 90
4.5 关联规则案例 94
4.5.1一个销售记录的关联分析案例 94
4.5.2商品购买记录分析 98
4.5.3电影推荐 100
第五章 决策树 104
5.1概述 104
5.1.1 决策树基本算法 104
5.1.2 CLS算法 105
5.1.3 信息熵 106
5.2 ID3算法 107
5.2.1基本思想 107
5.2.2 ID3算法应用实例 109
5.3 C4.5算法 112
5.3.1 基本思想 112
5.3.2 基于信息增益率建模的决策树 113
5.4 CART算法 114
5.4.1 基本思想 114
5.4.2 基于CART算法建模的决策树 115
5.5 决策树的剪枝 117
5.6 案例 121
5.6.1泰坦尼克号乘客幸存预测 121
5.6.2乳腺癌诊断 125
附录:scikit-learn库中的DecisionTreeClassifier 129
第六章 支持向量机 132
6.1概述 132
6.2线性支持向量机 132
6.2.1 硬间隔线性支持向量机 133
6.2.2 软间隔线性支持向量机 135
6.3非线性支持向量机 138
6.3.1特征空间硬间隔支持向量机 140
6.3.2特征空间软间隔支持向量机 141
6.4 支持向量机的求解和多分类问题 142
6.4.1 支持向量机的求解 142
6.4.2 多分类问题 142
6.5新闻文本分类案例 144
附录:scikit-learn库中的SVM 147
第七章 贝叶斯网络 150
7.1概述 150
7.1.1 贝叶斯网络定义 150
7.1.2 贝叶斯网络的知识推理模式 151
7.1.3 贝叶斯网络建立的主要步骤 151
7.1.4贝叶斯网络的结构学习 152
7.1.5 贝叶斯网络的参数学习 153
7.1.6 主要贝叶斯网络模型 156
7.2 朴素贝叶斯网络 156
7.3 TAN贝叶斯网络 162
7.4 无约束贝叶斯网络 167
7.5 朴素贝叶斯进行垃圾邮件过滤 170
附录 scikit-learn库中的Naive-Bayes分类 174
第八章 深度学习 176
8.1概述 176
8.1.1 深度学习的发展历史 176
8.1.2 神经网络的基本模型 176
8.2多层感知机 180
8.2.1感知机 180
8.2.2多层感知机 184
8.3卷积神经网络 190
8.3.1基本网络结构 191
8.3.2反向传播训练算法 192
8.3.3 AlexNet网络结构 193
8.4循环神经网络 194
8.4.1基本网络结构 195
8.4.2反向传播训练算法 195
8.4.3长短时间记忆单元 196
8.5 构建卷积神经网络模型对CIFAR图片数据集分类 197
附录:TensorFlow基本用法 203
参考文献 207
展开全部
本类五星书
浏览历史
本类畅销
-
落洼物语
¥8.7¥28.0 -
当代中国政府与政治(新编21世纪公共管理系列教材)
¥32.6¥48.0 -
中国当代文学名篇选读
¥19.1¥53.0 -
中医基础理论
¥50.7¥59.0 -
北大人文课(平装)
¥13.9¥45.0 -
外国教育史-第2版
¥24.4¥40.0 -
宪法-第二版
¥12.2¥29.0 -
先进防伪技术
¥81.3¥98.0 -
当代中国政府与政治 第二版
¥57.8¥68.0 -
EPLAN电气设计
¥29.9¥39.8 -
闯进数学世界――探秘历史名题
¥21.3¥32.8 -
企业法务教程
¥34.8¥49.0 -
习近平新时代中国特色社会主义思想概论
¥18.2¥26.0 -
毛泽东思想和中国特色社会主义理论体系概论(2021年版)
¥6.8¥25.0 -
金融学
¥29.9¥49.0 -
计算机操作系统教程(第4版)(清华大学计算机系列教材)
¥31.9¥49.0 -
古代汉语(第四册)
¥16.1¥35.0 -
管理学:原理与方法(第7版)(博学.大学管理类)/周三多
¥30.9¥49.0 -
(平装)北大必修课:北大口才课
¥12.2¥45.0 -
海商法-第四版
¥30.2¥48.0