- ISBN:9787121425745
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:208
- 出版时间:2022-02-01
- 条形码:9787121425745 ; 978-7-121-42574-5
内容简介
本书从大数据处理涉及的基础数学理论入手,围绕大数据研究涉及的基础数学知识,从线性代数、微积分、概率与统计、距离度量、优化问题及图论六大方面展开介绍,以夯实读者在大数据领域的理论基础。本书不仅介绍了基本的数学概念,而且通过具体例子介绍了其在大数据领域的实际应用,以提高本书的易读性。本书每章都附有相应的习题,以便读者能够进一步理解相应的知识点。
目录
1.1 行列式 1
1.2 矩阵及其运算 4
1.2.1 矩阵的概念 4
1.2.2 矩阵的基本运算 7
1.2.3 矩阵的乘法 8
1.2.4 逆矩阵 12
1.2.5 分块矩阵 15
1.2.6 矩阵的初等变换 19
1.2.7 应用举例 27
1.3 向量组的线性相关性与矩阵的秩 29
1.3.1 n维向量 30
1.3.2 线性相关与线性无关 31
1.3.3 向量组的秩 33
1.3.4 矩阵的秩 35
1.3.5 向量空间 38
1.3.6 欧几里得空间与正交矩阵 39
1.4 特征值与特征向量、矩阵的对角化 45
1.4.1 矩阵的特征值与特征向量 46
1.4.2 相似矩阵与矩阵对角化 49
1.4.3 实对称矩阵的对角化 56
习题 59
本章参考文献 61
第2章 微积分基础 62
2.1 一元函数的导数 62
2.1.1 导数的定义 62
2.1.2 函数求导公式 63
2.1.3 函数的求导法则 64
2.2 一元函数的微分 65
2.2.1 微分的概念 65
2.2.2 基本一元函数的微分公式 66
2.2.3 一元函数的微分运算法则 66
2.2.4 一元函数微分的实际应用 66
2.3 多元函数的导数与微分 67
2.3.1 多元函数导数的定义 67
2.3.2 多元复合函数的求导法则 69
2.3.3 多元函数微分的定义 69
2.3.4 全微分在近似计算中的应用 70
2.4 向量与矩阵的导数 70
2.4.1 矩阵导数的定义 70
2.4.2 矩阵与向量求导法则 71
2.5 导数与微分的应用 74
2.5.1 极值 75
2.5.2 中值定理 78
习题 80
本章参考文献 81
第3章 概率与统计 82
3.1 随机事件的概率 82
3.1.1 随机事件 82
3.1.2 随机事件的关系与运算 83
3.1.3 随机事件的概率 83
3.2 条件概率 84
3.2.1 条件概率介绍 84
3.2.2 乘法公式和事件的独立性 84
3.2.3 全概率公式与贝叶斯公式 85
3.3 随机变量 87
3.3.1 一维随机变量 87
3.3.2 多维随机变量 94
3.4 随机变量的数字特征 97
3.4.1 随机变量的数学期望 97
3.4.2 方差 100
3.4.3 协方差与相关系数 103
3.5 极大似然估计 106
3.5.1 简单抽样与统计量 106
3.5.2 几个重要分布 108
3.5.3 极大似然估计简介 110
习题 113
本章参考文献 115
第4章 多维数据之间的距离度量 116
4.1 涉及线性代数的距离 116
4.1.1 欧几里得距离 116
4.1.2 向量余弦距离 116
4.1.3 闵氏距离 118
4.2 涉及微积分的距离 119
4.3 涉及概率统计的距离 120
4.3.1 欧几里得距离标准化 120
4.3.2 皮尔逊相关系数 120
4.3.3 马氏距离 121
4.3.4 直方相交距离 122
4.3.5 巴氏距离 126
4.3.6 卡方距离 126
4.4 涉及其他数学知识的距离 127
4.4.1 EMD 127
4.4.2 编辑距离 128
习题 129
本章参考文献 129
第5章 大数据中的优化问题 130
5.1 *优化问题 130
5.2 线性规划 131
5.3 非线性优化问题 136
5.3.1 向量和矩阵范数 136
5.3.2 函数的可微性 137
5.3.3 凸集和凸函数 137
5.4 无约束非线性优化问题 138
5.5 约束非线性优化问题 141
5.6 支持向量机的优化模型及求解 144
5.7 BP神经网络优化模型及解法 147
5.8 回归分析中的优化模型及求解方法 150
5.8.1 一元线性回归 151
5.8.2 多元线性回归 152
5.8.3 非线性回归 154
习题 156
本章参考文献 157
第6章 大数据分析中的图论基础 158
6.1 树、图的基本概念 158
6.1.1 树的定义 158
6.1.2 树的常用术语 159
6.1.3 树的数据结构实现 159
6.1.4 图的定义 160
6.1.5 与图相关的概念 160
6.2 图的*短路径问题 161
6.2.1 Dijkstra算法介绍 162
6.2.2 图例 163
6.3 图的深度优先搜索 165
6.3.1 基本策略 166
6.3.2 实例说明 166
6.3.3 算法伪代码 168
6.4 频繁模式和关联规则 169
6.4.1 经典频集方法 169
6.4.2 关联规则的基本定义 170
6.4.3 关联规则的分类 171
6.4.4 频繁模式树 172
6.5 频繁子图简介 175
6.5.1 图论简要描述 176
6.5.2 频繁子图挖掘的背景知识 177
6.6 复杂网络简介 177
6.6.1 复杂网络的研究内容 178
6.6.2 复杂网络的基本概念 178
6.6.3 常见的复杂网络 179
6.6.4 复杂网络的应用 180
6.7 *长公共子序列 181
6.7.1 定义 181
6.7.2 *优子序列性质 181
6.7.3 LCS递归表达式 182
6.7.4 动态规划方法求解LCS 182
6.8 决策树 184
6.8.1 决策树示例 184
6.8.2 决策树的构成 185
6.8.3 信息增益和信息增益比 186
6.8.4 决策树的生成 187
习题 189
本章参考文献 190
?
作者简介
刘鹏,教授,清华大学博士,南京云创大数据科技股份有限公司总裁,中国大数据应用联盟人工智能专家委员会主任、中国信息协会教育分会人工智能教育专家委员会主任、教育部全国普通高校毕业生就业创业指导委员会委员,第45届世界技能大赛中国区云计算选拔赛裁判长/专家指导组组长,2019年全国大学生数据建模比赛命题人,工信部云计算研究中心专家。在云计算/大数据/人工智能领域具有多年研究积累,是我国该领域知名专家。主持科研项目40多项,发表论文80余篇,出版专业书籍30多本。曾于2002年获得全球数据处理比赛PennySort世界冠军,于2003年夺得全国挑战杯比赛总冠军。提出的反垃圾邮件网格,被IEEE Cluster 2003评为杰出网格项目,为解决困扰全球的垃圾邮件问题做出根本贡献,该技术成为云安全技术的基础。曾担任全军网格技术研究中心主任,获全军十大学习成才标兵(排名**)、南京十大杰出青年、中国大数据创新百人、江苏省中青年领军人才、清华大学学术新秀等称号。
-
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
全图解零基础word excel ppt 应用教程
¥12.0¥48.0 -
机器学习
¥59.4¥108.0 -
深度学习的数学
¥43.5¥69.0 -
智能硬件项目教程:基于ARDUINO(第2版)
¥37.7¥65.0 -
硅谷之火-人与计算机的未来
¥14.3¥39.8 -
元启发式算法与背包问题研究
¥38.2¥49.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥62.9¥89.8 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
剪映AI
¥52.8¥88.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥77.4¥109.0 -
UG NX 12.0数控编程
¥24.8¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
界面交互设计理论研究
¥30.8¥56.0 -
UN NX 12.0多轴数控编程案例教程
¥25.8¥38.0 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0 -
明解C语言:实践篇
¥62.9¥89.8 -
Linux服务器架设实战(Linux典藏大系)
¥84.5¥119.0 -
PREMIERE PRO 2023全面精通:视频剪辑+颜色调整+转场特效+字幕制作+案例实战
¥69.3¥99.0