×
数据分析与机器学习:基于R语言

包邮数据分析与机器学习:基于R语言

1星价 ¥69.3 (7.0折)
2星价¥69.3 定价¥99.0
暂无评论
图文详情
  • ISBN:9787111770794
  • 装帧:平装-胶订
  • 册数:暂无
  • 重量:暂无
  • 开本:16开
  • 页数:258
  • 出版时间:2025-03-01
  • 条形码:9787111770794 ; 978-7-111-77079-4

本书特色

本书介绍了R语言、机器学习算法、统计方法和分析方法,用于让读者了解如何在数据中找到有趣的结构,以及学会如何使用数据来解决复杂问题。通过简单、易懂的例子逐步解释各种机器学习算法是如何独立于任何编程语言工作的。本书详细介绍了用R编写的脚本,并将这些脚本应用于具有真实数据的复杂问题。提供了脚本代码,允许读者在学习时执行脚本,涵盖了多种机器学习技术的不同实现方式。本书既适合作为高校计算机及相关专业的教材,也适合作为IT技术人员的参考书。

内容简介

本书基于R语言介绍了机器学习算法、统计方法和数据分析方法,让读者在边学边做的过程中学会解决实际问题。本书首先使用简单易懂的例子来逐步解释各种机器学习算法。接下来,介绍如何用R编写脚本,这些脚本会应用相关算法来解决实际数据中的问题。本书提供脚本代码,读者可利用相关脚本进行学习。

前言

前  言
本书主要介绍R语言、机器学习算法、统计方法学和分析方法,以便读者学会使用数据来解决复杂问题。本书有两个主要目标:
明确展示如何、为什么以及何时使用机器学习技术。
尽快为读者提供成为R语言高效使用者所需的内容。
本书的方法非常直接,可以称之为“先看后做”,原因如下:
通过简单易懂的示例,逐步解释各种机器学习算法是如何独立于任何编程语言工作的。
解释了脚本的细节,这些脚本与包括第4版在内的所有R语言的版本兼容,并且可以用来解决具有真实数据的复杂问题。本书已提供这些脚本,以便读者在阅读本书的解释时,可以观察这些脚本的执行过程。
涵盖了多种机器学习技术的不同实现方式。

目录


目  录
译者序
前言
第1章 机器学习导论1
1.1 机器学习、统计分析和数据科学1
1.2 机器学习:**个示例2
1.2.1 属性-值格式2
1.2.2 用于诊断疾病的决策树3
1.3 机器学习策略5
1.3.1 分类5
1.3.2 估计6
1.3.3 预测6
1.3.4 无监督聚类9
1.3.5 市场购物篮分析9
1.4 评估性能9
1.4.1 评估监督模型10
1.4.2 二分类误差分析10
1.4.3 评估数值输出11
1.4.4 通过测量提升比较模型11
1.4.5 评估无监督模型13
1.5 伦理问题14
1.6 本章小结14
1.7 关键术语15
练习题16
第2章 R语言简介18
2.1 R语言和RStudio简介18
2.1.1 R的特性19
2.1.2 安装R19
2.1.3 安装RStudio20
2.2 浏览RStudio21
2.2.1 控制台21
2.2.2 源面板22
2.2.3 全局环境24
2.2.4 包28
2.3 数据在哪里29
2.4 获取帮助和额外信息29
2.5 本章小结30
练习题30
相关安装包和函数总结31
第3章 数据结构和操作32
3.1 数据类型32
3.1.1 字符数据和因子33
3.2 单模式数据结构34
3.2.1 向量34
3.2.2 矩阵和数组36
3.3 多模式数据结构37
3.3.1 列表37
3.3.2 数据框38
3.4 编写自己的函数39
3.4.1 写一个简单的函数39
3.4.2 条件语句41
3.4.3 迭代42
3.4.4 递归编程45
3.5 本章小结46
3.6 关键术语46
练习题46
相关安装包和函数总结47
第4章 准备数据48
4.1 知识发现的过程模型48
4.2 创建目标数据集49
4.2.1 R与关系模型的接口49
4.2.2 目标数据的其他来源52
4.3 数据预处理52
4.3.1 噪声数据 52
4.3.2 使用R进行预处理53
4.3.3 检测异常值54
4.3.4 缺失数据55
4.4 数据转换56
4.4.1 数据归一化56
4.4.2 数据类型转换57
4.4.3 属性和实例选择57
4.4.4 创建训练集和测试集
   数据58
4.4.5 交叉验证和自助法59
4.4.6 大规模数据59
4.5 本章小结59
4.6 关键术语60
练习题60
相关安装包和函数总结61
第5章 监督统计技术62
5.1 简单线性回归62
5.2 多元线性回归66
5.2.1 多元线性回归:一个示例67
5.2.2 评估数值输出69
5.2.3 评估训练/测试集71
5.2.4 使用交叉验证71
5.2.5 分类数据的线性回归73
5.3 逻辑回归78
5.3.1 变换线性回归模型78
5.3.2 逻辑回归模型79
5.3.3 R中的逻辑回归79
5.3.4 创建混淆矩阵81
5.3.5 接收器操作特性曲线82
5.3.6 ROC曲线下面积85
5.4 朴素贝叶斯分类器85
5.4.1 贝叶斯分类器:一个示例85
5.4.2 零-值属性计数87
5.4.3 缺失数据88
5.4.4 数值数据88
5.4.5 用朴素贝叶斯进行实验90
5.5 本章小结93
5.6 关键术语94
练习题95
相关安装包和函数总结97
第6章 基于树的方法98
6.1 决策树算法98
6.1.1 一种构建决策树的算法98
6.1.2 C4.5属性选择99
6.1.3 构建决策树的其他方法102
6.2 构建决策树:C5.0102
6.2.1 信用卡促销的决策树103
6.2.2 模拟客户流失的数据 104
6.2.3 使用C5.0预测客户流失104
6.3 构建决策树:rpart106
6.3.1 信用卡促销的rpart决策树 107
6.3.2 训练和测试rpart:流失
   数据109
6.3.3 交叉验证rpart:流失数据113
6.4 构建决策树:J48113
6.5 用于提高性能的集成技术115
6.5.1 装袋算法116
6.5.2 提升116
6.5.3 提升:C5.0的示例117
6.5.4 随机森林117
6.6 回归树119
6.7 本章小结121
6.8 关键术语122
练习题122
相关安装包和函数总结123
第7章 基于规则的技术124
7.1 从树到规则 124
7.1.1 垃圾邮件数据集125
7.1.2 垃圾邮件分类:C5.0125
7.2 基本的覆盖规则算法128
7.3 生成关联规则130
7.3.1 置信度和支持度130
7.3.2 挖掘关联规则:一个示例131
7.3.3 一般考虑事项134
7.3.4 Rweka的Apriori函数134
7.4 Rattle用户界面137
7.5 本章小结143
7.6 关键术语144
练习题144
相关安装包和函数总结145
第8章 神经网络146
8.1 前馈神经网络146
8.1.1 神经网络输入格式147
8.1.2 神经网络输出格式148
8.1.3 sigmoid评估函数149
8.2 神经网络训练:概念视角150
8.2.1 使用前馈网络的监督学习150
8.2.2 具有自组织映射的无监督
   聚类150
8.3 神经网络解释151
8.4 一般考虑事项152
8.4.1 优势152
8.4.2 劣势152
展开全部

作者简介

理查德·J. 罗杰(Richard J. Roiger)
明尼苏达州立大学曼卡托分校的荣休教授,他在计算机与信息科学系从事教学和研究工作超过30年。罗杰博士于明尼苏达大学获得计算机与信息科学领域的博士学位。在机器学习和知识发现领域,他曾发表多篇会议论文和期刊论文。退休后,罗杰博士继续担任兼职教师,教授关于数据科学、人工智能和研究方法的课程。罗杰博士是明尼苏达州退休教育协会的董事会成员,并担任该协会的财务顾问。

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航