×
R语言数据分析与挖掘实战手册

R语言数据分析与挖掘实战手册

1星价 ¥22.7 (3.8折)
2星价¥22.1 定价¥59.8

温馨提示:5折以下图书主要为出版社尾货,大部分为全新(有塑封/无塑封),个别图书品相8-9成新、切口有划线标记、光盘等附件不全详细品相说明>>

暂无评论
图文详情
  • ISBN:9787113257453
  • 装帧:80g胶版纸
  • 册数:暂无
  • 重量:暂无
  • 开本:16开
  • 页数:264
  • 出版时间:2019-06-01
  • 条形码:9787113257453 ; 978-7-113-25745-3

本书特色

本书系统地介绍了利用R 语言进行数据分析和挖掘的相关技术,采用由浅入深的框架体系:开篇伊始介绍R 语言的基础操作,进而介绍回归分析、方差分析等数据分析的方法,以更好地探索数据内部结构,获取数据所包含的信息;更重要的是为后续的数据挖掘提供理论依据;*后介绍典型数据挖掘工具和方法,采用理论基础到算法介绍到案例实战的布局,让读者深刻感知数据挖掘的精髓,在了解算法的同时更好地学以致用。

内容简介

本书系统地介绍了利用R 语言进行数据分析和挖掘的相关技术,采用由浅入深的框架体系:开篇伊始介绍R 语言的基础操作,进而介绍回归分析、方差分析等数据分析的方法,以更好地探索数据内部结构,获取数据所包含的信息;更重要的是为后续的数据挖掘提供理论依据;*后介绍典型数据挖掘工具和方法,采用理论基础到算法介绍到案例实战的布局,让读者深刻感知数据挖掘的精髓,在了解算法的同时更好地学以致用。

目录

第1 章 R 语言简介 1.1 R 语言软件的安装与运行................................................................................................. 1 1.1.1 R 语言软件的安装、启动与关闭........................................................................... 1 1.1.2 R 语言程辑包的安装和使用.................................................................................. 4 1.2 R 语言的数据结构............................................................................................................. 6 1.2.1 R 语言对象和类型................................................................................................. 6 1.2.2 向量........................................................................................................................ 7 1.2.3 数组和矩阵........................................................................................................... 12 1.2.4 列表...................................................................................................................... 17 1.2.5 数据框.................................................................................................................. 20 第2 章 数据的读取与保存 2.1 数据的读取...................................................................................................................... 24 2.1.1 读取内置数据集和文本文件................................................................................ 24 2.1.2 读取Excel 数据和CSV 格式的数据.................................................................... 30 2.1.3 读取R 语言格式数据和网页数据........................................................................ 33 2.1.4 读取其他格式的数据........................................................................................... 34 2.2 数据保存.......................................................................................................................... 36 2.2.1 写出数据.............................................................................................................. 36 2.2.2 使用函数cat() ...................................................................................................... 37 2.2.3 保存为R 语言格式文件....................................................................................... 38 2.2.4 保存为其他类型文件........................................................................................... 39 第3 章 数据预处理 3.1 缺失值处理...................................................................................................................... 40 3.1.1 缺失值判断........................................................................................................... 40 3.1.2 缺失模型判断....................................................................................................... 44 3.1.3 常用处理方法....................................................................................................... 48 3.2 数据整理.......................................................................................................................... 53 3.2.1 数据合并.............................................................................................................. 53 3.2.2 选取子集.............................................................................................................. 56 3.2.3 数据转换.............................................................................................................. 59 第4 章 数据的探索性分析 4.1 基本绘图函数.................................................................................................................. 66 4.2 探索单个变量.................................................................................................................. 74 4.2.1 单组数据的图形描述........................................................................................... 74 4.2.2 单组数据的描述性分析....................................................................................... 79 4.3 探索多个变量.................................................................................................................. 81 4.3.1 两组数据的图形描述........................................................................................... 81 4.3.2 多组数据的图形描述........................................................................................... 85 4.3.3 多组数据的描述性统计....................................................................................... 88 4.4 其他图像探索.................................................................................................................. 90 第5 章 回归分析 5.1 一元线性回归.................................................................................................................. 94 5.1.1 模型简介.............................................................................................................. 94 5.1.2 函数介绍.............................................................................................................. 96 5.1.3 综合案例:iris 数据集的一元回归建模.............................................................. 97 5.2 多元线性回归.................................................................................................................. 99 5.2.1 模型简介.............................................................................................................. 99 5.2.2 综合案例:iris 数据集的多元回归建模............................................................ 100 5.3 变量的选择.................................................................................................................... 105 5.3.1 逐步回归方法简介及函数介绍.......................................................................... 105 5.3.2 综合案例:swiss 数据集的逐步回归建模......................................................... 106 5.3.3 岭回归的方法简介及函数介绍.......................................................................... 109 5.3.4 综合案例:longley 数据集的岭回归探索.......................................................... 110 5.3.5 lasso 回归方法简介及函数介绍......................................................................... 114 5.3.6 综合案例:longley 数据集的lasso 回归建模.................................................... 115 5.4 Logistic 回归.................................................................................................................. 117 5.4.1 模型简介............................................................................................................ 117 5.4.2 函数介绍............................................................................................................ 119 5.4.3 综合案例:iris 数据集的逻辑回归建模............................................................ 120 第6 章 方差分析 6.1 单因素方差分析............................................................................................................ 124 6.1.1 模型介绍............................................................................................................ 124 6.1.2 函数介绍............................................................................................................ 126 6.1.3 综合案例:不同治疗方法下胆固醇降低效果的差异性分析............................ 127 6.2 双因素方差分析............................................................................................................ 130 6.2.1 模型介绍............................................................................................................ 130 6.2.2 综合案例:不同剂量下老鼠妊娠重量的差异性分析........................................ 132 6.3 协方差分析.................................................................................................................... 136 6.3.1 模型简介............................................................................................................ 136 6.3.2 函数介绍............................................................................................................ 136 6.3.3 综合案例:hotdog 数据集的协方差分析........................................................... 137 第7 章 主成分分析和因子分析 7.1 降维的基本方法:主成分分析..................................................................................... 139 7.1.1 理论基础:原始变量的线性组合...................................................................... 139 7.1.2 模型介绍............................................................................................................ 141 7.1.3 函数介绍............................................................................................................ 143 7.1.4 综合案例:longley 数据集的变量降维及回归.................................................. 144 7.1.5 综合案例:longley 数据集的变量降维及回归(主成分回归)....................... 148 7.2 推广发展:因子分析.................................................................................................... 150 7.2.1 理论基础:多个变量综合为少数因子............................................................... 150 7.2.2 模型介绍............................................................................................................ 151 7.2.3 函数介绍............................................................................................................ 153 7.2.4 综合案例:能力和智商测试的因子分析探索................................................... 154 第8 章 判别分析 8.1 距离判别法.................................................................................................................... 160 8.1.1 理论基础:离谁近,就属于谁.......................................................................... 160 8.1.2 函数介绍............................................................................................................ 162 8.1.3 综合案例:基于距离判别的iris 数据集分类.................................................... 164 8.2 Bayes 判别法................................................................................................................. 168 8.2.1 理论基础:先验概率与错判损失...................................................................... 168 8.2.2 函数介绍............................................................................................................ 170 8.2.3 综合案例:基于iris 数据集的Bayes 判别分析................................................ 171 8.3 Fisher 判别法................................................................................................................. 171 8.3.1 理论基础:投影................................................................................................. 171 8.3.2 函数介绍............................................................................................................ 173 8.3.3 综合案例:基于Fisher 判别的iris 数据集分类................................................ 174 第9 章 常规聚类分析 9.1 深入了解聚类分析........................................................................................................ 178 9.1.1 差异与分类......................................................................................................... 178 9.1.2 主流的聚类算法................................................................................................. 179 9.2 动态聚类........................................................................................................................ 180 9.2.1 聚类的基本过程................................................................................................. 180 9.2.2 函数介绍............................................................................................................ 183 9.2.3 综合案例:基于随机生成序列的动态聚类....................................................... 184 9.3 层次聚类........................................................................................................................ 194 9.3.1 聚类的基本过程................................................................................................. 194 9.3.2 函数介绍............................................................................................................ 197 9.3.3 综合案例:基于UScitiesD 数据集的层次聚类................................................. 199 9.4 密度聚类........................................................................................................................ 202 9.4.1 聚类的基本过程................................................................................................. 202 9.4.2 函数介绍............................................................................................................ 202 9.4.3 综合案例:基于随机生成序列的密度聚类....................................................... 203 9.5 EM 聚类......................................................................................................................... 204 9.5.1 聚类的基本过程................................................................................................. 205 9.5.2 函数介绍............................................................................................................ 205 9.5.3 综合案例:基于iris 数据集的EM 聚类............................................................ 206 第10 章 关联规则 10.1 简单关联规则.............................................................................................................. 210 10.1.1 基本概念与表示形式....................................................................................... 210 10.1.2 评价简单关联规则的有效性和实用性............................................................. 211 10.2 序列关联规则.............................................................................................................. 212 10.2.1 差异与基本概念............................................................................................... 212 10.2.2 生成序列关联规则........................................................................................... 213 10.3 Apriori 算法................................................................................................................. 214 10.3.1 算法介绍:挖掘频繁项集................................................................................ 214 10.3.2 函数介绍.......................................................................................................... 215 10.3.3 综合案例:基于Titanic 数据集的关联规则挖掘............................................ 216 10.4 Eclat 算法.................................................................................................................... 224 10.4.1 算法介绍:自底向上的搜索............................................................................ 224 10.4.2 函数介绍.......................................................................................................... 224 10.4.3 综合案例:基于美国人口调查数据的关联规则挖掘...................................... 225 10.5 SPADE 算法................................................................................................................. 230 10.5.1 算法介绍:基于序列格的搜索和连接............................................................. 231 10.5.2 函数介绍.......................................................................................................... 232 10.5.3 综合案例:基于zaki 数据集的序列关联规则挖掘......................................... 233 第11 章 神经网络 11.1 深入了解人工神经网络............................................................................................... 239 11.1.1 生物神经元....................................................................................................... 240 11.1.2 人工神经元模型............................................................................................... 241 11.1.3 人工神经网络种类........................................................................................... 244 11.1.4 建立模型的一般步骤........................................................................................ 247 11.2 B-P 反向传播网络....................................................................................................... 248 11.2.1 B-P 反向传播网络模型.................................................................................... 248 11.2.2 算法介绍........................................................................................................... 249 11.2.3 函数介绍........................................................................................................... 250 11.3 综合案例:基于Boston 数据的波士顿郊区房价预测建模........................................ 252
展开全部

作者简介

程静,毕业于重庆大学,目前就职于西部估值*高的互联网公司猪八戒网,担任高级数据分析工程师,负责行业数据搜集、整理、分析,并依据数据做出行业研究、评估和预测,擅长大数据分析及数据挖掘的各种算法熟练使用R语言及Python语言。

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航