- ISBN:9787115462640
- 装帧:暂无
- 册数:暂无
- 重量:暂无
- 开本:32开
- 页数:519
- 出版时间:2017-10-01
- 条形码:9787115462640 ; 978-7-115-46264-0
本书特色
R 是一个开源、跨平台的科学计算和统计分析软件包,它提供了丰富多样的统计功能和强大的数据分析功能。随着数据科学的快速发展,R已经成为数据分析领域非常流行的语言。 本书通过15章内容,向读者全面讲解了R的基础知识和编程技巧。本书不仅介绍了R的安装、基本对象、工作空间管理、基本表达式、基本对象操作、字符串的使用等基础内容,还对数据处理、R的内部机制、元编程、面向对象编程、数据库操作、数据操作进行了讲解,同时也涉及高性能计算、网页爬虫和效率提升等重要主题。 本书面向数据领域的从业人员,尤其适合想要通过学习R编程及相关工具提升数据处理效率的读者阅读,也适合计算机或统计相关专业的学生参考使用。通过阅读本书,读者将全面掌握R的相关特性及其在数据处理和分析方面的应用,极大地提升自己的专业技能。
内容简介
R 语言是从事数据科学和统计学需要的工具之一。强大且复杂的 R 对于初学者和不熟悉其独特特性的人来说可能具有一定的挑战性。本书以一种简单且实践性强的方式来教授读者学习R语言,并逐步建立对R语言广泛、一致的理解。通过实际操作实例,亲身体验强大的 R 工具,并总结 R 的使用方法,你能够更深入地了解如何使用数据。通过学习本书,你将掌握 R 的数据结构和相应的数据处理技术,以及可以提高工作效率的流行的 R 扩展包。 我们从 R 的基础开始讲起,然后深入学习编程技术和范例,以便帮助你编写出高品质的 R 代码。更进一步,在学习如何执行一些常见任务(包括数据分析、数据库、网页爬虫、高性能计算和文档编辑)时,我们将快速、深入地了解 R 的行为。学完本书之后,你将成为一名擅长使用正确技术解决问题的、自信的 R 程序员。 通过阅读本书,你将能够: -探索 R 的基本功能,熟悉常用的数据结构; -在R中,使用统计学、数据挖掘和可视化、根查找和zui优化的基本函数来处理数据; -了解 R 的计算模式、环境和元编程技术; -掌握 R 中的面向对象编程; -访问 SQLite 等关系型数据库和MongoDB 等非关系型数据库; -了解 Rcpp 等高性能计算技术; -使用网页爬虫技术提取信息; -创建 R Markdown,使用 Shiny 创建交互式应用程序,使用DiagramR或者ggvis扩展包创建交互式图表等。
目录
1.1 R简介 1
1.1.1 编程语言 2
1.1.2 计算环境 2
1.1.3 社区 2
1.1.4 生态系统 3
1.2 对R的需求 3
1.3 R的安装 5
1.4 RStudio 7
1.4.1 RStudio的用户界面 8
1.4.2 RStudio服务器 13
1.5 入门示例 13
1.6 小结 15
第2章 基本对象 16
2.1 向量 17
2.1.1 数值向量 17
2.1.2 逻辑向量 19
2.1.3 字符向量 20
2.1.4 构建向量子集 21
2.1.5 命名向量 24
2.1.6 提取向量元素 26
2.1.7 识别向量类型 27
2.1.8 转换向量类型 27
2.1.9 数值向量的算术运算符 29
2.2 矩阵 30
2.2.1 创建一个矩阵 30
2.2.2 为行和列命名 31
2.2.3 构建矩阵子集 31
2.2.4 矩阵运算符的使用 33
2.3 数组 34
2.3.1 创建一个数组 35
2.3.2 构建数组子集 36
2.4 列表 37
2.4.1 创建一个列表 37
2.4.2 从列表中提取元素 38
2.4.3 构建列表子集 39
2.4.4 命名列表 40
2.4.5 赋值 40
2.4.6 其他函数 42
2.5 数据框 43
2.5.1 创建一个数据框 43
2.5.2 对行和列命名 44
2.5.3 构建数据框子集 45
2.5.4 赋值 49
2.5.5 因子 50
2.5.6 数据框中的实用函数 52
2.5.7 在硬盘上读写数据 53
2.6 函数 54
2.6.1 创建函数 54
2.6.2 调用函数 55
2.6.3 动态类型 55
2.6.4 泛化函数 56
2.6.5 函数参数的默认值 58
2.7 小结 59
第3章 工作空间管理 60
3.1 R的工作目录 60
3.1.1 在RStudio中创建R
项目 61
3.1.2 绝对路径和相对路径的
比较 62
3.1.3 管理项目文件 63
3.2 检查工作环境 64
3.2.1 检查现有符号 65
3.2.2 查看对象结构 66
3.2.3 删除符号 69
3.3 修改全局选项 70
3.3.1 修改输出位数 70
3.3.2 修改警告级别 72
3.4 管理扩展包库 73
3.4.1 认识扩展包 74
3.4.2 从CRAN中安装包 75
3.4.3 从CRAN中更新包 76
3.4.4 从在线库中安装包 76
3.4.5 使用包中的函数 77
3.4.6 屏蔽和同名冲突 81
3.4.7 检查是否已安装扩展包 82
3.5 小结 83
第4章 基本表达式 84
4.1 赋值表达式 84
4.1.1 其他赋值操作符 85
4.1.2 使用带反引号的非标准
名称 88
4.2 条件表达式 91
4.2.1 使用if语句 91
4.2.2 使用if表达式 95
4.2.3 在if条件句中使用向量 98
4.2.4 使用向量化的
if:ifelse 100
4.2.5 使用switch对值进行
分支 101
4.3 循环表达式 102
4.3.1 使用for循环 103
4.3.2 使用while循环 109
4.4 小结 110
第5章 基本对象操作 111
5.1 使用原函数 111
5.1.1 检查对象类型 112
5.1.2 识别数据维度 116
5.2 使用逻辑函数 120
5.2.1 逻辑运算符 120
5.2.2 逻辑函数 122
5.2.3 处理缺失值 125
5.2.4 逻辑强制转换 127
5.3 使用数学函数 127
5.3.1 基础函数 127
5.3.2 取整函数 129
5.3.3 三角函数 129
5.3.4 双曲函数 130
5.3.5 *值函数 131
5.4 应用数值方法 134
5.4.1 根查找 134
5.4.2 微积分 137
5.5 使用统计函数 139
5.5.1 从向量中抽样 139
5.5.2 应用随机分布 140
5.5.3 计算描述性统计量 142
5.6 使用apply函数族 146
5.6.1 lapply 147
5.6.2 sapply 148
5.6.3 vapply 149
5.6.4 mapply 150
5.6.5 apply 151
5.7 小结 152
第6章 字符串的使用 153
6.1 字符串入门 153
6.1.1 打印文本 153
6.1.2 连接字符串 157
6.1.3 转换文本 158
6.1.4 格式化文本 163
6.2 格式化日期/时间 165
6.2.1 将文本解析为日期/
时间 166
6.2.2 格式化日期/时间为
字符串 169
6.3 使用正则表达式 171
6.3.1 寻找字符串模式 172
6.3.2 使用分组提取数据 174
6.3.3 以自定义的方式读取
数据 176
6.4 小结 177
第7章 数据处理 178
7.1 读写数据 178
7.1.1 读写文件中的文本格式
数据 178
7.1.2 读写Excel工作表 183
7.1.3 读写原生数据文件 185
7.1.4 加载内置数据集 188
7.2 数据可视化 191
7.2.1 创建散点图 191
7.2.2 创建折线图 197
7.2.3 创建柱状图 201
7.2.4 创建饼状图 203
7.2.5 创建直方图和密度图 203
7.2.6 创建箱线图 206
7.3 数据分析 207
7.3.1 拟合线性模型 207
7.3.2 拟合回归树 212
7.4 小结 215
第8章 R的内部机制 216
8.1 惰性求值 216
8.2 复制—修改机制 221
8.3 词法作用域 227
8.4 环境的工作方式 232
8.4.1 环境对象 232
8.4.2 创建并链接环境 233
8.4.3 链接环境 235
8.4.4 与函数相关的环境 240
8.5 小结 243
第9章 元编程 244
9.1 函数式编程 244
9.1.1 创建和使用闭包 244
9.1.2 使用高阶函数 249
9.2 基于语言的计算 255
9.2.1 捕获和修改表达式 256
9.2.2 执行表达式 263
9.2.3 非标准计算 267
9.3 小结 273
第10章 面向对象编程 274
10.1 面向对象编程简介 274
10.1.1 类和方法 275
10.1.2 继承 275
10.2 S3对象 276
10.2.1 泛型函数和方法分派 276
10.2.2 内置类和方法 279
10.2.3 为现有类定义泛型
函数 287
10.2.4 定义新类并创建对象 288
10.3 S4对象系统 300
10.3.1 定义S4类 300
10.3.2 S4继承 306
10.3.3 定义S4泛型函数 307
10.3.4 多重分派 309
10.4 引用类(RC) 312
10.5 R6 314
10.6 小结 317
第11章 数据库操作 319
11.1 操作关系型数据库 319
11.1.1 创建一个SQLite
数据库 320
11.1.2 访问表和表中字段 323
11.1.3 用SQL对关系型数据库
进行查询 325
11.1.4 分块提取查询结果 335
11.1.5 出于一致性考虑的事务
操作 336
11.1.6 将多个文件的数据存入
一个数据库 342
11.2 操作非关系型数据库 345
11.2.1 MongoDB操作 346
11.2.2 使用Redis 362
11.3 小结 368
第12章 数据操作 369
12.1 使用内置函数操作数据框 369
12.1.1 使用内置函数操作
数据框 370
12.1.2 使用reshape2重塑
数据框 378
12.2 通过sqldf包使用SQL查询
数据框 383
12.3 使用data.table包操作数据 387
12.3.1 使用键获取行 394
12.3.2 对数据分组汇总 396
12.3.3 重塑data.table 399
12.3.4 使用原地设置函数 401
12.3.5 data.table中的动态
作用域 403
12.4 使用dplyr管道操作处理
数据框 408
12.5 使用rlist包处理嵌套数据
结构 416
12.6 小结 421
第13章 高性能计算 423
13.1 理解代码性能问题 423
13.2 代码的性能分析 432
13.2.1 用Rprof进行性能
分析 432
13.2.2 用profvis进行性能
分析 436
13.2.3 理解代码为什么
会慢 438
13.3 提高代码性能 440
13.3.1 使用内置函数 440
13.3.2 使用向量化 443
13.3.3 使用字节码编译器 445
13.3.4 使用由Intel MKL
支持的R 447
13.3.5 使用并行计算 447
13.3.6 使用Rcpp 457
13.4 小结 465
第14章 网页爬虫 467
14.1 查阅网页内容 467
14.2 使用CSS选择器从网页中
提取数据 473
14.3 使用XPath选择器 476
14.4 分析HTML代码并提取
数据 481
14.5 小结 489
第15章 效率提升 491
15.1 编写R Markdown文档 491
15.1.1 了解markdown 491
15.1.2 将R整合到
markdown中 497
15.1.3 嵌入表格和图表 499
15.2 创建交互式应用程序 506
15.2.1 创建shiny应用程序 507
15.2.2 使用shinydashboard 511
15.3 小结 515
附录 术语表 516
作者简介
任坤,在量化交易中使用R以及C 和C#已有近4年的时间,他一直致力于开发有用的但社区尚未提供的R包(每天工作8~10小时)。他为其他作者开发的扩展包做出过很多贡献,指出其中存在的问题并给出改进建议。他也是中国R语言大会的重要嘉宾,在R 会议上做过多次演讲。在众多社交媒体中,任坤也受到了广泛关注。此外,他对很多项目都做出了很大贡献,从其GitHub账户可见一斑: https://github.com/renkun-ken https://cn.linkedin.com/in/kun-ren-76027530 https://renkun.me https://renkun.me/formattable https://renkun.me/pipeR https://renkun.me/rlist
-
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
硅谷之火-人与计算机的未来
¥14.3¥39.8 -
全图解零基础word excel ppt 应用教程
¥12.0¥48.0 -
机器学习
¥59.4¥108.0 -
深度学习的数学
¥43.5¥69.0 -
智能硬件项目教程:基于ARDUINO(第2版)
¥37.7¥65.0 -
元启发式算法与背包问题研究
¥38.2¥49.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥62.9¥89.8 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
剪映AI
¥52.8¥88.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥77.4¥109.0 -
UG NX 12.0数控编程
¥24.8¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
界面交互设计理论研究
¥30.8¥56.0 -
UN NX 12.0多轴数控编程案例教程
¥25.8¥38.0 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0 -
Go 语言运维开发 : Kubernetes 项目实战
¥48.2¥79.0 -
明解C语言:实践篇
¥62.9¥89.8 -
Linux服务器架设实战(Linux典藏大系)
¥84.5¥119.0