5分
无R语言数据分析与可视化从入门到精通
- ISBN:9787301314807
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:508
- 出版时间:2020-10-01
- 条形码:9787301314807 ; 978-7-301-31480-7
本书特色
1. 理论为辅、实践为主。本书涉及一些必要的理论知识,特别是在数据分析部分,但总体以实践为主,因此几乎每节都有大量的代码,方便读者实践。 2. 知识全面、系统。本书在介绍了R语言的基础知识后,从数据获取和导出、数据清理和操作、数据分析和可视化方面分别进行了探讨,内容由浅入深、循序渐进。 3. 案例广泛。本书中的案例涉及心理学、社会学、医学、商业和经济等领域,但并不需要读者具备这些领域的专业知识。 4. “新手问答”和“小试牛刀”知识模块。“新手问答”主要对读者学习过程中易出现的疑问或容易犯的错误进行针对性的解答;“小试牛刀”结合每章知识及相关技能,列举综合上机案例,让读者在学完一章内容后能及时回顾和练习,旨在让读者巩固知识、学以致用。
内容简介
R语言是一个自由、免费、源代码开放的编程语言和环境,它提供了强大的数据分析功能和丰富的数据可视化手段。随着数据科学的快速发展,R语言已经成为数据分析领域炙手可热的通用语言。全书分为3篇共12章,具体内容如下。 篇:入门篇(章~第3章)。本篇将带领读者逐步走进R语言的世界,帮助读者对R语言形成初步的认识,并学会如何获取和安装R语言,以及如何在需要时获取帮助。然后介绍R语言的一些基础知识,这些知识是灵活应用R语言的必要前提。很后重点介绍R语言函数的使用方法,同时也会涉及一些其他相关内容,如流程控制和R语言环境等。 第2篇:进阶篇(第4章~1章)。本篇介绍R语言数据管理、数据分析和数据可视化的三大威力,包括通过数据获取、导出、整合和清理等操作将零散的数据整合为可以分析处理的数据集的多种方法;并介绍一些常用基础统计和不错统计的实现方法,以及R语言的图形生成、图形修饰、外部绘图插件和图形展示等功能。 第3篇:实战篇(2章)。本篇通过一个实战案例,综合讲解R语言在数据处理与可视化分析方面的实战技能。
目录
第1篇 入门篇第1章 R语言快速入门 /3
1.1 R语言及其历史 /4
1.1.1 R语言的源起 /4
1.1.2 R语言的版本更新 /4
1.2 R语言的优势和劣势 /5
1.2.1 R语言的优势 /5
1.2.2 R语言的劣势 /6
1.3 R语言的软件获取及安装 /6
1.3.1 获取R语言软件 /6
1.3.2 在Windows平台上安装 /7
1.3.3 在Linux平台上安装 /10
1.3.4 在Mac OS平台上安装 /11
1.4 R语言的辅助工具 /13
1.4.1 R GUI /13
1.4.2 RStudio /16
1.4.3 获取帮助 /19
1.5 新手问答 /21
1.6 小试牛刀:练习设置RStudio全局选项 /21
本章小结 /23
第2章 R语言的编程基础(上) /24
2.1 对象与变量 /25
2.1.1 对象 /25
2.1.2 变量 /26
2.1.3 变量的列举和删除 /28
2.2 数据类型 /30
2.2.1 常用数据类型 /31
2.2.2 特殊值 /31
2.3 数据结构 /32
2.3.1 向量 /32
2.3.2 矩阵和数组 /38
2.3.3 因子 /43
2.3.4 列表 /46
2.3.5 数据框 /50
2.3.6 原子向量和递归向量 /53
2.4 数学运算 /58
2.4.1 基础运算 /58
2.4.2 向量运算 /61
2.4.3 矩阵运算 /64
2.5 新手问答 /65
2.6 小试牛刀:提取数据框子集,并对部分列做统计计算 /66
本章小结 /67
第3章 R语言的编程基础(下) /68
3.1 流程控制 /69
3.1.1 repeat循环 /69
3.1.2 while循环 /70
3.1.3 for循环 /70
3.1.4 if…else语句 /72
3.1.5 switch语句 /73
3.2 编写R函数 /74
3.2.1 函数格式 /74
3.2.2 函数参数 /75
3.2.3 返回值 /77
3.2.4 函数调用 /77
3.3 R语言常用函数 /78
3.3.1 文件操作函数 /78
3.3.2 基础计算函数 /81
3.3.3 概率分布函数 /86
3.3.4 字符处理函数 /90
3.4 R包 /94
3.4.1 R包的管理 /94
3.4.2 R包的加载 /97
3.4.3 自定义R包 /98
3.5 环境空间 /103
3.5.1 环境空间的种类 /103
3.5.2 环境空间的使用方法 /104
3.5.3 环境空间的特征 /106
3.6 新手问答 /108
3.7 小试牛刀:编写函数并实现调用 /109
本章小结 /110
第2篇 进阶篇第
4章 R语言的数据获取与导出 /113
4.1 数据获取 /114
4.1.1 导入R语言系统格式数据 /114
4.1.2 导入带有分隔符的文本数据 /114
4.1.3 导入Excel数据 /115
4.1.4 读取数据库数据 /119
4.1.5 读取其他统计工具的数据 /128
4.1.6 从互联网抓取数据 /136
4.2 数据导出 /151
4.2.1 写入R语言系统格式的数据 /151
4.2.2 写入文本文件 /152
4.2.3 写入Excel文件 /152
4.2.4 写入数据库 /153
4.3 新手问答 /155
4.4 小试牛刀:比较R语言读/写文件的效率 /156
本章小结 /158
第5章 R语言的数据管理威力之数据操作 /159
5.1 R语言内置数据操作函数 /160
5.1.1 查看和编辑数据 /160
5.1.2 筛选 /163
5.1.3 合并 /165
5.1.4 分组和汇总 /168
5.1.5 排序 /170
5.1.6 转换 /173
5.2 数据重塑 /175
5.3 apply函数族 /178
5.3.1 apply()函数 /178
5.3.2 lapply()函数 /181
5.3.3 sapply()函数 /183
5.3.4 vapply()函数 /183
5.3.5 mapply()函数 /184
5.4 plyr扩展包 /184
5.5 用sqldf()函数实现数据框的SQL风格查询 /189
5.6 dplyr扩展包 /191
5.7 新手问答 /199
5.8 牛刀小试:对矩阵各列使用不同的
函数 /200
本章小结 /202
第6章 语言的数据分析威力之基本统计 /203
6.1 描述性统计 /204
6.1.1 描述性统计量 /204
6.1.2 列联表 /206
6.1.3 同时呈现多个统计量 /210
6.2 计数数据的检验 /215
6.2.1 卡方检验的基本原理 /215
6.2.2 在R语言中实现卡方检验 /216
6.3 相关分析 /220
6.3.1 相关的类型 /220
6.3.2 各种相关系数计算在R语言中的实现 /221
6.4 t检验 /224
6.4.1 独立样本t检验 /225
6.4.2 非独立样本t检验 /227
6.4.3 对t检验的前提假设进行检验 /228
6.5 方差分析 /230
6.5.1 方差分析的基本术语 /230
6.5.2 aov()函数 /231
6.5.3 单因素非重复测量方差分析 /232
6.5.4 单因素协方差分析 /235
6.5.5 单因素重复测量方差分析 /238
6.5.6 两因素方差分析 /240
6.5.7 对方差分析前提假设的检验 /242
6.6 非参数检验 /242
6.6.1 两总体比较 /243
6.6.2 多于两总体比较 /244
6.7 回归分析 /244
6.7.1 lm()函数 /245
6.7.2 模型拟合 /245
6.7.3 模型诊断 /249
6.7.4 模型改进 /251
6.8 新手问答 /257
6.9 小试牛刀:独立样本均值差异检验 /257
本章小结 /259
第7章 R语言的数据分析威力之高级方法 /262
7.1 判别分析 /263
7.1.1 判别分析的原理 /263
7.1.2 判别分析在R语言中的实现 /264
7.2 聚类分析 /273
7.2.1 聚类分析的原理 /274
7.2.2 聚类分析在R语言中的实现 /279
7.3 主成分分析 /289
7.3.1 主成分分析的原理 /289
7.3.2 主成分分析在R语言中的实现 /290
7.4 因子分析 /292
7.4.1 因子分析的原理 /293
7.4.2 因子分析在R语言中的实现 /295
7.5 新手问答 /302
7.6 小试牛刀:尝试实现层次聚类 /302
本章小结 /303
第8章 R语言的可视化威力之图形生成 /304
8.1 R语言绘图系统 /305
8.2 单变量绘图和双变量绘图 /305
8.2.1 散点图 /305
8.2.2 折线图 /309
8.2.3 条形图 /312
8.2.4 饼图 /314
8.2.5 箱线图 /315
8.2.6 直方图和核密度图 /317
8.3 多变量绘图 /319
8.3.1 气泡图 /319
8.3.2 热图 /321
8.3.3 马赛克图 /322
8.3.4 相关矩阵图 /325
8.3.5 三维散点图 /327
8.4 新手问答 /328
8.5 小试牛刀:将两个数据源绘制在同一个坐标系中 /329
本章小结 /330
第9章 R语言的可视化威力之图形优化 /331
9.1 添加图形元素 /332
9.1.1 坐标轴 /332
9.1.2 图例 /337
9.1.3 文本注解 /341
9.1.4 标题 /343
9.1.5 参考线 /344
9.1.6 线段和带箭头的线段 /346
9.1.7 矩形阴影 /347
9.2 控制图形外观 /348
9.2.1 整体外观 /348
9.2.2 局部外观 /351
9.2.3 文本 /352
9.2.4 线条 /353
9.2.5 矩形 /354
9.2.6 点的形状 /355
9.3 图形配色与布局 /356
9.3.1 颜色与调色板 /356
9.3.2 面板和分面 /362
9.3.3 图形组合 /365
9.4 新手问答 /368
9.5 小试牛刀:使用网格系统组合图形 /369
本章小结 /370
第10章 R语言的可视化威力之外部插件 /371
10.1 ggvis插件包 /372
10.1.1 ggivs与ggplot2的对比 /372
10.1.2 绘图语法 /374
10.1.3 图层 /377
10.1.4 图形修饰 /384
10.2 plotly插件包 /391
10.2.1 plotly插件包对ggplot2包绘图对象的扩展 /392
10.2.2 绘图语法 /393
10.2.3 绘图示例 /403
10.2.4 图形修饰 /416
10.3 新手问答 /422
10.4 小试牛刀:使用plotly插件包绘制组合图 /423
本章小结 /425
第11章 R语言的可视化威力之图形展示 /426
11.1 传统图形输出 /427
11.1.1 输出为位图文件 /427
11.1.2 输出为PDF文件 /428
11.1.3 输出为矢量图 /429
11.2 网页输出 /429
11.2.1 使用R Markdown输出为网页 /430
11.2.2 使用shiny输出为网页 /437
11.3 新手问答 /443
11.4 小试牛刀:将绘图输出为HTML文档 /444
本章小结 /446
第3篇 实战篇
第12章 R语言对产品性价比的数据分析与可视化 /449
12.1 数据采集 /450
12.1.1 分析页面结构 /450
12.1.2 编写爬虫程序 /454
12.1.3 抓取数据并保存 /463
12.2 数据清理 /463
12.2.1 变量(字符)拆分与抽取 /464
12.2.2 检测数据缺失与重复值 /466
12.2.3 变量类型转化与重命名 /468
12.3 数据分析与数据可视化 /470
12.3.1 探索性数据分析 /470
12.3.2 图书价格和评论指标的聚类分析 /484
12.3.3 图书性价比分析 /487
本章小结 /496
参考文献 /497
节选
R 语言是S 语言的一个分支,而S 语言则是由John Chambers、Rick Becker 和Allan Wilks 等人在贝尔实验室(前身为AT & T,现为朗讯科技)开发的一种用来进行数据探索、统计分析和作图的解释型语言。S 语言*初的实现版本主要是S-PLUS。S-PLUS 是一个商业软件,它基于S 语言,并被MathSoft 公司的统计科学部进一步完善。1995 年,奥克兰大学统计系的Ross Ihaka 和RobertGentleman 基于S 语言的源代码并结合Scheme 语言的语法,编写了一个能执行S 语言的软件。他们以两人名字的首字母将该软件命名为“R”,并公开了该软件的全部源代码,其命令统称为R 语言。因此R 语言其实也是S 语言的一种实现。 1997 年,由11 人组成的R 语言开发核心团队正式成立,负责R 语言的开发和维护。如今R语言核心开发团队已经达到25 人,成员来自世界知名大学和企业。由于R 语言具备出众的扩展性,其使用者越来越多,同时也吸引了大量的开发者编写自定义函数包供更多人使用。自2004 年开始,R 语言基金会几乎每年都支持R 语言社区成员组织的会议,世界各地的R 语言开发者和用户齐聚一堂,讨论R 语言的应用与科研方面的成果。此外,自2008 年开始,国内也定期举行中国R 语言会议,以推动R 语言在我国的普及。 截至2018 年12 月,R 语言在TIOBE 指数中排名第16 位,反映了R 语言的流行程度。
作者简介
程乾,长期从事教育测量和教育大数据分析,擅长教育测量技术、数据可视化、数据挖掘算法和数据库管理,并致力于R的推广和普及。 刘永,R语言极客,数据分析专家,曾任职于科大讯飞(深圳),新光在线(深圳),擅长数据管理、数据可视化、潜在分类分析、结构方程建模和统计计算,对R语言有深入研究。 高博,高级工程师,主要研究方向为云计算与大数据、数据可视化等,熟悉R语言、.Net、PHP、Python、DevOps、MySQL、SQLServer等技术和工具。参与编写了《代码的力量——Discuz!源码分析与插件开发实例进阶》《PHP+MySQL+AJAX Web开发给力起飞》《Java Web应用开发给力起飞》等图书。主持省部级纵向课题3项,参与纵向、横向课题16项,获得软件著作权12项。
-
全图解零基础word excel ppt 应用教程
¥15.6¥48.0 -
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
硅谷之火-人与计算机的未来
¥12.7¥39.8 -
机器学习
¥59.4¥108.0 -
情感计算
¥66.8¥89.0 -
LINUX企业运维实战(REDIS+ZABBIX+NGINX+PROMETHEUS+GRAFANA+LNMP)
¥48.3¥69.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥62.9¥89.8 -
LINUX实战——从入门到精通
¥48.3¥69.0 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
剪映AI
¥52.8¥88.0 -
数据驱动的工业人工智能:建模方法与应用
¥68.3¥99.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥76.3¥109.0 -
UG NX 12.0数控编程
¥24.8¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
UN NX 12.0多轴数控编程案例教程
¥24.3¥38.0 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0 -
Go 语言运维开发 : Kubernetes 项目实战
¥38.7¥79.0 -
明解C语言:实践篇
¥62.9¥89.8 -
Linux服务器架设实战(Linux典藏大系)
¥84.5¥119.0