谁说菜鸟不会数据分析(R语言篇)
- ISBN:9787121389689
- 装帧:平装-胶订
- 册数:暂无
- 重量:暂无
- 开本:其他
- 页数:220
- 出版时间:2020-05-01
- 条形码:9787121389689 ; 978-7-121-38968-9
本书特色
本书从解决工作实际问题出发,提炼并总结工作中R 语言常用的数据处理、数据分析实战方法与技巧。本书力求通俗易懂地介绍相关知识,在不影响学习和理解的前提下,尽可能地避免使用晦涩难懂的R 语言编程、统计术语或模型公式。如果读者需要了解相关的知识,可查阅相关的图书或资料。本书的定位是带领R 语言数据分析初学者入门,并解决在学习、工作中使用R 语言进行数据分析的大部分问题或需求。如果读者在入门后还需要进一步学习,可自行扩展阅读相关图书或资料,因为学习是永无止境的,正所谓“师傅领进门,修行在个人”。
内容简介
本书从解决工作实际问题出发,提炼并总结工作中R 语言常用的数据处理、数据分析实战方法与技巧。本书力求通俗易懂地介绍相关知识,在不影响学习和理解的前提下,尽可能地避免使用晦涩难懂的R 语言编程、统计术语或模型公式。如果读者需要了解相关的知识,可查阅相关的图书或资料。本书的定位是带领R 语言数据分析初学者入门,并解决在学习、工作中使用R 语言进行数据分析的大部分问题或需求。如果读者在入门后还需要进一步学习,可自行扩展阅读相关图书或资料,因为学习是永无止境的,正所谓“师傅领进门,修行在个人”。
目录
第1 章 数据分析概况 / 1
1.1 数据分析的定义(What) / 2
1.2 数据分析的作用(Why) / 4
1.3 数据分析的步骤(How) / 5
1.3.1 明确分析目的和思路 / 6
1.3.2 数据收集 / 7
1.3.3 数据处理 / 9
1.3.4 数据分析 / 9
1.3.5 数据展现 / 10
1.3.6 报告撰写 / 11
1.4 数据分析的三大误区 / 12
1.5 常用的数据分析工具 / 13
1.5.1 Excel / 13
1.5.2 SPSS / 15
1.5.3 Python / 16
1.5.4 R 语言 / 17
第2 章 R 语言概况 / 18
2.1 R 语言简介 / 19
2.2 R 语言的特点 / 19
2.3 R 语言包 / 20
2.3.1 函数 / 20
2.3.2 包 / 24
2.4 R 语言的使用场景 / 26
2.5 RStudio 简介 / 27
2.6 R 软件和RStudio 的下载与安装 / 27
2.6.1 下载R 软件 / 27
2.6.2 安装R 软件 / 29
2.6.3 下载RStudio / 34
2.6.4 安装RStudio / 35
2.7 RStudio 的使用 / 38
2.7.1 RStudio 界面简介 / 38
2.7.2 项目管理 / 39
2.7.3 新建R 代码文件 / 41
2.7.4 代码提示 / 43
2.7.5 变量浏览 / 43
2.7.6 图形绘制 / 45
2.7.7 帮助文档 / 45
第3 章 编程基础 / 47
3.1 数据类型 / 48
3.1.1 数值型 / 49
3.1.2 字符型 / 50
3.1.3 逻辑型 / 53
3.2 赋值和变量 / 54
3.2.1 赋值和变量 / 54
3.2.2 变量命名规则 / 55
3.3 数据结构 / 56
3.3.1 向量 / 57
3.3.2 因子 / 59
3.3.3 数据框 / 60
3.3.4 列表 / 67
3.3.5 四种数据结构的区别 / 68
3.4 向量化运算 / 68
3.5 for 循环 / 70
3.6 R 语言编程注意事项 / 73
第4 章 数据处理 / 76
4.1 数据导入与导出 / 77
4.1.1 数据导入 / 77
4.1.2 数据导出 / 86
4.2 数据清洗 / 88
4.2.1 数据排序 / 88
4.2.2 重复数据处理 / 89
4.2.3 缺失数据处理 / 93
4.2.4 空格数据处理 / 96
4.3 数据转换 / 98
4.3.1 数值转字符 / 98
4.3.2 字符转数值 / 101
4.3.3 字符转时间 / 101
4.4 数据抽取 / 105
4.4.1 字段拆分 / 105
4.4.2 记录抽取 / 110
4.4.3 随机抽样 / 117
4.5 数据合并 / 120
4.5.1 记录合并 / 120
4.5.2 字段合并 / 123
4.5.3 字段匹配 / 125
4.6 数据计算 / 131
4.6.1 简单计算 / 131
4.6.2 时间计算 / 132
4.6.3 数据标准化 / 134
4.6.4 数据分组 / 138
第5 章 数据分析 / 142
5.1 对比分析 / 143
5.2 基本统计分析 / 147
5.3 分组分析 / 149
5.4 结构分析 / 151
5.5 分布分析 / 152
5.6 交叉分析 / 155
5.7 RFM 分析 / 157
5.8 矩阵分析 / 166
5.9 相关分析 / 169
5.10 回归分析 / 172
5.10.1 回归分析简介 / 172
5.10.2 简单线性回归分析 / 174
5.10.3 多重线性回归分析 / 178
第6 章 数据可视化 / 183
6.1 数据可视化简介 / 184
6.1.1 什么是数据可视化 / 184
6.1.2 数据可视化常用图表 / 184
6.1.3 通过关系选择图表 / 185
6.2 散点图 / 187
6.3 矩阵图 / 195
6.4 折线图 / 199
6.5 饼图 / 204
6.6 柱形图 / 205
6.7 条形图 / 209
作者简介
方小敏,“数据分析实战”公众号主理人,资深机器学习工程师;曾服务于BAT等知名互联网企业,熟练掌握Python、R、Spark、Hive、TensorFlow等工具进行机器学习。齐德胜,“玩转Python数据”公众号主理人,资深商业智能工程师,略懂Python、R、SQL等。张文霖,新浪博客“小蚊子数据分析”博主,资深数据分析师,曾服务于国内知名市场研究公司、中国移动等公司,具有多年移动互联网数据分析经验,略懂Excel、PPT、SPSS、水晶易表等工具。
-
全图解零基础word excel ppt 应用教程
¥16.3¥48.0 -
C Primer Plus 第6版 中文版
¥62.6¥108.0 -
零信任网络:在不可信网络中构建安全系统
¥34.2¥59.0 -
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
硅谷之火-人与计算机的未来
¥20.3¥39.8 -
情感计算
¥66.8¥89.0 -
大模型RAG实战 RAG原理、应用与系统构建
¥74.3¥99.0 -
大学计算机基础实验教程(MS Office版)——面向数据分析能力培养
¥29.1¥39.8 -
LINUX企业运维实战(REDIS+ZABBIX+NGINX+PROMETHEUS+GRAFANA+LNMP)
¥51.8¥69.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥70.0¥89.8 -
LINUX实战——从入门到精通
¥52.4¥69.0 -
剪映AI
¥52.8¥88.0 -
快速部署大模型:LLM策略与实践(基于ChatGPT等大语言模型)
¥56.9¥79.0 -
数据驱动的工业人工智能:建模方法与应用
¥68.3¥99.0 -
数据存储架构与技术(第2版)
¥62.9¥89.8 -
纹样之美:中国传统经典纹样速查手册
¥76.3¥109.0 -
UG NX 12.0数控编程
¥24.8¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
UN NX 12.0多轴数控编程案例教程
¥24.3¥38.0 -
实战知识图谱
¥51.8¥69.0