R语言实战 数据整理、可视化、建模与挖掘
- ISBN:9787111757214
- 装帧:平装-胶订
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:384
- 出版时间:2024-07-01
- 条形码:9787111757214 ; 978-7-111-75721-4
本书特色
R语言是源代码开放、功能强大的数据分析软件,它在数据清洗与探索、数据分析与建模、数据可视化、机器学习、深度学习等方面具有优秀的表现,广泛应用于数学、统计学、数据科学、计算机科学、人工智能、云计算、生物医学、工业统计等方向,发展前景十分广阔。本书结合作者多年的科研与教学经验,将数据科学基础理论与其应用相结合,内容编排由点到面、由易到难,并通过实际操作演示讲授理论知识,帮助读者快速掌握利用R语言进行数据分析和数据挖掘的技能。
内容简介
本书是一本数据科学的入门与提升教程,全书共5篇,按照由浅入深、循序渐进的方式介绍R语言的基本语法与实际应用,并结合现实数据进行实战操作。内容涵盖R语言的安装与运行、数据对象的创建与编程、R语言初级与高级绘图、数据的管理与清洗、统计分析与数据降维、无监督与有监督学习、利用R Markdown创建动态报告和制作幻灯片等。本书为读者提供了相关案例的源码(获取方式见封底)。
本书适合对数据可视化、统计建模、数据分析、数据挖掘感兴趣的研究人员和工程技术人员阅读,也可作为高等院校数学、统计学、数据科学、计算机科学、人工智能、云计算、大数据分析、生物医学、工业统计等方向本科生或研究生的参考教程。
目录
**篇 R语言入门
第1章 R语言简介/
1.1R语言的下载与运行/
1.2RStudio安装与设置/
1.3R语言包/
1.4数据类型与运算符/
1.5运行R语言代码/
1.6本章小结/
第2章 R语言数据对象/
2.1向量/
2.1.1数值型/
2.1.2逻辑型/
2.1.3缺失值/
2.1.4字符型/
2.1.5因子型/
2.1.6类型转换/
2.2矩阵与高维数组/
2.2.1矩阵/
2.2.2高维数组/
2.3数据框/
2.3.1生成数据框/
2.3.2数据框操作/
2.4列表/
2.4.1生成列表/
2.4.2列表操作/
2.5时间数据/
2.5.1基础包处理时间数据/
2.5.2lubridate包处理时间数据/
2.6本章小结/
第3章 程序编写与函数/
3.1条件判断语句/
3.1.1if语句/
3.1.2ifelse语句/
3.2循环语句/
3.2.1for循环/
3.2.2while循环/
3.2.3repeat循环/
3.3内置函数/
3.3.1常用的数学函数/
3.3.2常用的字符串处理函数/
3.3.3常用的统计函数/
3.4自定义函数/
3.4.1函数语法/
3.4.2函数编写/
3.4.3函数调试/
3.5本章小结/
第二篇 R语言数据整理实战
第4章 数据读写与管理/
4.1数据导入与保存/
4.2从文件中导入数据/
4.2.1导入带有分隔符的数据/
4.2.2导入Excel表格数据/
4.2.3导入SPSS数据/
4.2.4导入SAS数据/
4.2.5导入MATLAB数据/
4.2.6导入Stata数据/
4.2.7使用RStudio菜单导入数据/
4.3网络爬虫爬取数据/
4.3.1从网页中获取链接和表格/
4.3.2从网页中获取文本/
4.3.3从网页中获取图片/
4.4图像数据管理/
4.4.1读取图像/
4.4.2图像操作/
4.5数据并行计算/
4.5.1apply()函数的使用/
4.5.2lapply()函数的使用/
4.5.3sapply()和vapply()函数的使用/
4.5.4tapply()和mapply()函数的使用/
4.6本章小结/
第5章 数据清洗与操作/
5.1处理缺失值/
5.1.1发现缺失值/
5.1.2缺失值分布可视化/
5.1.3缺失值填补/
5.2dplyr数据操作/
5.2.1管道操作/
5.2.2数据选择/
5.2.3数据过滤/
5.2.4数据修改/
5.2.5数据排序/
5.2.6数据分组/
5.2.7数据融合/
5.3长宽数据转换/
5.3.1tidyr包长宽数据转换/
5.3.2reshape2包长宽数据转换/
5.4文本处理/
5.4.1正则表达式/
5.4.2stringr包文本操作/
5.4.3中文文本预处理/
5.5本章小结/目录
第三篇 R语言数据可视化实战
第6章 R语言基础绘图/
6.1图形的基础设置/
6.1.1图形的形状和线条/
6.1.2图形的坐标系/
6.1.3图形的颜色/
6.1.4图形的文本/
6.2基础图形可视化/
6.2.1散点图与线图/
6.2.2直方图与条形图/
6.2.3箱线图与平滑散点图/
6.2.4三维图形/
6.3子图可视化/
6.3.1图形窗口设计/
6.3.2绘制子图/
6.4本章小结/
第7章 ggplot2数据可视化/
7.1ggplot2简介/
7.1.1图形语法/
7.1.2qplot快速绘图/
7.2使用图层构建图形/
7.2.1几何对象/
7.2.2theme函数/
7.2.3统计变换/
7.2.4位置调整/
7.2.5形状和大小/
7.3ggplot2可视化进阶/
7.3.1主题/
7.3.2颜色/
7.3.3分面/
7.3.4坐标系/
7.3.5可视化地图/
7.4ggplot2数据可视化案例/
7.5本章小结/
第8章 R语言高级绘图/
8.1plotly可交互图形可视化/
8.1.1可交互统计图/
8.1.2可交互图形添加控件/
8.1.3制作可交互动画/
8.2ggplot2拓展包可视化/
8.2.1cowplot包可视化/
8.2.2ggfortify包可视化/
8.2.3ComplexUpset包可视化/
8.3特殊图形可视化/
8.3.1圆环条形图/
8.3.2弧形图/
8.4本章小结/
第四篇 R语言数据建模实战
第9章 基础统计分析/
9.1概率分布与抽样/
9.1.1随机数生成/
9.1.2概率分布/
9.1.3数据抽样/
9.2数据描述性统计/
9.2.1数据的变量类型/
9.2.2数据描述汇总/
9.2.3频数和列联表/
9.3数据相关性分析/
9.3.1Pearson相关性系数/
9.3.2Spearman秩相关性系数/
9.3.3Kendall相关性系数/
9.4假设检验/
9.4.1数据分布检验/
9.4.2t检验/
9.5方差分析/
9.5.1单因素方差分析/
9.5.2双因素方差分析/
9.5.3多变量方差分析/
9.6本章小结/
第10章 回归分析/
10.1一元线性回归/
10.1.1一元线性回归模型/
10.1.2一元线性回归实例/
10.2一元非线性回归/
10.2.1多项式回归/
10.2.2非线性*小二乘回归/
10.2.3样条模型/
10.3多元线性回归/
10.3.1回归模型的建立/
10.3.2回归诊断/
10.3.3异常值分析/
10.3.4改进回归模型/
10.4逐步回归/
10.4.1直接逐步回归/
10.4.2剔除异常值逐步回归/
10.5逻辑回归/
10.5.1用逻辑回归进行数据分类/
10.5.2逐步逻辑回归分析/
10.6本章小结/
第11章 特征提取与降维/
11.1主成分分析/
11.1.1判断主成分的个数/
11.1.2提取主成分得分/
11.1.3主成分得分系数/
11.1.4核主成分分析/
11.2因子分析/
11.2.1确定因子个数/
11.2.2提取公共因子/
11.3多维尺度分析/
11.3.1MDS数据降维/
11.3.2计算样本的空间位置/
11.4tSNE降维/
11.4.1tSNE数据降维案例/
11.4.2调整tSNE算法的困惑度/
11.5本章小结/
第五篇 R语言数据挖掘实战
第12章 无监督学习/
12.1聚类分析/
12.1.1选择合适的聚类数目/
12.1.2K均值与K中值聚类/
12.1.3层次聚类/
12.1.4密度聚类/
12.1.5模糊聚类/
12.2离群点检测/
12.2.1LOF离群点检测/
12.2.
作者简介
薛震,博士、副教授、硕士生导师、香港城市大学访问学者、山西省数学学会理事、山西省数学类专业教学指导委员会秘书长、中北大学教学名师。从事统计分析、机器学习与数据可视化研究。主持参与国家自然科学基金、山西省自然科学基金、装备预研重点项目等10多项,发表论文30余篇,出版教材《R语言统计分析与机器学习》《R语言数据可视化实战》等,荣获全国“公益云图数据可视化创新大赛”优秀导师。
孙玉林,西安电子科技大学人工智能学院博士在读,长期从事大数据统计分析、机器学习与计算机视觉等方面的研究,发表多篇SCI一区期刊论文,曾获得多次数学建模、数据挖掘等赛事一等奖。出版著作《R语言统计分析与机器学习》《R语言数据可视化实战》《R语言数据分析:基础、算法与实战》《Pytorch深度学习入门与实战》《Python机器学习:基础、算法与实战》等。
-
全图解零基础word excel ppt 应用教程
¥16.3¥48.0 -
C Primer Plus 第6版 中文版
¥62.6¥108.0 -
零信任网络:在不可信网络中构建安全系统
¥34.2¥59.0 -
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
硅谷之火-人与计算机的未来
¥20.3¥39.8 -
情感计算
¥66.8¥89.0 -
大模型RAG实战 RAG原理、应用与系统构建
¥74.3¥99.0 -
大学计算机基础实验教程(MS Office版)——面向数据分析能力培养
¥29.1¥39.8 -
LINUX企业运维实战(REDIS+ZABBIX+NGINX+PROMETHEUS+GRAFANA+LNMP)
¥51.8¥69.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥70.0¥89.8 -
LINUX实战——从入门到精通
¥52.4¥69.0 -
剪映AI
¥52.8¥88.0 -
快速部署大模型:LLM策略与实践(基于ChatGPT等大语言模型)
¥56.9¥79.0 -
数据驱动的工业人工智能:建模方法与应用
¥68.3¥99.0 -
数据存储架构与技术(第2版)
¥62.9¥89.8 -
纹样之美:中国传统经典纹样速查手册
¥76.3¥109.0 -
UG NX 12.0数控编程
¥24.8¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
UN NX 12.0多轴数控编程案例教程
¥24.3¥38.0 -
实战知识图谱
¥51.8¥69.0