21世纪统计学系列教材R语言数据挖掘(第2版)/薛薇/21世纪统计学系列教材
- ISBN:9787300258256
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:其他
- 页数:420
- 出版时间:2017-05-01
- 条形码:9787300258256 ; 978-7-300-25825-6
本书特色
数据挖掘,继承和发展经典统计分析的理论成果,结合现代机器学习方法,借助大规模高性能计算不断逼近大数据规律真相,突破了传统数据分析方法的大数据应用局限;R语言,以其开源性、易用性、全面性、前沿性和可扩充性,是实现大数据分析实践的有效工具。《R语言数据挖掘》努力坚持:讲明白理论原理,讲明白案例问题,讲明白实现步骤,讲明白结果含义的写作风格,围绕大数据分析的四大核心问题:建立数据预测模型,揭示数据内在结构,探究数据关联性,诊断异常数据,以应用案例为线索,深入浅出地讨论了众多经典数据挖掘方法原理,完整详细地讲解了R语言实现过程。本书可作为高等院校统计学、数据科学和大数据技术、大数据管理等相关专业本科生和研究生数据挖掘、机器学习和其他数据分析课程的教材,也可作为科研机构、政府和企业经营管理部门等研究人员参考用书。
内容简介
数据挖掘,继承和发展经典统计分析的理论成果,结合现代机器学习方法,借助大规模高性能计算不断逼近大数据规律真相,突破了传统数据分析方法的大数据应用局限;R语言,以其开源性、易用性、全面性、前沿性和可扩充性,是实现大数据分析实践的有效工具。《R语言数据挖掘》努力坚持:讲明白理论原理,讲明白案例问题,讲明白实现步骤,讲明白结果含义的写作风格,围绕大数据分析的四大核心问题:建立数据预测模型,揭示数据内在结构,探究数据关联性,诊断异常数据,以应用案例为线索,深入浅出地讨论了众多经典数据挖掘方法原理,完整详细地讲解了R语言实现过程。本书可作为高等院校统计学、数据科学和大数据技术、大数据管理等相关专业本科生和研究生数据挖掘、机器学习和其他数据分析课程的教材,也可作为科研机构、政府和企业经营管理部门等研究人员参考用书。
目录
1.1什么是数据挖掘
1.2数据挖掘的结果
1.3数据挖掘能做什么
1.4数据挖掘方法的特点
1.5数据挖掘的典型应用
1.6R语言入门**
1.7RStudio简介
1.8本章函数列表
第2章R的数据组织和整理
2.1R的数据对象
2.2向量的创建和访问
2.3矩阵的创建和访问
2.4数据框的创建和访问
2.5数组和列表的创建和访问
2.6数据对象的相互转换
2.7导入外部数据和保存数据
2.8R语言程序设计基础
2.9R语言数据整理和程序设计综合应用
2.10本章函数列表
第3章R的数据可视化
3.1绘图基础
3.2单变量分布特征的可视化
3.3多变量联合分布特征的可视化
3.4变量间相关性的可视化
3.5GIS数据的可视化
3.6文本词频数据的可视化
3.7本章函数列表
第4章R的近邻分析:数据预测
4.1近邻分析:K近邻法
4.2基于变量重要性的加权K近邻法
4.3基于观测相似性的加权K近邻法
4.4本章函数列表
第5章R的决策树:数据预测
5.1决策树算法概述
5.2分类回归树的生长过程
5.3分类回归树的剪枝
5.4分类回归树的R函数和应用示例
5.5建立分类回归树的组合预测模型
5.6随机森林
5.7本章函数列表
第6章R的人工神经网络:数据预测
6.1人工神经网络概述
6.2BP反向传播网络
6.3BP反向传播网络的R函数和应用示例
6.4本章函数列表
第7章R的支持向量机:数据预测
7.1支持向量分类概述
7.2线性可分问题下的支持向量分类
7.3广义线性可分问题下的支持向量分类
7.4线性不可分问题下的支持向量分类
7.5多分类的支持向量分类
7.6支持向量回归
7.7R的支持向量机及应用示例
7.8本章函数列表
第8章R的一般聚类:揭示数据内在结构
8.1聚类分析概述
8.2基于质心的聚类模型:KMeans聚类
8.3基于质心的聚类模型:PAM聚类
8.4基于联通性的聚类模型:层次聚类
8.5基于统计分布的聚类模型:EM聚类
8.6本章函数列表
第9章R的特色聚类:揭示数据内在结构
9.1BIRCH聚类
9.2SOM网络聚类
9.3基于密度的聚类模型:DBSCAN聚类
9.4本章函数列表
第10章R的关联分析:揭示数据关联性
10.1简单关联规则及其测度
10.2Apriori算法及应用示例
10.3Eclat算法及应用示例
10.4简单关联分析的应用示例
10.5序列关联分析及SPADE算法
10.6本章函数列表
第11章R的模式甄别:诊断异常数据
11.1模式甄别方法和评价概述
11.2模式甄别的无监督侦测方法及应用示例
11.3模式甄别的有监督侦测方法及应用示例
11.4模式甄别的半监督侦测方法及应用示例
11.5本章函数列表
第12章R的网络分析初步
12.1网络的定义、表示及构建
12.2网络节点重要性的测度
12.3网络子群构成特征研究
12.4网络整体特征刻画
12.5主要网络类型及特点
12.6本章函数列表R语言数据挖掘
作者简介
薛薇,中国人民大学应用统计中心副主任,中国人民大学统计学院副教授。主要研究领域:数据挖掘、文本挖掘、复杂网络建模。关注统计和数据挖掘算法及软件应用,统计数据库系统研发等方面。涉足交通、金融、贸易等复杂网络动态建模,电商数据分析,网络新媒体舆论传播、热点事件主题跟踪和预测建模,政府和官方微博、学科学术热点跟踪等文本挖掘,以及社会网络分析和以数据挖掘为依托的客户关系管理等领域。
-
当代中国政府与政治(新编21世纪公共管理系列教材)
¥33.6¥48.0 -
落洼物语
¥8.7¥28.0 -
中国当代文学名篇选读
¥19.1¥53.0 -
中医基础理论
¥50.7¥59.0 -
北大人文课(平装)
¥13.9¥45.0 -
外国教育史-第2版
¥24.4¥40.0 -
宪法-第二版
¥12.2¥29.0 -
当代中国政府与政治 第二版
¥57.8¥68.0 -
EPLAN电气设计
¥29.9¥39.8 -
闯进数学世界――探秘历史名题
¥21.3¥32.8 -
企业法务教程
¥34.8¥49.0 -
习近平新时代中国特色社会主义思想概论
¥18.2¥26.0 -
金融学
¥29.9¥49.0 -
计算机操作系统教程(第4版)(清华大学计算机系列教材)
¥31.9¥49.0 -
三国史
¥27.5¥50.0 -
飞机总体设计
¥46.8¥78.0 -
古代汉语(第四册)
¥16.1¥35.0 -
编辑审稿实务教程
¥35.1¥45.0 -
管理学:原理与方法(第7版)(博学.大学管理类)/周三多
¥30.9¥49.0 -
(平装)北大必修课:北大口才课
¥12.2¥45.0