
包邮21世纪统计学系列教材R语言数据挖掘(第2版)/薛薇/21世纪统计学系列教材

- ISBN:9787300258256
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:其他
- 页数:420
- 出版时间:2017-05-01
- 条形码:9787300258256 ; 978-7-300-25825-6
本书特色
数据挖掘,继承和发展经典统计分析的理论成果,结合现代机器学习方法,借助大规模高性能计算不断逼近大数据规律真相,突破了传统数据分析方法的大数据应用局限;R语言,以其开源性、易用性、全面性、前沿性和可扩充性,是实现大数据分析实践的有效工具。《R语言数据挖掘》努力坚持:讲明白理论原理,讲明白案例问题,讲明白实现步骤,讲明白结果含义的写作风格,围绕大数据分析的四大核心问题:建立数据预测模型,揭示数据内在结构,探究数据关联性,诊断异常数据,以应用案例为线索,深入浅出地讨论了众多经典数据挖掘方法原理,完整详细地讲解了R语言实现过程。本书可作为高等院校统计学、数据科学和大数据技术、大数据管理等相关专业本科生和研究生数据挖掘、机器学习和其他数据分析课程的教材,也可作为科研机构、政府和企业经营管理部门等研究人员参考用书。
内容简介
数据挖掘,继承和发展经典统计分析的理论成果,结合现代机器学习方法,借助大规模高性能计算不断逼近大数据规律真相,突破了传统数据分析方法的大数据应用局限;R语言,以其开源性、易用性、全面性、前沿性和可扩充性,是实现大数据分析实践的有效工具。《R语言数据挖掘》努力坚持:讲明白理论原理,讲明白案例问题,讲明白实现步骤,讲明白结果含义的写作风格,围绕大数据分析的四大核心问题:建立数据预测模型,揭示数据内在结构,探究数据关联性,诊断异常数据,以应用案例为线索,深入浅出地讨论了众多经典数据挖掘方法原理,完整详细地讲解了R语言实现过程。本书可作为高等院校统计学、数据科学和大数据技术、大数据管理等相关专业本科生和研究生数据挖掘、机器学习和其他数据分析课程的教材,也可作为科研机构、政府和企业经营管理部门等研究人员参考用书。
目录
1.1什么是数据挖掘
1.2数据挖掘的结果
1.3数据挖掘能做什么
1.4数据挖掘方法的特点
1.5数据挖掘的典型应用
1.6R语言入门**
1.7RStudio简介
1.8本章函数列表
第2章R的数据组织和整理
2.1R的数据对象
2.2向量的创建和访问
2.3矩阵的创建和访问
2.4数据框的创建和访问
2.5数组和列表的创建和访问
2.6数据对象的相互转换
2.7导入外部数据和保存数据
2.8R语言程序设计基础
2.9R语言数据整理和程序设计综合应用
2.10本章函数列表
第3章R的数据可视化
3.1绘图基础
3.2单变量分布特征的可视化
3.3多变量联合分布特征的可视化
3.4变量间相关性的可视化
3.5GIS数据的可视化
3.6文本词频数据的可视化
3.7本章函数列表
第4章R的近邻分析:数据预测
4.1近邻分析:K近邻法
4.2基于变量重要性的加权K近邻法
4.3基于观测相似性的加权K近邻法
4.4本章函数列表
第5章R的决策树:数据预测
5.1决策树算法概述
5.2分类回归树的生长过程
5.3分类回归树的剪枝
5.4分类回归树的R函数和应用示例
5.5建立分类回归树的组合预测模型
5.6随机森林
5.7本章函数列表
第6章R的人工神经网络:数据预测
6.1人工神经网络概述
6.2BP反向传播网络
6.3BP反向传播网络的R函数和应用示例
6.4本章函数列表
第7章R的支持向量机:数据预测
7.1支持向量分类概述
7.2线性可分问题下的支持向量分类
7.3广义线性可分问题下的支持向量分类
7.4线性不可分问题下的支持向量分类
7.5多分类的支持向量分类
7.6支持向量回归
7.7R的支持向量机及应用示例
7.8本章函数列表
第8章R的一般聚类:揭示数据内在结构
8.1聚类分析概述
8.2基于质心的聚类模型:KMeans聚类
8.3基于质心的聚类模型:PAM聚类
8.4基于联通性的聚类模型:层次聚类
8.5基于统计分布的聚类模型:EM聚类
8.6本章函数列表
第9章R的特色聚类:揭示数据内在结构
9.1BIRCH聚类
9.2SOM网络聚类
9.3基于密度的聚类模型:DBSCAN聚类
9.4本章函数列表
第10章R的关联分析:揭示数据关联性
10.1简单关联规则及其测度
10.2Apriori算法及应用示例
10.3Eclat算法及应用示例
10.4简单关联分析的应用示例
10.5序列关联分析及SPADE算法
10.6本章函数列表
第11章R的模式甄别:诊断异常数据
11.1模式甄别方法和评价概述
11.2模式甄别的无监督侦测方法及应用示例
11.3模式甄别的有监督侦测方法及应用示例
11.4模式甄别的半监督侦测方法及应用示例
11.5本章函数列表
第12章R的网络分析初步
12.1网络的定义、表示及构建
12.2网络节点重要性的测度
12.3网络子群构成特征研究
12.4网络整体特征刻画
12.5主要网络类型及特点
12.6本章函数列表R语言数据挖掘
作者简介
薛薇,中国人民大学应用统计中心副主任,中国人民大学统计学院副教授。主要研究领域:数据挖掘、文本挖掘、复杂网络建模。关注统计和数据挖掘算法及软件应用,统计数据库系统研发等方面。涉足交通、金融、贸易等复杂网络动态建模,电商数据分析,网络新媒体舆论传播、热点事件主题跟踪和预测建模,政府和官方微博、学科学术热点跟踪等文本挖掘,以及社会网络分析和以数据挖掘为依托的客户关系管理等领域。
-
胶黏剂与粘接技术基础(第二版)
¥59.8¥98.0 -
概率论与数理统计
¥16.0¥35.0 -
习近平总书记教育重要论述讲义
¥24.2¥35.0 -
当代教育心理学(第3版)(本科教材)
¥37.6¥66.0 -
毛泽东思想和中国特色社会主义理论体系概论(2021年版)
¥8.5¥25.0 -
组织学与胚胎学实验指导
¥18.1¥28.0 -
断代(八品)
¥14.4¥42.0 -
系统解剖学
¥56.3¥85.0 -
行政管理学(第四版)
¥44.2¥52.0 -
当代中国政府与政治(新编21世纪公共管理系列教材)
¥31.2¥48.0 -
马克思主义基本原理2021年版
¥8.4¥23.0 -
中医诊断学--新世纪第五版
¥50.9¥58.0 -
线性代数(第六版)(经济应用数学基础)
¥26.2¥36.0 -
中医骨伤科学·全国中医药行业高等教育“十四五”规划教材
¥60.5¥85.0 -
财务管理学:立体化数字教材版
¥30.3¥48.0 -
计算机组成原理(微课版)
¥45.0¥69.8 -
UG NX 10.0模具设计教程
¥38.2¥59.0 -
新编大学生军事理论与训练教程
¥13.7¥39.8 -
发电厂电气部分(第5版)/苗世洪/十二五普通高等教育本科国家级规划教材
¥33.4¥59.0 -
博雅大学堂·历史中国古代简史(第2版)/张帆
¥46.6¥60.0