机械工业出版社数据分析与决策技术丛书实用预测分析
温馨提示:5折以下图书主要为出版社尾货,大部分为全新(有塑封/无塑封),个别图书品相8-9成新、切口有划线标记、光盘等附件不全详细品相说明>>
- ISBN:9787111603351
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:392
- 出版时间:2017-05-01
- 条形码:9787111603351 ; 978-7-111-60335-1
本书特色
本书详细讲述了预测分析的原理、技术及实现,并深入讨论了大数据。重点着眼于掌握提高开发、实行预测分析所需的6项关键实用技能。本书还提供了来自市场、医疗和零售等行业的真实案例,有助于读者针对产品实现自己的预测分析。
内容简介
本书详细讲述了预测分析的原理、技术及实现,并深入讨论了大数据。重点着眼于掌握提高开发、实行预测分析所需的6项关键实用技能。本书还提供了来自市场、医疗和零售等行业的真实案例,有助于读者针对产品实现自己的预测分析。
目录
译者序
关于作者
关于审校者
前言
第1章预测分析入门 1
1.1许多行业中都有预测分析 2
1.1.1市场营销中的预测分析 2
1.1.2医疗中的预测分析 2
1.1.3其他行业中的预测分析 3
1.2技能和角色在预测分析中都很重要 3
1.3预测分析软件 4
1.3.1开源软件 5
1.3.2闭源软件 5
1.3.3和平共处 5
1.4其他有用的工具 5
1.4.1超越基础知识 6
1.4.2数据分析/研究 6
1.4.3数据工程 6
1.4.4管理 7
1.4.5数据科学团队 7
1.4.6看待预测分析的两种不同方式 7
1.5R 8
1.5.1CRAN 8
1.5.2安装R语言 8
1.5.3其他安装R语言的方法 8
1.6预测分析项目是如何组织的 9
1.7图形用户界面 10
1.8RStudio入门 11
1.8.1重新布局以保持和示例一致 11
1.8.2部分重要面板的简要描述 12
1.8.3创建新项目 13
1.9R语言控制台 14
1.10源代码窗口 15
1.11**个预测模型 16
1.12第二个脚本 18
1.12.1代码描述 19
1.12.2predict函数 20
1.12.3检验预测误差 21
1.13 R语言包 22
1.13.1stargazer包 22
1.13.2安装stargazer包 23
1.13.3保存工作 24
1.14参考资料 24
1.15本章小结 24
第2章 建模过程 25
2.1结构化方法的优点 25
2.2分析过程方法 26
2.2.1CRISP-DM和SEMMA 27
2.2.2CRISP-DM和SEMMA的图表 27
2.2.3敏捷过程 28
2.2.4六西格玛和根本原因 28
2.2.5是否需要数据抽样 28
2.2.6使用所有数据 29
2.2.7比较样本与群体 29
2.3**步:理解业务 30
2.4第二步:理解数据 36
2.4.1衡量尺度 36
2.4.2单变量分析 38
2.5第三步:数据准备 43
2.6第四步:建模 44
2.6.1具体模型说明 45
2.6.2逻辑回归 46
2.6.3支持向量机 47
2.6.4决策树 47
2.6.5降维技术 51
2.6.6主成分 51
2.6.7聚类 52
2.6.8时间序列模型 52
2.6.9朴素贝叶斯分类器 53
2.6.10文本挖掘技术 54
2.7第五步:评估 57
2.7.1模型验证 58
2.7.2曲线下面积 59
2.7.3样本内和样本外测试、前进测试 60
2.7.4训练/测试/验证数据集 60
2.7.5时间序列验证 61
2.7.6*佳冠军模型的基准测试 61
2.7.7专家意见:人与机器 61
2.7.8元分析 61
2.7.9飞镖板方法 61
2.8第六步:部署 62
2.9参考资料 62
2.10本章小结 62
第3章 输入和探索数据 64
3.1数据输入 64
3.1.1文本文件输入 65
3.1.2数据库表格 66
3.1.3电子表格文件 67
3.1.4XML和JSON数据 67
3.1.5生成你自己的数据 68
3.1.6处理大型文件的技巧 68
3.1.7数据整理 68
3.2连接数据 69
3.2.1使用sqldf函数 69
3.2.2生成数据 70
3.2.3检查元数据 71
3.2.4使用内部连接和外部连接来合并数据 72
3.2.5识别有多个购买记录的成员 73
3.2.6清除冗余记录 74
3.3探索医院数据集 74
3.3.1str(df)函数的输出 74
3.3.2View函数的输出 75
3.3.3colnames函数 75
3.3.4summary函数 76
3.3.5在浏览器中打开文件 77
3.3.6绘制分布图 77
3.3.7变量的可视化绘图 78
3.4转置数据帧 80
3.5缺失值 84
3.5.1建立缺失值测试数据集 84
3.5.2缺失值的不同类型 85
3.5.3纠正缺失值 87
3.5.4使用替换过的值运行回归 90
3.6替换分类变量 91
3.7异常值 91
3.7.1异常值为什么重要 91
3.7.2探测异常值 92
3.8数据转换 96
3.8.1生成测试数据 97
3.8.2Box-Cox转换 97
3.9变量化简/变量重要性 98
3.9.1主成分分析法 98
3.9.2全子集回归 102
3.9.3变量重要性 104
3.10参考资料 106
3.11本章小结 106
第4章 回归算法导论 107
4.1监督学习模型和无监督学习模型 108
4.1.1监督学习模型 108
4.1.2无监督学习模型 108
4.2回归技术 109
4.3广义线性模型 110
4.4逻辑回归 110
4.4.1比率 111
4.4.2逻辑回归系数 111
4.4.3示例:在医疗中使用逻辑回归来预测疼痛阈值 112
4.4.4GLM模型拟合 114
4.4.5检验残差项 115
4.4.6添加变量的分布图 116
4.4.7p值及其效应量 117
4.4.8p值及其影响范围 118
4.4.9变量选择 119
4.4.10交互 121
4.4.11拟合优度统计量 123
4.4.12置信区间和Wald统计 124
4.4.13基本回归诊断图 124
4.4.14分布图类型描述 124
4.4.15拟合优度:Hosmer-Lemeshow检验 126
4.4.16正则化 127
4.4.17示例:ElasticNet 128
4.4.18选择一个正确的Lambda 128
4.4.19基于Lambda输出可能的系数 129
4.5本章小结 130
第5章决策树、聚类和SVM导论 131
5.1决策树算法 131
5.1.1决策树的优点 131
5.1.2决策树的缺点 132
5.1.3决策树的基本概念 132
5.1.4扩展树 132
5.1.5不纯度 133
5.1.6控制树的增长 134
5.1.7决策树算法的类型 134
5.1.8检查目标变量 135
5.1.9在rpart模型中使用公式符号 135
5.1.10图的解释 136
5.1.11输出决策树的文本版本 137
5.1.12修剪 138
5.1.13渲染决策树的其他选项 139
5.2聚类分析 140
5.2.1聚类分析应用于多种行业 140
5.2.2什么是聚类 140
5.2.3聚类的类型 141
5.2.4k均值聚类算
作者简介
作者简介
拉尔夫·温特斯(Ralph Winters)目前在一家医疗服务公司担任数据架构师。他已经给很多名列世界500强的大企业提供过自己在统计和分析方面的经验,包括金融、市场营销、保险、医疗和制药领域的企业。他的工作包括很多不同类型的预测分析项目,包括客户保留、反洗钱、客户之声文本挖掘分析,以及医疗风险和客户选择模型。
-
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
硅谷之火-人与计算机的未来
¥14.3¥39.8 -
全图解零基础word excel ppt 应用教程
¥12.0¥48.0 -
机器学习
¥59.4¥108.0 -
深度学习的数学
¥43.5¥69.0 -
智能硬件项目教程:基于ARDUINO(第2版)
¥37.7¥65.0 -
元启发式算法与背包问题研究
¥38.2¥49.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥62.9¥89.8 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
剪映AI
¥52.8¥88.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥77.4¥109.0 -
UG NX 12.0数控编程
¥24.8¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
界面交互设计理论研究
¥30.8¥56.0 -
UN NX 12.0多轴数控编程案例教程
¥25.8¥38.0 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0 -
Go 语言运维开发 : Kubernetes 项目实战
¥48.2¥79.0 -
明解C语言:实践篇
¥62.9¥89.8 -
Linux服务器架设实战(Linux典藏大系)
¥84.5¥119.0