×
统计挖掘与机器学习:大数据预测建模和分析技术(原书第3版)

统计挖掘与机器学习:大数据预测建模和分析技术(原书第3版)

1星价 ¥108.8 (7.3折)
2星价¥108.8 定价¥149.0
暂无评论
图文详情
  • ISBN:9787111689942
  • 装帧:一般胶版纸
  • 册数:暂无
  • 重量:暂无
  • 开本:16开
  • 页数:548
  • 出版时间:2021-09-01
  • 条形码:9787111689942 ; 978-7-111-68994-2

本书特色

适读人群 :数据挖掘从业者以及对机器学习数据挖掘感兴趣的人本书创造性地汇编了数据挖掘技术,将统计数据挖掘和机器学习数据挖掘进行了区分,对经典和现代统计方法框架进行了扩展,以用于预测建模和大数据分析。本书为数据挖掘领域新晋的数据科学家所面临的共同问题提供了适当的解决方案,并侧重于数据科学家的需求,提供了实用且强大、简单而富有洞察力的量化技术,其中大部分使用了受新机器学习影响改进的“旧”统计方法。 在这本畅销书的新版里,作者大幅修改并重新组织章节内容,新增了一些富有创意且用途广泛的机器学习数据挖掘技术方面的内容。简单而有针对性的量化处理方法使得本书在数据挖掘图书领域别具一格。

内容简介

本书是一本区分统计数据挖掘和机器学习数据挖掘的图书。它创造性地汇编了数据挖掘技术,解决了对经典和现代统计方法框架的扩展,用于预测建模和大数据分析。SM-DM为数据挖掘领域新晋的数据科学家所面临的共同问题提供了适当的解决方案。它的展示侧重于数据科学家(通常被称为统计学家、数据采矿者和数据分析师)的需求,提供实用但又强大的、简单而又有洞察力的量化技术,其中大部分使用了新机器学习影响改进的“旧”统计方法。

目录

第3版前言
第2版前言
致谢
关于作者
第1章 引论 1
11 个人计算机与统计学 1
12 统计学和数据分析 2
13 EDA简介 3
14 EDA范式 4
15 EDA的弱点 5
16 小数据和大数据 5
161 数据规模特征 6
162 数据规模:个人观点 7
17 数据挖掘范式 7
18 统计学和机器学习 8
19 统计数据挖掘 9
参考资料 9
第2章 数据处理相关学科:统计学和数据科学 11
21 引言 11
22 背景 11
23 统计学与数据科学的比较 12
24 讨论:统计学与数据科学的不同之处 18
25 本章小结 19
26 结语 19
参考资料 19
第3章 变量评估的两种基本数据挖掘方法 21
31 引言 21
32 相关系数 21
33 散点图 22
34 数据挖掘 24
341 示例31 24
342 示例32 24
35 平滑散点图 25
36 一般关联性检验 27
37 本章小结 28
参考资料 29
第4章 用于评估成对变量的基于CHAID的数据挖掘方法 30
41 引言 30
42 散点图 30
43 平滑散点图 31
44 CHAID入门 32
45 用更平滑的散点图进行基于CHAID的数据挖掘 33
46 本章小结 36
参考资料 37
第5章 校直数据的简单性和可取性对建模十分重要 38
51 引言 38
52 数据的直度和对称度 38
53 数据挖掘是高级概念 39
54 相关系数 39
55 (xx3,yy3)散点图 40
56 挖掘(xx3,yy3)关系 41
57 基于遗传算法的数据挖掘如何处理数据 43
58 校直多个变量 43
59 本章小结 44
参考资料 44
第6章 排序数据对称化:提高数据预测能力的统计数据挖掘方法 45
61 引言 45
62 量度范围 45
63 茎叶图 47
64 箱线图 47
65 排序数据对称处理方法的图示 47
651 示例1 48
652 示例2 50
66 本章小结 56
参考资料 56
第7章 主成分分析:多变量评估的统计数据挖掘方法 57
71 引言 57
72 EDA重新表述范式 57
73 关键点 58
74 PCA基础 58
75 示例详解 58
76 PCA的代数特征 59
77 一个不常见示例 60
771 R_CD元素(X1,X2,X3,X4,X5,X6)主成分分析 61
772 R_CD元素(X1,X2,X3,X4,X5,X6)主成分分析结果 61
78 用PCA构造准交互变量 62
79 本章小结 66
第8章 市场份额估算:一个特殊的数据挖掘案例 67
81 引言 67
82 背景 67
83 一个特殊的数据挖掘案例 68
84 构建RAL的YUM市场份额模型 69
841 市场份额模型的十分位分析 76
842 YUM_3mos市场份额模型的结论 76
85 本章小结 77
附录8A  生成 PROMO_Code哑变量 77
附录8B PROMO_Code哑变量的PCA 77
附录8C PROMO_Code哑变量上的逻辑斯谛回归YUM_3mos 78
附录8D 生成YUM_3mos_wo_PROMO_CodeEff 78
附录 8E 将变量标准化为位于[0, 1]内 78
参考资料 79
第9章 相关系数在[-1,+1]内取值,是这样吗 80
91 引言 80
92 相关系数的基础知识 80
93 计算相关系数 81
94 重新配对 82
95 计算经调整的相关系数 84
96 重新配对的意义 84
97 本章小结 84
第10章 逻辑斯谛回归:回应建模方法 85
101 引言 85
102 逻辑斯谛回归模型 86
1021 示例 86
1022 为LRM打分 87
103 案例分析 88
104 logit值和logit散点图 89
105 校直数据的重要性 90
106 校直数据的重述 91
1061 幂阶梯法 91
1062 突起规则 91
1063 测量校直数据 92
107 校直示例数据 92
1071 FD2_OPEN的重述 93
1072 INVESTMENT的重述 94
108 在突起规则不适用的情况下选用的技术 95
1081 拟合logit值散点图 95
1082 平滑预测值与实际值散点图 96
109 MOS_OPEN的重述 96
1010 评估变量的重要性 99
10101 计算G统计量 99
10102 单变量的重要性 100
10103 变量子集合的重要性 100
10104 不同变量子集合的重要性比较 100
1011 案例的重要变量 101
1012 变量的相对重要性 102
1013 案例变量的*佳子集合 103
1014 模型预测准确性的可视化指标 104
10141 得分组的平滑残差散点图 104
10142 基于十分位组的平滑预测与实际值散点图 106
10
展开全部

作者简介

布鲁斯·拉特纳,博士,著名的统计学家,DM STAT-1咨询公司的总裁和创始人,该公司致力于统计建模和分析、数据挖掘、机器学习等领域。布鲁斯擅长标准统计技术,以及公认的创新型机器学习方法,例如取得了专利的GenIQ模型。布鲁斯致力于满足众多领域的客户要求,这些领域包括直销和数据库营销、银行、保险、金融、零售、通信、保健、医药、出版发行、电子商务、网络挖掘、B2B、风险管理,以及非营利性资金募集等。 布鲁斯具有卓越的专业知识,他是畅销书Statistical Modeling and Analysis for Database Marketing: Effective Techniques for Mining Big Data的作者。布鲁斯通过快速启动项目和及时交付项目结果为客户的营销问题提供*佳解决方案。布鲁斯为客户项目提供了*高水平的统计分析服务。他经常受邀在活动中发表演讲,比如SAS数据挖掘大会,以及《财富》杂志百强企业组织的闭门研讨会。 布鲁斯经常担任预测性分析领域的大会演讲人,并且担任了10多年的直销协会主办的高级统计学课程的讲师。他发表了超过百篇经过同行评议的统计学、机器学习程序和软件工具方面的论文,是受欢迎的教材The New Direct Marketing的合著者,并且担任Journal of Database Marketing and Customer Strategy的编委。 布鲁斯还积极投身于在线数据挖掘领域。他经常为数据挖掘领域顶级资源网站KDnuggets Publications供稿。他的有关统计和机器学习方法方面的文章有很高的跟帖量。布鲁斯还参与了网络社交平台LinkedIn和ResearchGate,他的有关大数据统计和机器学习程序的帖子引发了无数深入的讨论。他还是DM STAT-1 Newsletter的作者。 布鲁斯拥有数学和统计学博士学位,专注于研究多变量统计和回应模型模拟。他的研究兴趣包括开发混合建模技术,其中结合了传统统计学和机器学习方法。他拥有一项独特的专利,用于解决遗传编程中的两组分类问题。

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航