暂无评论
图文详情
- ISBN:9787519897406
- 装帧:平装
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:424
- 出版时间:2025-03-01
- 条形码:9787519897406 ; 978-7-5198-9740-6
内容简介
本书将帮助读者:学习如何理解因果推断的基本概念。将业务问题定义为因果推断问题。理解偏差如何干扰因果推断。学习因果效应如何能够因人而异。将相同客户不同时间的观测用于因果推断。在随机化不可行的时候利用地理和回溯实验。检验非遵从性偏差和效应稀释。
目录
目录
前言 .1
**部分 基础知识 . 11
第1 章 因果推断导论 .13
1.1 什么是因果推断 13
1.2 为什么要做因果推断 . 14
1.3 机器学习与因果推断 . 15
1.4 关联关系与因果关系 . 16
1.4.1 处理和结果 17
1.4.2 因果推断的基本问题 18
1.4.3 因果模型. 19
1.4.4 干预 21
1.4.5 个体处理效应 23
1.4.6 潜在结果. 23
1.4.7 一致性假设与稳定单元处理值假设 24
1.4.8 关注的因果量 25
1.4.9 因果量示例 27
1.5 偏差 30
1.5.1 偏差方程. 31
1.5.2 偏差可视化 33
1.6 识别处理效应 35
1.6.1 独立性假设 37
1.6.2 基于随机化的识别 . 37
1.7 本章小结 41
第2 章 随机试验与统计学 43
2.1 随机化的强制独立性 . 43
2.2 A/B 测试示例 . 45
2.3 理想试验 49
2.4 *危险的方程 50
2.5 估计的标准误差 54
2.6 置信区间 55
2.7 假设检验 63
2.7.1 零假设 . 64
2.7.2 检验统计量 66
2.8 p 值 . 67
2.9 功效 69
2.10 样本量计算 71
2.11 本章小结 73
第3 章 图形化因果模型 74
3.1 关于因果关系的思考 . 74
3.1.1 因果关系的可视化 . 76
3.1.2 咨询顾问聘用示例 . 78
3.2 图形化因果模型的速成课 80
3.2.1 因果链 . 80
3.2.2 因果分叉. 82
3.2.3 因果失范或因果对撞 83
3.2.4 关联流备忘单 85
3.2.5 因果图查询 86
3.3 识别的再认识 89
3.4 CIA 与调整公式 91
3.5 正值假设 92
3.6 利用数据的因果识别示例 93
3.7 混淆偏差 95
3.7.1 替代混淆. 96
3.7.2 再论随机化 97
3.8 选择偏差 98
3.8.1 限定对撞因子 99
3.8.2 调整选择偏差 103
3.8.3 限定中介变量 106
3.9 本章小结 107
第二部分 偏差调整 111
第4 章 线性回归的不合理有效性 113
4.1 线性回归 113
4.1.1 为什么需要模型 114
4.1.2 A/B 测试中的回归 116
4.1.3 回归调整 118
4.2 回归理论 122
4.2.1 单变量线性回归 124
4.2.2 多变量线性回归 124
4.3 弗里希- 沃- 洛弗尔定理和正交化 125
4.3.1 去偏步骤 126
4.3.2 去噪步骤 129
4.3.3 回归估计的标准误差 . 129
4.3.4 *终结果模型 131
4.3.5 FWL 总结 132
4.4 作为结果模型的回归 134
4.5 正值性和外推 . 136
4.6 线性回归的非线性 137
4.6.1 处理的线性化 139
4.6.2 非线性FWL 和去偏 141
4.7 虚拟变量的回归 142
4.7.1 条件随机实验 143
4.7.2 虚拟变量 145
4.7.3 饱和回归模型 148
4.7.4 方差加权平均回归 150
4.7.5 去义和固定效应 152
4.8 遗漏变量偏差:回归视角下的混杂因子 155
4.9 中性控制 157
4.9.1 噪声诱导控制 158
4.9.2 特征选择:偏差与方差的权衡 . 160
4.10 本章小结 . 162
第5 章 倾向性评分 163
5.1 管理培训的影响 163
5.2 基于回归的调整 165
5.3 倾向性评分基础 167
5.3.1 倾向性得分估计 168
5.3.2 倾向性得分和正交化 . 169
5.3.3 倾向性得分匹配 169
5.3.4 逆倾向性加权法 171
5.3.5 IPW 的方差 174
5.3.6 倾向性权重的稳定化 . 178
5.3.7 伪群体 180
5.3.8 选择偏差 181
5.3.9 偏差- 方差权衡 182
5.3.10 正值性 183
5.4 基于设计的识别与基于模型的识别 186
5.5 双重稳健估计 . 186
5.5.1 处理容易建模的示例 . 189
5.5.2 结果容易建模的示例 . 192
5.6 面向连续处理的广义倾向性得分 . 194
5.7 本章小结 201
第三部分 效应异质性与个性化.203
第6 章 效应异质性 205
6.1 从ATE 到CATE 206
6.2 为什么预测结果不是答案 . 207
6.3 利用回归估计CATE 210
6.4 评估CATE 预测结果 214
6.5 按模型分位数划分的效应 . 215
6.6 累积效应 220
6.7 累计增益 221
6.8 目标转换 225
6.9 预测模型适用于效应排序 . 226
6.9.1 边际递减收益 227
6.9.2 二元结果 227
6.10 用于决策的CATE 229
6.11 本章小结 . 233
第7 章 元学习器 235
7.1 用于离散性处理的元学习器 236
7.1.1 T 学习器 237
7.1.2 X 学习器 241
7.2 用于连续性处理的元学习器 246
7.2.1 S 学习器 247
7.2.2 双重/ 去偏机器学习 252
7.3 本章小结 260
第四部分 面板数据 263
第8 章 双重差分法 265
8.1 面板数据 266
8.2 经典双重差分法 269
8.2.1 带有结果增长的双重差分法 271
8.2.2 带*小二乘法的双重差分法 273
8.2.3 带有固定效应的双重差分法 274
8.2.4 多时间段 275
8.2.5 推断分析 277
8.3 识别假设 280
8.3.1 平行趋势 280
8.3.2 无预期假设和稳定单元处理效应假设 283
8.3.3 严格外生性假设 283
8.3.4 无时间变化混杂因子 . 284
8.3.5 无反馈 286
8.3.6 无结转效应和无滞后因变量 286
8.3.7 效应时变性 . 287
8.3.8 带有协变量的双重差分法 289
8.4 双重稳健的双重差分法 . 293
8.4.1 倾向性评分模型 293
8.4.2 结果增量模型 293
8.4.3 整合所有要素 294
8.5 交错采用 296
8.5.1 时变的效应 . 302
8.5.2 协变量 306
8.6 本章小结 307
第9 章 合成控制 309
9.1 在线营销数据集 310
9.2 矩阵表示 313
9.3 作为水平回归的合成控制 . 315
9.4 标准合成控制 . 319
9.5 带有协变量的合成控制 . 322
9.6 去偏合成控制 . 327
9.7 推断分析 331
9.8 合成双重差分法 334
9.8.1 双重差分法回顾 334
9.8.2 合成控制回顾 335
9.8.3 估计时间权重 337
9.8.4 合成控制与双重差分法 340
9.9 本章小结 342
第五部分 替代实验设计 345
第10 章 地理与回溯实验 347
10.1 地理实验 . 348
10.2 合成控制设计 349
10.2.1 处理单元的随机集合 352
10.2.2 随机搜索 355
10.3 回溯实验 . 358
10.3.1 序列的潜在结果 360
10.3.2 估计延滞效应的阶 361
10.3.3 基于设计的估计 363
10.3.4 *优回溯设计 . 368
10.3.5 稳健方差 371
10.4 本章小结 . 374
第11 章 非遵从性和工具变量 376
11.1 非遵从性 . 376
11.2 扩展潜在结果 379
11.3 工具变量识别假设 . 381
11.4 **阶段 . 384
11.5 简化形式 . 385
11.6 两阶段*小二乘法 . 386
11.7 标准误差 . 387
11.8 额外的控制变量和工具变量 . 389
11.8.1 手工实现两阶段*小二乘法 391
11.8.2 矩阵实现 392
11.9 断点设计 . 394
11.9.1 断点设计假设 . 395
11.9.2 意向处理效应 . 397
11.9.3 工具变量估计 . 398
11.9.4 簇聚 . 399
11.10 本章小结 400
第12 章 展望 . 403
12.1 因果发现 . 404
12.2 连续决策 . 404
12.3 因果强化学习 405
12.4 因果预测 . 406
12.5 域自适应 . 406
12.6 结束语 . 407
前言 .1
**部分 基础知识 . 11
第1 章 因果推断导论 .13
1.1 什么是因果推断 13
1.2 为什么要做因果推断 . 14
1.3 机器学习与因果推断 . 15
1.4 关联关系与因果关系 . 16
1.4.1 处理和结果 17
1.4.2 因果推断的基本问题 18
1.4.3 因果模型. 19
1.4.4 干预 21
1.4.5 个体处理效应 23
1.4.6 潜在结果. 23
1.4.7 一致性假设与稳定单元处理值假设 24
1.4.8 关注的因果量 25
1.4.9 因果量示例 27
1.5 偏差 30
1.5.1 偏差方程. 31
1.5.2 偏差可视化 33
1.6 识别处理效应 35
1.6.1 独立性假设 37
1.6.2 基于随机化的识别 . 37
1.7 本章小结 41
第2 章 随机试验与统计学 43
2.1 随机化的强制独立性 . 43
2.2 A/B 测试示例 . 45
2.3 理想试验 49
2.4 *危险的方程 50
2.5 估计的标准误差 54
2.6 置信区间 55
2.7 假设检验 63
2.7.1 零假设 . 64
2.7.2 检验统计量 66
2.8 p 值 . 67
2.9 功效 69
2.10 样本量计算 71
2.11 本章小结 73
第3 章 图形化因果模型 74
3.1 关于因果关系的思考 . 74
3.1.1 因果关系的可视化 . 76
3.1.2 咨询顾问聘用示例 . 78
3.2 图形化因果模型的速成课 80
3.2.1 因果链 . 80
3.2.2 因果分叉. 82
3.2.3 因果失范或因果对撞 83
3.2.4 关联流备忘单 85
3.2.5 因果图查询 86
3.3 识别的再认识 89
3.4 CIA 与调整公式 91
3.5 正值假设 92
3.6 利用数据的因果识别示例 93
3.7 混淆偏差 95
3.7.1 替代混淆. 96
3.7.2 再论随机化 97
3.8 选择偏差 98
3.8.1 限定对撞因子 99
3.8.2 调整选择偏差 103
3.8.3 限定中介变量 106
3.9 本章小结 107
第二部分 偏差调整 111
第4 章 线性回归的不合理有效性 113
4.1 线性回归 113
4.1.1 为什么需要模型 114
4.1.2 A/B 测试中的回归 116
4.1.3 回归调整 118
4.2 回归理论 122
4.2.1 单变量线性回归 124
4.2.2 多变量线性回归 124
4.3 弗里希- 沃- 洛弗尔定理和正交化 125
4.3.1 去偏步骤 126
4.3.2 去噪步骤 129
4.3.3 回归估计的标准误差 . 129
4.3.4 *终结果模型 131
4.3.5 FWL 总结 132
4.4 作为结果模型的回归 134
4.5 正值性和外推 . 136
4.6 线性回归的非线性 137
4.6.1 处理的线性化 139
4.6.2 非线性FWL 和去偏 141
4.7 虚拟变量的回归 142
4.7.1 条件随机实验 143
4.7.2 虚拟变量 145
4.7.3 饱和回归模型 148
4.7.4 方差加权平均回归 150
4.7.5 去义和固定效应 152
4.8 遗漏变量偏差:回归视角下的混杂因子 155
4.9 中性控制 157
4.9.1 噪声诱导控制 158
4.9.2 特征选择:偏差与方差的权衡 . 160
4.10 本章小结 . 162
第5 章 倾向性评分 163
5.1 管理培训的影响 163
5.2 基于回归的调整 165
5.3 倾向性评分基础 167
5.3.1 倾向性得分估计 168
5.3.2 倾向性得分和正交化 . 169
5.3.3 倾向性得分匹配 169
5.3.4 逆倾向性加权法 171
5.3.5 IPW 的方差 174
5.3.6 倾向性权重的稳定化 . 178
5.3.7 伪群体 180
5.3.8 选择偏差 181
5.3.9 偏差- 方差权衡 182
5.3.10 正值性 183
5.4 基于设计的识别与基于模型的识别 186
5.5 双重稳健估计 . 186
5.5.1 处理容易建模的示例 . 189
5.5.2 结果容易建模的示例 . 192
5.6 面向连续处理的广义倾向性得分 . 194
5.7 本章小结 201
第三部分 效应异质性与个性化.203
第6 章 效应异质性 205
6.1 从ATE 到CATE 206
6.2 为什么预测结果不是答案 . 207
6.3 利用回归估计CATE 210
6.4 评估CATE 预测结果 214
6.5 按模型分位数划分的效应 . 215
6.6 累积效应 220
6.7 累计增益 221
6.8 目标转换 225
6.9 预测模型适用于效应排序 . 226
6.9.1 边际递减收益 227
6.9.2 二元结果 227
6.10 用于决策的CATE 229
6.11 本章小结 . 233
第7 章 元学习器 235
7.1 用于离散性处理的元学习器 236
7.1.1 T 学习器 237
7.1.2 X 学习器 241
7.2 用于连续性处理的元学习器 246
7.2.1 S 学习器 247
7.2.2 双重/ 去偏机器学习 252
7.3 本章小结 260
第四部分 面板数据 263
第8 章 双重差分法 265
8.1 面板数据 266
8.2 经典双重差分法 269
8.2.1 带有结果增长的双重差分法 271
8.2.2 带*小二乘法的双重差分法 273
8.2.3 带有固定效应的双重差分法 274
8.2.4 多时间段 275
8.2.5 推断分析 277
8.3 识别假设 280
8.3.1 平行趋势 280
8.3.2 无预期假设和稳定单元处理效应假设 283
8.3.3 严格外生性假设 283
8.3.4 无时间变化混杂因子 . 284
8.3.5 无反馈 286
8.3.6 无结转效应和无滞后因变量 286
8.3.7 效应时变性 . 287
8.3.8 带有协变量的双重差分法 289
8.4 双重稳健的双重差分法 . 293
8.4.1 倾向性评分模型 293
8.4.2 结果增量模型 293
8.4.3 整合所有要素 294
8.5 交错采用 296
8.5.1 时变的效应 . 302
8.5.2 协变量 306
8.6 本章小结 307
第9 章 合成控制 309
9.1 在线营销数据集 310
9.2 矩阵表示 313
9.3 作为水平回归的合成控制 . 315
9.4 标准合成控制 . 319
9.5 带有协变量的合成控制 . 322
9.6 去偏合成控制 . 327
9.7 推断分析 331
9.8 合成双重差分法 334
9.8.1 双重差分法回顾 334
9.8.2 合成控制回顾 335
9.8.3 估计时间权重 337
9.8.4 合成控制与双重差分法 340
9.9 本章小结 342
第五部分 替代实验设计 345
第10 章 地理与回溯实验 347
10.1 地理实验 . 348
10.2 合成控制设计 349
10.2.1 处理单元的随机集合 352
10.2.2 随机搜索 355
10.3 回溯实验 . 358
10.3.1 序列的潜在结果 360
10.3.2 估计延滞效应的阶 361
10.3.3 基于设计的估计 363
10.3.4 *优回溯设计 . 368
10.3.5 稳健方差 371
10.4 本章小结 . 374
第11 章 非遵从性和工具变量 376
11.1 非遵从性 . 376
11.2 扩展潜在结果 379
11.3 工具变量识别假设 . 381
11.4 **阶段 . 384
11.5 简化形式 . 385
11.6 两阶段*小二乘法 . 386
11.7 标准误差 . 387
11.8 额外的控制变量和工具变量 . 389
11.8.1 手工实现两阶段*小二乘法 391
11.8.2 矩阵实现 392
11.9 断点设计 . 394
11.9.1 断点设计假设 . 395
11.9.2 意向处理效应 . 397
11.9.3 工具变量估计 . 398
11.9.4 簇聚 . 399
11.10 本章小结 400
第12 章 展望 . 403
12.1 因果发现 . 404
12.2 连续决策 . 404
12.3 因果强化学习 405
12.4 因果预测 . 406
12.5 域自适应 . 406
12.6 结束语 . 407
展开全部
作者简介
Matheus Facure是Nubank的经济学家和高级数据科学家。他在很多商务场景成功应用了因果推断技术,从自动实时信用卡决策到交叉邮件与营销预算优化。
本类五星书
本类畅销
-
莫言的奇奇怪怪故事集
¥19.0¥59.9 -
2025读书月阅读盲盒——我独钟意命运角落的人
¥42.3¥168.0 -
悉达多
¥13.0¥28.0 -
2025读书月阅读盲盒——经常作案的朋友都知道
¥42.3¥168.0 -
中国近代史
¥13.7¥39.8 -
死魂灵
¥14.0¥48.0 -
2025读书月阅读盲盒——你以为你以为的就是你以为的吗?
¥42.3¥168.0 -
面纱
¥17.9¥49.8 -
本森小姐的甲虫
¥15.9¥55.0 -
她们
¥16.0¥46.8 -
一个陌生女人的来信
¥13.7¥39.8 -
1984-插图珍藏版
¥9.9¥29.8 -
鼠疫
¥12.6¥38.8 -
诺贝尔文学奖大系-窄门
¥10.9¥31.0 -
事已至此先吃饭吧
¥15.9¥55.0 -
罗生门
¥10.0¥36.0 -
失去一切的人
¥16.6¥52.0 -
中国小说史略
¥11.5¥35.0 -
鸟与兽的通俗生活
¥12.9¥39.8 -
重生
¥12.9¥39.8