- ISBN:9787111699484
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:248
- 出版时间:2022-02-01
- 条形码:9787111699484 ; 978-7-111-69948-4
本书特色
适读人群 :投资者发现新的金融理论:应用机器学习工具来发掘复杂现象中的隐藏变量;提出一个理论,通过结构性陈述将这些成分联系起来;用比回测更强大的工具对理论进行检验; 科学运用机器学习:应用于所有科学领域,用来评估一个理论的可信度;可以确定解释变量的相对信息含量,以达到解释和/或预测的目的;用来评估因果推理效果;对于大型、高维、复杂数据集的可视化至关重要;可用于扫描大数据, 寻找人类无法识别的模式。 利用机器学习进行投资策略的选择和优化 利用机器学习来建立更好的金融理论
内容简介
本书面向广大资产管理者和各类研究人员,基于机器学习和人工智能,指明从一个投资理念和理论到成功的投资策略具体实施的量化途径。作者认为一个缺乏理论依据的投资策略很可能是错误的。为此,资产管理者应致力于发展理论,而不仅是回测潜在的交易规则。本书就是从帮助资产管理者发现经济和金融理论的角度出发,介绍机器学习的工具。机器学习不是一个黑匣子,也不一定会过拟合。机器学习的工具与经典统计方法是互补关系而不是替代关系。本书认为机器学习的一些优点包括:注重样本外的可预测性,而不是样本内的方差判断;使用计算方法避免依赖一些(或许不切实际的)假设;能够“学习”复杂的规范,包括高维空间中的非线性、分层和非连续的交互效应;能够将变量搜索与设定搜索分离,并能很好地防止多重线性和其他替代效应。
目录
1 引 言
1.1 动机
1.2 理论很重要
1.3 如何科学地运用机器学习
1.4 过拟合的两种类型
1.5 提纲
1.6 受众
1.7 关于金融机器学习的五个常见误解
1.8 金融研究的未来
1.9 常见问题
1.10 结论
1.11 习题
2 降噪和降调
2.1 动机
2.2 Marcenko-Pastur定理
2.3 带信号的随机矩阵
2.4 拟合Marcenko-Pastur分布
2.5 降噪
2.6 降调
2.7 实验结果
2.8 结论
2.9 习题
3 距离度量
3.1 动机
3.2 基于相关性的度量
3.3 边际熵和联合熵
3.4 条件熵
3.5 Kullback-Leibler散度
3.6 交叉熵
3.7 互信息
3.8 差异信息
3.9 离散化
3.10 两个划分之间的距离
3.11 实验结果
3.12 结论
3.13 习题
4 *优聚类
4.1 动机
4.2 相似度矩阵
4.3 聚类的类型
4.4 类集的个数
4.5 实验结果
4.6 结论
4.7 习题
5 金融标注
5.1 动机
5.2 固定区间法
5.3 三重阻碍法
5.4 趋势扫描法
5.5 元标注
5.6 实验结果
5.7 结论
5.8 习题
6 特征重要性分析
6.1 动机
6.2 p值
6.3 变量重要性
6.4 概率加权准确度
6.5 替代效应
6.6 实验结果
6.7 结论
6.8 习题
7 组合构建
7.1 动机
7.2 凸组合优化
7.3 条件数
7.4 Markowitz的诅咒
7.5 信号作为协方差不稳定性的来源
7.6 嵌套聚类优化算法
7.7 实验结果
7.8 结论
7.9 习题
8 测试集过拟合
8.1 动机
8.2 查准率和召回率
8.3 重复测试下的查准率和召回率
8.4 夏普比率
8.5 错误策略定理
8.6 实验结果
8.7 收缩夏普比率
8.8 家族错误率
8.9 结论
8.10 习题
附录A 合成数据测试
附录B 错误策略定理的证明
参考书目
参考文献
节选
想象一下,您有位朋友自称有一种技术,可以预测下一次彩票中奖的号码。他的技术并不准确,所以他必须多买几张彩票。当然,如果他把所有的彩票都买了,那么他能中奖也就不足为奇了。您会让他买多少张彩戛才能判断他的方法是否有用呢?要评估他的技术准确度,您应该考虑他买了多张彩票的事实。同样地,研究者在同一数据集上进行多个统计测试更有可能得到错误的发现。而当研究者在同一数据集上不断重复同一个测试,则保证他*终会得到一个错误的发现。这种选择偏差来自于让模型在测试集上表现良好,而不是训练集。 另一个测试集过拟合的例子是研究人员对一个策略进行回测,并对其进行调整,直到输出达到目标性能为止。这种回测一调整一再回测一再调整的循环是徒劳无功的,*终必然会以过拟合(假阳一HE)而告终。相反,研究者应该花时间去探究误导他做出回测错误策略的研究过程。换句话说,一个表现不佳的回测是一次修正研究过程的机会,而不是一次修正特定投资策略的机会。 由于测试集过拟合,大多数已发表的金融学发现可能都是错误的。机器学习并没有造成当前金融研究的危机fH。rvey等,2016)。这场危机是由于金融领域对经典统计方法的普遍滥用(特别是p值操纵,p-hacking)造成的。机器学习可以从三个方面来帮助处理测试集过拟合问题:**,我们可以跟踪一个研究者进行了多少次独立测试,以评估至少有一个结果是错误发现的概率(称为家族错误率,或family wiseei Torrate,FWER)。收缩夏普比率(Bailey和LpezdePrado,2014)在回测中使用了类似的方法,第8章中会详细解释。它相当于控制了您那位朋友买彩票的数量。第二,虽然一个模型很可能在一个测试集上过拟合,但在数千个测试集上全都过拟合是很难的。可以通过把训练集和测试集拆分、组合并重复采样来生成这数以千计的测试集。这种方法就是组合净化交叉验证方法,即CPCV(AFML,第12章)。第三.我们可以使用历史序列来评估底层数据生成过程,并抽样合成数据集,这些数据集应与历史序列上的统计特性相匹配。蒙特卡洛方法在这方面的能力非常强,可以产生与历史序列的统计属性相匹配的合成数据集。这些测试得出的结论.是建立在估计的数据生成过程的代表性的基础上的(AFML,第13章)。这种方法的主要优点是,这些结论与数据生成过程的某个特定的(观察到的)实现无关,而是与整个随机实现的分布有关。根据之前的例子,相当于复制彩票游戏并重复多次,这样我们就可以排除运气因素。 P14-15
作者简介
马科斯·M.洛佩斯·德普拉多 美国劳伦斯·伯克利国家实验室研究员、康奈尔大学电气与计算机工程学院教授,拥有金融经济学和数学金融学博士学位。正确积极技术公司(TP T)首席信息官,阿布扎比投资局(ADIA)量化研究与开发业务的全球负责人。20多年来致力于利用机器学习算法和超级计算机的开发来制定投资策略的研究工作。撰写了数十篇颇具影响力的机器学习和算法研究的论文,著有《金融机器学习》等书。因其卓越的研究,2019年被《投资组合管理杂志》评为“年度量化分析师”。
-
乡村振兴新技术:新时代农村短视频编辑技术基础入门
¥12.8¥32.0 -
大模型推荐系统:算法原理、代码实战与案例分析
¥62.3¥89.0 -
AI绘画+AI摄影+AI短视频从入门到精通
¥45.5¥79.8 -
企业AI之旅
¥43.5¥79.0 -
机器学习
¥59.4¥108.0 -
硅谷之火-人与计算机的未来
¥12.7¥39.8 -
基于知识蒸馏的图像去雾技术
¥61.6¥88.0 -
软件设计的哲学(第2版)
¥51.0¥69.8 -
智能算法优化及其应用
¥47.6¥68.0 -
Photoshop图像处理
¥25.5¥49.0 -
R语言医学数据分析实践
¥72.3¥99.0 -
游戏造梦师----游戏场景开发与设计
¥68.6¥98.0 -
SAR图像处理与检测
¥35.4¥49.8 -
人工智能
¥29.4¥42.0 -
中文版PHOTOSHOP 2024+AI修图入门教程
¥59.3¥79.0 -
WPS办公软件应用
¥25.2¥36.0 -
格拉斯曼流行学习及其在图像集分类中的应用
¥13.7¥28.0 -
轻松上手AIGC:如何更好地向CHATGPT提问
¥46.5¥62.0 -
云原生安全:攻防与运营实战
¥66.8¥89.0 -
信息技术基础 Windows11 office 2021
¥27.4¥49.8