- ISBN:9787111643531
- 装帧:平装-胶订
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:240
- 出版时间:2020-01-01
- 条形码:9787111643531 ; 978-7-111-64353-1
本书特色
内容介绍
本书基于Python全面介绍了机器学习在信贷风控领域的应用与实践,从原理、算法与工程实践3个维度全面展开,包含21种实用算法和26个解决方案。
作者是智能风控、人工智能和算法领域的专家,曾在多家知名金融科技企业从事风控算法方面的研究与实践,经验丰富,本书得到了风控领域9位专家的高度评价。
全书一共8章,每个章节都由问题、算法、案例三部分组成,具有系统性和实战性。
第1-2章讲解了信贷业务的基础知识以及常用的规则引擎、信用评估引擎的建模方法。
第3章以项目冷启动为背景,讲解了风控领域应用广泛的迁移学习方法。
第4-5章介绍了幸存者偏差与不均衡学习中所使用的无监督学习与半监督学习方法。
第6章阐述了无监督的异常识别算法,该算法常用于数据清洗与冷启动项目,是反欺诈引擎中常用的个体欺诈检测方法。
第7章分享了一些经作者实践证明效果较好的模型优化方法,并对模型融合的思路进行了较为详细的介绍。内容介绍
本书基于Python全面介绍了机器学习在信贷风控领域的应用与实践,从原理、算法与工程实践3个维度全面展开,包含21种实用算法和26个解决方案。
作者是智能风控、人工智能和算法领域的专家,曾在多家知名金融科技企业从事风控算法方面的研究与实践,经验丰富,本书得到了风控领域9位专家的高度评价。
全书一共8章,每个章节都由问题、算法、案例三部分组成,具有系统性和实战性。
第1-2章讲解了信贷业务的基础知识以及常用的规则引擎、信用评估引擎的建模方法。
第3章以项目冷启动为背景,讲解了风控领域应用广泛的迁移学习方法。
第4-5章介绍了幸存者偏差与不均衡学习中所使用的无监督学习与半监督学习方法。
第6章阐述了无监督的异常识别算法,该算法常用于数据清洗与冷启动项目,是反欺诈引擎中常用的个体欺诈检测方法。
第7章分享了一些经作者实践证明效果较好的模型优化方法,并对模型融合的思路进行了较为详细的介绍。
第8章重点讲解了知识图谱相关的复杂网络基础知识及网络表示学习方法,其中的社区发现算法常用于团伙欺诈检测。此外,本章中的部分方法对信用评估模型的优化也有很大帮助。
内容简介
(1)作者是风控、AI、算法领域的专家,曾在多家知名金融科技公司从事基于机器学习的风控算法优化工作,经验十分丰富。
(2)从原理、算法、工程实践3个维度全面展开,全面介绍了现阶段风控领域面临的挑战,以及机器学习在各种风控场景中的应用。
(3)基于Python新版本撰写,每个章节都包含问题、案例、算法3个部分,实操性强。
(4)科大讯飞刘鹏等10位专家联袂推荐。
(5)包含21种实用算法与26个解决方案
智能风控第二弹来袭!
目录
前言
第1章 风控建模与规则挖掘 / 1
1.1 信贷与风险 / 1
1.1.1 信贷业务与互联网金融风控体系 / 1
1.1.2 信贷风险与控制 / 4
1.2 工业建模流程 / 5
1.2.1 抽象业务 / 6
1.2.2 定义标签 / 6
1.2.3 样本选取 / 7
1.2.4 特征工程与模型调优 / 9
1.2.5 上线监控与评估报表 / 10
1.3 规则挖掘方案 / 13
1.4 本章小结 / 20
第2章 集成模型评分卡 / 21
2.1 特征工程解析 / 21
2.1.1 特征与模型 / 22
2.1.2 信用模型的特征 / 22
2.2 特征衍生方案 / 24
2.3 离散处理 / 27
2.3.1 one-hot编码 / 27
2.3.2 WOE编码 / 28
2.4 迭代特征筛选方案 / 33
2.5 自动化调参 / 38
2.5.1 自动化调参策略 / 38
2.5.2 参数搜索方案 / 39
2.5.3 调参框架搭建 / 40
2.6 递归特征删除方案 / 43
2.7 评分卡制作 / 44
2.7.1 逻辑回归评分卡 / 45
2.7.2 集成模型的评分映射 / 55
2.7.3 针对业务改写评价函数 / 59
2.8 本章小结 / 60
第3章 迁移学习与冷启动 / 61
3.1 迁移学习基础 / 61
3.1.1 应用场景 / 62
3.1.2 概念介绍 / 62
3.2 迁移学习方法论 / 63
3.2.1 三类常见算法 / 63
3.2.2 迁移的实现方法 / 64
3.3 少量有标签样本的迁移方案 / 65
3.3.1 TrAdaBoost模型 / 65
3.3.2 跨场景迁移模型 / 67
3.4 无标签样本迁移之JDA / 76
3.4.1 JDA模型 / 76
3.4.2 模型应用 / 79
3.5 无标签样本迁移之DTELM / 80
3.5.1 ELM模型 / 81
3.5.2 DTELM模型 / 82
3.5.3 模型应用 / 84
3.6 迁移样本筛选方案 / 88
3.6.1 背景介绍 / 88
3.6.2 算法框架概览 / 88
3.6.3 搭建融合框架 / 89
3.7 本章小结 / 93
第4章 幸存者偏差 / 95
4.1 幸存者偏差的含义 / 95
4.2 增量学习 / 96
4.3 生成对抗网络 / 97
4.3.1 GAN模型介绍 / 98
4.3.2 GAN与幸存者偏差 / 99
4.4 高斯混合模型 / 100
4.4.1 GMM算法原理 / 101
4.4.2 GMM简单应用 / 103
4.4.3 GMM中的概率模型 / 104
4.4.4 GMM样本生成 / 107
4.5 信息准则 / 110
4.5.1 赤池信息准则 / 110
4.5.2 贝叶斯信息准则 / 111
4.5.3 AIC与BIC比较 / 111
4.6 本章小结 / 112
第5章 不均衡学习 / 113
5.1 样本不均衡 / 113
5.2 代价敏感加权方案 / 114
5.3 插值过采样方案 / 115
5.3.1 SMOTE算法 / 115
5.3.2 过采样算法实践 / 116
5.4 半监督学习方案 / 121
5.4.1 前提假设 / 122
5.4.2 S3VM / 122
5.4.3 LP / 127
5.5 本章小结 / 130
第6章 异常检测 / 132
6.1 离群点与欺诈检测 / 133
6.2 z-score检验 / 134
6.3 LOF异常检测法 / 134
6.3.1 原理与算法流程 / 135
6.3.2 LOF样本清洗方案 / 137
6.4 IF异常检测法 / 139
6.4.1 原理与算法流程 / 139
6.4.2 PreA模型与冷启动 / 141
6.5 本章小结 / 144
第7章 模型优化 / 145
7.1 多损失函数分段预测 / 145
7.1.1 两种损失函数 / 146
7.1.2 融合流程 / 146
7.2 树模型特征衍生 / 149
7.2.1 GBDT离散化 / 149
7.2.2 融合方案详解 / 150
7.2.3 特征衍生细节 / 151
7.2.4 案例 / 151
7.3 时间序列建模 / 160
7.3.1 RNN / 160
7.3.2 LSTM / 163
7.3.3 门控结构 / 164
7.3.4 LSTM行为评分卡案例 / 166
7.4 高维稀疏数据建模 / 170
7.4.1 算法原理 / 171
7.4.2 算法应用 / 172
7.5 模型融合 / 173
7.5.1 模型融合基础 / 173
7.5.2 模型筛选 / 174
7.5.3 业务应用方案 / 181
7.6 本章小结 / 183
第8章 知识图谱 / 184
8.1 复杂网络基础 / 184
8.2 中心度与相似性 / 187
8.3 节点分类 / 193
8.3.1 朴素节点分类 / 193
8.3.2 邻节点加权投票 / 195
8.3.3 一致性标签传播 / 197
8.4 社区发现算法 / 200
8.4.1 基础概念 / 200
8.4.2 Girvan-Newman算法 / 201
8.4.3 Louvain算法 / 202
8.4.4 社区评估 / 204
8.5 网络表示学习 / 206
8.5.1 矩阵分解 / 207
8.5.2 节点嵌入 / 210
8.6 图卷积神经网络 / 215
8.6.1 卷积神经网络 / 215
8.6.2 傅里叶变换 / 217
8.6.3 拉普拉斯算子 / 219
8.6.4 GCN中的图卷积 / 221
8.7 本章小结 / 225
参考文献 / 226
相关资料
风控是金融和交易类业务的核心环节,此领域缺乏逻辑实证主义体系下的整体框架。本书在这方面做出了非常有价值的总结,它会帮助风控人员快速建立起合理的思考方式和扎实的方法论。 ——刘鹏 科大讯飞副总裁,《计算广告》作者 本书主要关注金融科技在信贷领域的创新应用,算法原理与工程实践并重,在理论与现实之间架起了一座坚实的桥梁。 ——李志勇 西南财经大学金融学院信用管理系主任/《信用评分工具》等书译者 本书可读性强,漫画风格;实战性强,每个知识点都有案例;技术和算法在风控领域也比较超前,如生成对抗网络、迁移学习等。阅读过程像是给自己的风控体系做诊断,在确认病因后,本书还提供了药方。 ——黄莹 历任微软解决方案专家/DataVisor资深风控顾问 对于初学者而言,书的易读性很重要,这本书的*特点是内容表达形式丰富多样。还给出了大量源代码,让读者很容易上手实践。 ——闫光 某四大风险咨询高级总监/信息安全专家 本书全面讲解了机器学习算法在风控和反欺诈领域的应用,读者既能学习机器学习算法,又能理解智能风控在业务中的具体应用。 ——艾辉 融360高级技术经理/前饿了么高级技术经理 将书中的迁移学习、模型融合、图卷积神经网络等新知识点与自身的策略知识与业务经验相结合,建立客群分层衍生变量、融合模型等,模型性能会有较大提升,值得大家反复阅读。 ——周立烽 前阿里系禧云、腾讯系微盟风控总监 本书*的特点是对多种新兴检测方法的覆盖,它很好地平衡了理论性与工程性的比例,并提供了全面的实例代码,值得从业者和研究者反复阅读。 ——赵越 卡内基梅隆大学在读博士/PyOD作者 作者基于丰富的从业经验,结合详实的案例,为读者提供了风控模型策略开发的全流程方案。 ——谢士晨 中银富登高级数据分析经理/R和Python包ScoreCard作者 如果你正在从事或者希望从事数据分析、风控建模、算法工程类工作,相信此书不会让你失望。 ——翟锟 华亿嘉科技风控总监 全书以案例驱动,案例多来自一线业务,有非常强的业务指向性,所提供的方案与代码也有非常强的实操性。 ——范晓锋 阿里巴巴本地生活资深总监
作者简介
作者介绍
梅子行
风控技术专家、AI技术专家和算法专家,现就职于满帮科技,负责机器学习在风控领域的算法优化。历任多家知名金融科技公司的风控算法研究员、数据挖掘工程师。
师承Experian、Discover等企业的风控专家,擅长深度学习、复杂网络、迁移学习、异常检测等非传统机器学习方法,热衷于数据挖掘以及算法的跨领域优化实践。
公众号与知乎专栏:“大数据风控与机器学习”。
-
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
硅谷之火-人与计算机的未来
¥14.3¥39.8 -
全图解零基础word excel ppt 应用教程
¥12.0¥48.0 -
机器学习
¥59.4¥108.0 -
深度学习的数学
¥43.5¥69.0 -
智能硬件项目教程:基于ARDUINO(第2版)
¥37.7¥65.0 -
元启发式算法与背包问题研究
¥38.2¥49.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥62.9¥89.8 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
剪映AI
¥52.8¥88.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥77.4¥109.0 -
UG NX 12.0数控编程
¥24.8¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
界面交互设计理论研究
¥30.8¥56.0 -
UN NX 12.0多轴数控编程案例教程
¥25.8¥38.0 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0 -
Go 语言运维开发 : Kubernetes 项目实战
¥48.2¥79.0 -
明解C语言:实践篇
¥62.9¥89.8 -
Linux服务器架设实战(Linux典藏大系)
¥84.5¥119.0