- ISBN:9787111754428
- 装帧:平装-胶订
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:318
- 出版时间:2024-07-01
- 条形码:9787111754428 ; 978-7-111-75442-8
本书特色
深耕一线互联网平台多年的两位作者精心总结:
全链路、全方位,深入剖析推荐算法细节
讲理论、重实践,聚焦关键业务问题解法
内容简介
本书从信息流个性化推荐算法从业者的角度,阐述在资讯内容类App中,如何搭建健壮、完善的个性化推荐算法体系,如何融合产品运营的专家模型和端到端的深度学习,如何平衡短期的商业化目标和长期的用户体验,以及我们在多个行业头部平台实践的过程中遇到的典型业务问题和解决方案,对比理论推导为主的机器学习书籍,本身更偏向基于行业问题的深度思考及落地实践。
目录
推荐序
前言
第1章 信息流产品与推荐算法1
1.1 什么是信息流产品1
1.2 信息流产品对用户体验和商业价值的重塑3
1.2.1 信息流产品下的用户体验3
1.2.2 商业价值的重塑6
1.2.3 用户体验及商业价值总结8
1.3 信息流产品推荐系统的构成8
1.3.1 推荐算法基线9
1.3.2 推荐算法的生态建设14
1.4 本章小结16
参考文献16
第2章 业务数据探索:推荐算法闭环的起点与终点18
2.1 产品运营分析19
2.1.1 系统性分析19
2.1.2 周期性分析23
2.2 用户画像分析24
2.2.1 用户画像构建的基本方法25
2.2.2 用户画像之价值分层与生命周期管理26
2.2.3 用户画像的质量保障30
2.3 用户行为路径分析32
2.4 本章小结34
参考文献35
第3章 可插拔式的召回算法36
3.1 召回侧的业务目标和技术方向36
3.2 协同过滤召回38
3.2.1 User-based CF38
3.2.2 Item-based CF40
3.2.3 Item-based CF与User-based CF的对比与改进41
3.2.4 Model-based CF43
3.3 用户和物品的向量化表示学习48
3.3.1 从Word2vec到Item2vec48
3.3.2 YouTube DNN54
3.3.3 DSSM57
3.4 基于图模型的召回建模63
3.4.1 SimRank63
3.4.2 DeepWalk66
3.4.3 LINE68
3.4.4 Node2vec70
3.4.5 EGES73
3.5 用户行为序列召回建模75
3.5.1 序列建模的通用算法模块75
3.5.2 用户多兴趣建模84
3.5.3 序列建模总结91
3.6 本章小结93
参考文献94
第4章 粗排算法97
4.1 粗排的定位和重要性思考97
4.2 前深度学习时代的粗排98
4.2.1 非个性化离线评估模型98
4.2.2 浅层个性化模型104
4.3 深度粗排模型的重要方法106
4.3.1 基于向量内积的双塔模型106
4.3.2 基于精排模型的知识蒸馏111
4.3.3 COLD粗排架构117
4.4 粗排建模的重要问题120
4.4.1 样本选择策略120
4.4.2 粗精排一致性校验123
4.5 本章小结125
参考文献125
第5章 精排算法127
5.1 精排算法的核心目标和概要127
5.2 前深度学习时代的精排算法128
5.2.1 LR128
5.2.2 FM131
5.2.3 GBDT136
5.3 深度精排算法137
5.3.1 Wide & Deep138
5.3.2 DeepFM139
5.3.3 DIN140
5.3.4 DIEN144
5.3.5 DSIN146
5.3.6 SIM149
5.4 在线学习152
5.4.1 在线学习的基本概念152
5.4.2 在线学习算法框架:FTRL153
5.5 多任务学习156
5.5.1 MMoE157
5.5.2 ESMM158
5.5.3 PLE159
5.5.4 MFH162
5.5.5 MVKE164
5.6 本章小结170
参考文献170
第6章 多目标融合算法173
6.1 多目标融合的意义173
6.2 启发式多目标融合173
6.2.1 Grid Search174
6.2.2 Random Search175
6.2.3 搜参实践175
6.3 贝叶斯优化176
6.3.1 概率代理模型177
6.3.2 采集函数178
6.3.3 贝叶斯搜参实践179
6.4 进化策略179
6.4.1 进化算法的相关概念179
6.4.2 基于OpenAI ES的进化策略实践185
6.5 强化学习186
6.5.1 强化学习的核心概念187
6.5.2 强化学习的多目标融合实践189
6.6 本章小结194
参考文献194
第7章 重排算法196
7.1 重排算法概要及核心目标196
7.2 多样性算法之启发式方法196
7.2.1 MMR197
7.2.2 MLR197
7.2.3 DPP198
7.3 多样性算法之list-wise建模200
7.3.1 DLCM200
7.3.2 PRM205
7.3.3 Seq2Slate208
7.3.4 GRN212
7.3.5 PRS217
7.4 端云一体协同推荐221
7.4.1 EdgeRec221
7.4.2 DCCL227
7.5 本章小结232
参考文献232
第8章 推荐建模中的数据预处理和模型后处理234
8.1 评分矩阵构建234
8.2 特征工程239
8.2.1 特征的提取与加工239
8.2.2 特征重要性分析244
8.3 模型校准248
8.4 本章小结250
参考文献250
第9章 信息流推荐中的经典业务问题应对252
9.1 关于信息茧房252
9.2 关于保量策略255
9.3 内容与用户冷启动256
9.3.1 DropoutNet256
9.3.2 MWUF258
9.3.3 LinUCB261
9.3.4 Cold & Warm Net263
9.4 偏置与消偏266
9.4.1 偏置分析267
9.4.2 消偏:用户选择偏置269
9.4.3 消偏:曝光偏置269
9.4.4 消偏:群体一致性偏置270
9.4.5 消偏:位置偏置270
9.4.6 消偏:流行度偏置273
9.5 正向行为定义279
9.6 本章小结280
参考文献281
第10章 信息流推荐算法的评估与改进283
10.1 宏观视角下的推荐效果评估283
10.2 微观视角下的推荐效果评估287
10.2.1 推荐效果评估流程287
10.2.2 离线评估指标体系289
10.3 A/B测试的实验机制设计296
10.3.1 A/B测试的基本概念及必要性296
10.3.2 A/B测试的实验设计和效果分析298
10.3.3 A/B测试与Interleaving305
10.4 本章小结307
参考文献307
第11章 总结与展望308
11.1 推荐算法的重要挑战308
11.2 论推荐算法工程师的自我修养312
11.3 本章小结317
参考文献317
后记318
相关资料
近10多年以来,推荐算法在互联网业界中扮演着越来越重要的角色,从电商、信息资讯到短视频App,个性化推荐为用户提供了流畅的浏览体验,同时也促进了平台生态的健康发展。本书以信息流产品为切入点,深入浅出地介绍了推荐算法基线、理论基础和业务实践,是作者十数年从事推荐算法工作的宝贵沉淀和总结。无论是想要深入理解和应用推荐算法的学生,还是一线推荐算法工程师,本书对他们来说都是一本非常实用的书籍。我强烈推荐本书给那些对推荐算法感兴趣的读者,相信它能为读者在推荐建模实践中提供有效帮助。 —— 李传福 前阿里巴巴资深总监、阿里数据大学校长 在这个信息爆炸的时代,信息流产品已经成为我们日常生活中不可或缺的一部分,它让我们能够在海量信息中迅速找到感兴趣的内容。而在这背后,推荐算法发挥着至关重要的作用。本书汇聚了两位在阿里和腾讯深耕多年的资深推荐专家的经验,详尽地梳理了推荐算法的发展脉络与各个阶段的算法体系。更值得一提的是,本书紧密结合业务实践,展示了如何针对数据预处理、信息茧房、冷启动、消偏以及内容分发价值评估等问题提供系统性的解决方案。相信无论是信息流算法工程师还是产品经理,都能从这本实用性强的书中获得启示和指导。 —— 李奘 腾讯PCG大数据平台部和AI委员会负责人 本书系统介绍了业界主流信息流推荐系统的主要模块和经典算法,同时对系统在大规模用户产品落地过程中遇到的典型问题进行了探讨。本书内容全面,非常适合希望深入了解推荐系统的从业者,也适合与推荐算法团队有深入协作的产品经理、数据分析师和后台工程师等上下游团队人士阅读学习。 —— 阮超 腾讯高级总监,腾讯微视&QQ短视频负责人,前Airbnb中国技术负责人 本书以清晰而生动的方式,紧贴信息流产品的内容分发业务场景,介绍了个性化推荐的全链路算法,包括前序的数据洞察、线索挖掘,到召回、粗排、精排、重排设计,再到冷启动、消偏、保量策略等平台生态建设问题,内容翔实,对一线算法工程师极具参考价值。 —— 魏虎 阿里巴巴技术总监、阿里个性化推荐平台(TPP)发起人 从电商平台的商品推荐,到新闻的个性化推送,再到短视频的内容分发,推荐算法已经成为现代信息流产品的核心技术之一。本书理论与实践相结合,详细介绍了推荐系统的关键技术和实现方法,不仅涵盖了推荐算法的基本原理,还深入探讨了诸如冷启动、消偏、评估等复杂问题。对于希望系统学习推荐算法的学生和技术人员,本书无疑是一本宝贵的指南。 —— 吴书 中国科学院自动化研究所副研究员 本书围绕推荐算法在信息流产品中的工业化实践,深入浅出地展开讨论,本书的章节内容叙述融入了作者在淘宝、腾讯及多家独角兽级公司中的多年实践经验,对推荐建模中的经典业务问题抽丝剥茧,并给出了翔实的算法设计,推荐相关从业者阅读参考。 —— 张伟 Shopee电商数据智能部负责人、前阿里巴巴资深算法专家 都说自然语言是人工智能皇冠上的明珠,但推荐算法绝对是上一轮人工智能浪潮中名利双收的大明星。为什么这么说?一方面,应用的潜力引领业界和学界竞相争奇斗艳,推动了算法和工程上的一系列创新;另一方面,这些创新又驱动了移动互联网信息分发革命,创造了巨大的商业收益。本书作者亲历了推荐算法在技术和产品应用上的迭代,并将其汇集成这本新作,希望启迪那些想继续在这个领域耕耘与精进的伙伴们。 —— 王大川 数据智能开发者社区DataFun创办人
作者简介
赵争超,腾讯视频推荐中心副总监,负责腾讯视频海外版的个性化推荐,研究方向为推荐算法的研究与应用、精准营销在零售业的落地实践。前阿里巴巴高级算法专家 ,负责淘宝购物路径的推荐算法和新零售域的大数据应用。 黄帆 博士 毕业于北京邮电大学,现为腾讯公司专家研究员,曾就职于华为和阿里巴巴,长期从事推荐算法研究与应用工作,熟悉推荐算法与系统。负责过多个大型互联网产品大规模工业级推荐系统的核心研发工作,在算法领域积累了丰富的经验。先后于SIGKDD、SIGIR等知名会议和IET Communications等知名期刊发表学术论文20余篇,申请发明专利40余项(其中20余项已授权)。
-
全图解零基础word excel ppt 应用教程
¥15.6¥48.0 -
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
硅谷之火-人与计算机的未来
¥12.7¥39.8 -
机器学习
¥59.4¥108.0 -
深度学习的数学
¥43.5¥69.0 -
智能硬件项目教程:基于ARDUINO(第2版)
¥37.7¥65.0 -
情感计算
¥66.8¥89.0 -
LINUX企业运维实战(REDIS+ZABBIX+NGINX+PROMETHEUS+GRAFANA+LNMP)
¥48.3¥69.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥62.9¥89.8 -
LINUX实战——从入门到精通
¥48.3¥69.0 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
剪映AI
¥52.8¥88.0 -
数据驱动的工业人工智能:建模方法与应用
¥68.3¥99.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥76.3¥109.0 -
UG NX 12.0数控编程
¥24.8¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
UN NX 12.0多轴数控编程案例教程
¥24.3¥38.0 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0 -
Go 语言运维开发 : Kubernetes 项目实战
¥38.7¥79.0