- ISBN:9787111750963
- 装帧:平装-胶订
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:238
- 出版时间:2024-05-01
- 条形码:9787111750963 ; 978-7-111-75096-3
本书特色
?以往专注于算法模型或特征工程等某一细分领域推荐系统已经无法满足用户不断变化的需求。推荐系统涉及的技术越来越多。除了算法模型和特征工程,现在的推荐系统的核心还包括计算平台的优化、用户画像的构建与更新、产品策略的制定等。这些因素相互关联、相互影响,共同构成了一个完整的推荐系统生态。本书聚焦于业务场景、多层推荐框架、特征处理、测评指标定义、冷启动系统等关键问题,通过深入剖析核心痛点,帮读者更好地理解和应用新时代推荐系统的核心技术。掌握了这些技术,读者就可以轻松提升推荐系统的效果和性能,满足用户日益增长的个性化需求。
内容简介
这是一本指导中高级从业者高质量落地现代推荐系统,围绕现代推荐系统核心技术展开深度解读的专业工具书,又是一套完整的推荐系统高质量落地解决方案。本书基于推荐算法工程师实际工作场景规划内容,融合了作者在阿里巴巴、58同城等多家大厂做推荐系统设计和优化的经验,是一本方法和实践兼具的好书。<br />本书不针对零基础从业者,而是以帮助初级算法工程师向中高级进阶为目标。书中从底层剖析推荐系统在实际业务场景中可能出现的各种问题,直指问题的本质,并按照推荐系统工作流程逐一破解。<br />本书共包括11章:<br />第1章 主要介绍推荐系统在各个互联网业务场景中的落地情况,包括构建推荐系统可能面临的问题,以及电商、视频、电子书、广告系统、信息流、拉活促销等相关推荐系统落地指导。<br />第2章 介绍现代推荐系统的整体架构,以帮助读者从宏观层面整体了解推荐系统。<br />第3章 对推荐系统所需要的数据和特征处理进行深度剖析,包括数据的收集、非结构化数据的结构化清洗、连续特征处理和离散特征处理等重点内容。<br />第4章 对推荐系统的在线指标和离线指标,以及AB实验的设计进行深度讲解。<br />第5章和第6章,主要对机器学习和神经网络的设计和调参进行详细解读。这是本书的重点,也是很多推荐算法工程师的痛点。这部分包括XGBoost的重要参数调优、集成学习*DA化推荐效果利用、DNN网络深度和宽度的影响、激活函数的选择、优化器选择、损失函数、过/欠拟合等内容。<br />第7~9章 分别对召回层、精排层、粗排层进行详细解读,包括5种召回方案、4种精排建模方式、2种粗排设计方案,以及模型可解释性、近离线计算等重点内容。<br />第10章 主要介绍精排模型的分析方法,重排模型(PRM、生成式重排模型)和混排(混排的原理和强化学习在混排的应用)的原理。<br />第11章 主要介绍冷启动链路的设计,主要包括新用户如何冷启动、新物料如何冷启动和冷启动涉及的流量分配算法。这是本书的特色内容。
目录
前言
第1章 什么是推荐系统1
1.1 深度理解推荐系统1
1.2 企业在构建推荐系统时会面临
哪些问题3
1.3 4类主流推荐系统构建点拨3
1.3.1 电商是怎么做推荐
系统的4
1.3.2 视频网站是怎么做推荐
系统的9
1.3.3 推荐系统是怎么应用于
广告业务的12
1.3.4 推荐系统是怎么应用于
信息流的13
1.4 推荐系统怎么拉活促销16
1.5 架构和模型在推荐系统落地
中的作用17
第2章 推荐系统架构18
2.1 推荐系统架构概述19
2.2 召回层概述20
2.2.1 非个性化召回21
2.2.2 个性化召回21
2.3 粗排层概述23
2.3.1 双塔粗排23
2.3.2 交叉粗排24
2.4 精排层概述24
2.5 重排层概述25
2.6 冷启动环节27
2.6.1 用户冷启动28
2.6.2 物料冷启动30
第3章 构建推荐系统的特征31
3.1 怎么收集数据31
3.2 怎么清洗数据33
3.2.1 物料侧数据33
3.2.2 用户侧数据34
3.2.3 内容侧数据35
3.2.4 交叉数据36
3.3 怎么处理连续特征36
3.3.1 标准化36
3.3.2 无监督分箱39
3.3.3 有监督分箱40
3.4 怎么处理离散特征47
第4章 为推荐系统选择评价
指标54
4.1 不同业务的线上指标54
4.2 精排层应该选择什么评价
指标56
4.3 召回层应该选择什么评价
指标62
4.4 重排层应该选择什么评价
指标66
4.5 怎么设计合理的AB实验68
第5章 机器学习模型调参71
5.1 决策树调参71
5.2 随机森林调参72
5.3 XGBoost调参73
5.4 LightGBM调参76
5.5 全局优化调参77
5.5.1 网格搜索77
5.5.2 贝叶斯调参77
5.6 利用集成学习提高推荐效果81
第6章 神经网络模型调参83
6.1 怎么对DNN调参83
6.1.1 DNN的深度和宽度
调参83
6.1.2 DNN激活函数的
选择84
6.2 怎么为神经网络选择优化器90
6.3 怎么为神经网络选择损失
函数94
6.4 怎么解决神经网络的拟合
问题100
第7章 个性化召回层样本
选择和模型选择102
7.1 协同过滤召回102
7.1.1 传统协同过滤102
7.1.2 协同过滤的改进106
7.1.3 协同过滤优缺点108
7.2 双塔召回109
7.2.1 DSSM模型109
7.2.2 Youtube召回模型110
7.2.3 Facebook召回模型113
7.2.4 FM召回115
7.2.5 MIND模型117
7.2.6 ESAM模型120
7.3 Word2vec在召回中的应用123
7.3.1 基于Word2vec的经典
召回模型123
7.3.2 Airbnb召回模型128
7.3.3 “随机游走”在召回
中的应用134
7.4 基于图网络的召回137
7.4.1 Graph Sage137
7.4.2 PinSage141
7.4.3 GraphTR143
7.5 基于树网络的召回147
7.5.1 TDM树召回147
7.5.2 DR151
第8章 精排层的样本选择和
模型选择156
8.1 传统DNN建模156
8.1.1 Youtube DNN精排
模型156
8.1.2 Wide&Deep158
8.2 交叉模型159
8.2.1 FM模型家族160
8.2.2 DCN系列模型164
8.3 偏置问题170
8.3.1 位置偏置170
8.3.2 曝光偏置172
8.3.3 热门偏置173
8.3.4 选择偏置173
8.3.5 服从性偏置173
8.3.6 不平等偏置174
8.4 模型可解释性174
8.4.1 FiBiNET174
8.4.2 夏普利值177
8.4.3 SHAP179
8.5 因果场景182
8.5.1 提升模型建模方式183
8.5.2 基于树模型的因果
模型185
8.5.3 标签转换法188
8.5.4 提升模型的评价指标188
8.5.5 因果模型应用于偏置
消除189
8.6 序列建模192
8.6.1 DIN192
8.6.2 DIEN195
8.6.3 MIMN197
8.6.4 SIM203
8.7 多目标建模206
8.7.1 MMOE206
8.7.2 ESMM MMOE208
8.7.3 SNR209
8.7.4 CGC209
8.7.5 PLE211
作者简介
唐楠烊(网名:Tang) 资深算法工程师,精通推荐算法和NLP算法。曾就职于阿里巴巴、58同城等多家知名互联网公司,专门从事推荐系统和NLP算法相关工作。具有多年的算法经验,在推荐系统的全链路优化和NLP对话业务方面经验尤其丰富。
知乎作者、Github资深玩家,专注于推荐算法和NLP相关内容分享。在Github上有多个项目,*高获得100多颗星;在知乎上发表数十篇技术文章,总阅读量近百万。
-
认识电竞
¥36.0¥58.0 -
物联网应用路线图
¥8.2¥39.0 -
整理优先:小改进,大回报,整洁代码设计指南
¥37.7¥49.0 -
大学信息技术基础教程(第3版)
¥59.3¥69.8 -
开启创意之门 AIGC创作一本通
¥70.0¥89.8 -
生物特征识别算法研究
¥22.2¥39.0 -
计算机视觉:从感知到重建
¥108.8¥149.0 -
自然语言处理导论
¥51.4¥79.0 -
AI时代程序员开发之道:CHATGPT让程序员插上翅膀
¥60.0¥79.0 -
一本书玩转MIDJOURNEY:人人都可以体验AI绘画的魅力
¥102.9¥139.0 -
和秋叶一起学EXCEL(第3版)
¥76.9¥109.9 -
矩阵力量:线性代数全彩图解+微课+Python编程
¥206.4¥258.0 -
技术为径:带领公司走向卓越的工程师
¥46.6¥79.0 -
图神经网络:基础、前沿与应用
¥139.5¥178.8 -
这才是服务设计
¥123.9¥199.8 -
全国计算机等级考试一本通 二级MS Office高级应用与设计
¥54.5¥69.9 -
设计机器学习系统
¥103.5¥138.0 -
中望CAD实用教程
¥62.3¥79.9 -
软件性能测试——LoadRunner性能监控与分析实例详解
¥63.2¥79.0 -
走进智能家居
¥35.6¥44.0