- ISBN:9787111635734
- 装帧:平装-胶订
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:220
- 出版时间:2018-03-01
- 条形码:9787111635734 ; 978-7-111-63573-4
本书特色
LinkedIn技术专家撰写,着眼于推荐系统的核心——统计方法,不仅介绍算法理论,而且包含实验分析及结果展示
内容简介
本书由LinkedIn公司的技术专家撰写,着眼于推荐系统的核心—统计方法,不仅讲解理论知识,而且分享了作者在LinkedIn和Yahoo!的实践经验。全书分为三部分:部分介绍推荐系统的组成、经典推荐方法及评估方法,并引出了探索与利用问题;第二部分围绕点击通过率(CTR)预估这一重要问题,重点介绍快速在线双线性因子模型和面向回归的隐因子模型,为热门推荐和个性化推荐提供解决方案;第三部分讨论进阶主题,涵盖分解的隐含狄利克雷分布模型、张量分解模型、层次收缩模型以及多目标优化方法。
目录
译者序
前言
**部分 基础知识
第1章 简介2
1.1 面向网络应用的推荐系统概述3
1.1.1 算法3
1.1.2 优化指标5
1.1.3 探索与利用之间的权衡5
1.1.4 推荐系统的评估5
1.1.5 推荐和搜索:推送与拉取6
1.2 一个简单的评分模型:热门推荐7
1.3 练习10
第2章 经典推荐方法11
2.1 物品特征11
2.1.1 分类12
2.1.2 词袋模型13
2.1.3 主题建模15
2.1.4 其他物品特征16
2.2 用户特征16
2.2.1 声明的个人信息17
2.2.2 基于内容的画像17
2.2.3 其他用户特征18
2.3 基于特征的方法18
2.3.1 无监督方法18
2.3.2 有监督方法19
2.3.3 上下文信息22
2.4 协同过滤22
2.4.1 基于用户-用户相似度的方法23
2.4.2 基于物品-物品相似度的方法24
2.4.3 矩阵分解24
2.5 混合方法27
2.6 小结28
2.7 练习28
第3章 面向推荐问题的探索与利用29
3.1 探索与利用之间的权衡简介30
3.2 多臂赌博机问题31
3.2.1 贝叶斯方法31
3.2.2 极小化极大方法34
3.2.3 启发式赌博方案35
3.2.4 方法评价36
3.3 推荐系统中的探索与利用36
3.3.1 热门推荐36
3.3.2 个性化推荐36
3.3.3 数据稀疏性的挑战37
3.4 处理数据稀疏性的探索与利用37
3.4.1 降维方法37
3.4.2 降维中的探索与利用39
3.4.3 在线模型39
3.5 小结40
3.6 练习40
第4章 评估方法41
4.1 传统的离线评估方法41
4.1.1 数据划分方法42
4.1.2 准确度指标44
4.1.3 排序指标45
4.2 在线分桶测试49
4.2.1 设置分桶测试49
4.2.2 在线性能指标50
4.2.3 测试结果分析51
4.3 离线模拟52
4.4 离线回放54
4.4.1 基本回放估计55
4.4.2 回放的扩展57
4.5 小结58
4.6 练习58
第二部分 常见问题设置
第5章 问题设置与系统架构60
5.1 问题设置60
5.1.1 常见的推荐模块60
5.1.2 应用设置63
5.1.3 常见的统计方法65
5.2 系统架构66
5.2.1 主要组件66
5.2.2 示例系统67
第6章 热门推荐69
6.1 应用案例:雅虎“今日”模块69
6.2 问题定义71
6.3 贝叶斯方案72
6.3.1 2×2案例:两件物品,两个间隔73
6.3.2 K×2案例:K件物品,两个间隔75
6.3.3 一般解77
6.4 非贝叶斯方案79
6.5 实验评估81
6.5.1 比较分析81
6.5.2 方案刻画83
6.5.3 分段分析85
6.5.4 桶测试结果86
6.6 大规模内容池87
6.7 小结87
6.8 练习88
第7章 基于特征回归的个性化89
7.1 快速在线双线性因子模型90
7.1.1 FOBFM概述90
7.1.2 FOBFM详解91
7.2 离线训练93
7.2.1 EM算法94
7.2.2 E步骤95
7.2.3 M步骤96
7.2.4 可扩展性97
7.3 在线学习97
7.3.1 在线高斯模型97
7.3.2 在线逻辑模型98
7.3.3 探索与利用方案99
7.3.4 在线模型选择99
7.4 雅虎数据集上的效果展示100
7.4.1 My Yahoo!数据集101
7.4.2 雅虎首页数据集103
7.4.3 不包含离线双线性项的FOBFM105
7.5 小结105
7.6 练习106
第8章 基于因子模型的个性化107
8.1 面向回归的隐因子模型107
8.1.1 从矩阵分解到RLFM108
8.1.2 模型详解109
8.1.3 RLFM的随机过程112
8.2 拟合算法113
8.2.1 适用于高斯响应的EM算法114
8.2.2 适用于逻辑响应的基于ARS的EM算法118
8.2.3 适用于逻辑响应的变分EM算法121
8.3 冷启动效果展示124
8.4 时间敏感物品的大规模推荐127
8.4.1 在线学习127
8.4.2 并行拟合算法128
8.5 大规模问题效果展示130
8.5.1 MovieLens-1M数据131
8.5.2 小规模雅虎首页数据132
8.5.3 大规模雅虎首页数据134
8.5.4 结果讨论137
8.6 小结138
8.7 练习138
第三部分 进阶主题
第9章 基于隐含狄利克雷分布的分解140
9.1 简介140
9.2 模型141
9.2.1 模型概述141
9.2.2 模型详解142
9.3 训练和预测145
9.3.1 模型拟合145
9.3.2 预测150
9.4 实验150
9.4.1 MovieLens数据150
9.4.2 Yahoo! Buzz应用151
9.4.3 BookCrossing数据集153
9.5 相关工作154
9.6 小结155
第10章 上下文相关推荐156
10.1 张量分解模型157
10.1.1 建模157
10.1.2 模型拟合158
10.1.3 讨论159
10.2 层次收缩模型160
10.2.1 建模160
10.2.2 模型拟合161
10.2.3 局部增强张量模型164
10.3 多角度新闻文章推荐165
10.3.1 探索性数据分析166
10.3.2 实验评估171
10.4 相关物品推荐176
10.4.1 语义相关性177
10.4.2 响应预测177
10.4.3 预测响应和预测相关性的结合178
10.5 小结178
第11章 多目标优化179
11.1 应用设置179
11.2 分段方法180
11.2.1 问题设置180
11.2.2 目标优化181
11.3 个性化方法183
11.3.1 原始表示184
11.3.2 拉格朗日对偶185
11.4 近似方法188
11.4.1 聚类188
11.4.2 采样189
11.5 实验189
11.5.1 实验设置190
11.5.2 实验结果191
11.6 相关工作197
11.7 小结198
参考文献199
索引205
作者简介
---作者简介---
迪帕克·K. 阿加瓦尔(Deepak K. Agarwal) LinkedIn公司副总裁,领导人工智能/机器学习团队的研发工作。之前曾任Yahoo!研究院研究主管和首席研究员,以及AT&T公司研究员。20多年来,他致力于为Web应用开发、部署机器学习和统计方法,以及解决推荐系统和计算广告领域的大数据问题。
陈必衷(Bee-Chung Chen) LinkedIn公司首席主任工程师、应用研究员,曾任Yahoo!研究院研究员。作为核心开发者,他为LinkedIn和Yahoo!设计了前沿的推荐算法,此外,他还关注数据挖掘、机器学习和大数据分析技术。
---译者简介---
戴薇 深圳大学计算机与软件学院研究生,主要研究方向为迁移学习、推荐系统和机器学习。---作者简介---
迪帕克·K. 阿加瓦尔(Deepak K. Agarwal) LinkedIn公司副总裁,领导人工智能/机器学习团队的研发工作。之前曾任Yahoo!研究院研究主管和首席研究员,以及AT&T公司研究员。20多年来,他致力于为Web应用开发、部署机器学习和统计方法,以及解决推荐系统和计算广告领域的大数据问题。
陈必衷(Bee-Chung Chen) LinkedIn公司首席主任工程师、应用研究员,曾任Yahoo!研究院研究员。作为核心开发者,他为LinkedIn和Yahoo!设计了前沿的推荐算法,此外,他还关注数据挖掘、机器学习和大数据分析技术。
---译者简介---
戴薇 深圳大学计算机与软件学院研究生,主要研究方向为迁移学习、推荐系统和机器学习。
潘微科 深圳大学计算机与软件学院副教授,主要研究方向为迁移学习和推荐系统。
明仲 深圳大学计算机与软件学院院长、教授,大数据系统计算技术国家工程实验室执行主任,主要研究方向为人工智能、软件工程和推荐系统。
-
落洼物语
¥8.4¥28.0 -
当代中国政府与政治(新编21世纪公共管理系列教材)
¥33.6¥48.0 -
中国当代文学名篇选读
¥17.0¥53.0 -
中医基础理论
¥50.7¥59.0 -
长征记忆(八品)
¥9.5¥45.0 -
中医基础理论【中医 针灸专业用】
¥18.0¥25.0 -
北大人文课(平装)
¥12.2¥45.0 -
世界现代设计史-[第二版]
¥63.6¥120.0 -
宪法-第二版
¥20.3¥29.0 -
先进防伪技术
¥81.3¥98.0 -
当代中国政府与政治 第二版
¥57.8¥68.0 -
企业法务教程
¥34.8¥49.0 -
习近平新时代中国特色社会主义思想概论
¥18.2¥26.0 -
毛泽东思想和中国特色社会主义理论体系概论(2021年版)
¥8.5¥25.0 -
办公室工作实务(第4版)/黄海
¥27.8¥48.0 -
计算机操作系统教程(第4版)(清华大学计算机系列教材)
¥31.9¥49.0 -
习近平总书记教育重要论述讲义
¥13.3¥35.0 -
无人机概论
¥37.2¥59.0 -
(平装)北大必修课:北大口才课
¥18.2¥45.0 -
海商法-第四版
¥30.2¥48.0