作 者:张相於 著
定 价:89
出 版 社:电子工业出版社
出版日期:2020年08月01日
页 数:320
装 帧:平装
ISBN:9787121391514
●第1章推荐系统的时代背景1
1.1为什么需要推荐系统1
1.1.1提高流量利用效率1
1.1.2挖掘和匹配长尾需求6
1.1.3提升用户体验7
1.1.4技术积累8
1.2推荐的产品问题10
1.2.1推荐什么东西10
1.2.2为谁推荐13
1.2.3推荐场景14
1.2.4推荐解释16
1.3总结18
第2章推荐系统的核心技术概述19
2.1核心逻辑拆解19
2.2整体流程概述20
2.3召回算法21
2.4基于行为的召回算法24
2.5用户画像和物品画像24
2.6结果排序26
2.7评价指标26
2.8系统监控27
2.9架构设计28
2.10发展历程28
2.11总结30
第3章基础推荐算法31
3.1推荐逻辑流程架构31
3.2召回算法的基本逻辑34
3.3常用的基础召回算法36
3.3.1用户与物品的相关性36
3.3.2物品与物品的相关性42
3.3.3用户与用户的相关性46
3.3.4用户与标签的相关性47
3.3.5标签与物品的相关性48
3.3.6相关性召回的链式组合50
3.4冷启动场景下的推荐51
3.5 总结53
第4章算法融合与数据血统54
4.1线性加权融合55
4.2优先级融合57
4.3基于机器学习的排序融合59
4.4融合策略的选择61
4.5融合时机的选择63
4.6数据血统64
4.6.1融合策略正确性验证65
4.6.2系统效果监控65
4.6.3策略效果分析67
4.7 总结68
第5章机器学习技术的应用69
5.1机器学习技术概述69
5.2推荐系统中的应用场景70
5.3机器学习技术的实施方法72
5.3.1老系统与数据准备72
5.3.2问题分析与目标定义74
5.3.3样本处理76
5.3.4特征处理80
5.3.5模型选择与训练98
5.3.6模型效果评估101
5.3.7预测阶段效果监控104
5.3.8模型训练系统架构设计105
5.3.9模型预测系统架构设计108
5.4常用模型介绍109
5.4.1逻辑回归模型109
5.4.2GBDT模型111
5.4.3LR+GDBT模型112
5.4.4因子分解机模型113
5.4.5Wide & Deep模型115
5.4.6其他深度学习模型116
5.5机器学习实践常见问题117
5.5.1反模式1:只见模型,不见系统117
5.5.2反模式2:忽视模型过程和细节117
5.5.3反模式3:不注重样本精细化处理118
5.5.4反模式4:过于依赖算法119
5.5.5反模式5:核心数据缺乏控制120
5.5.6反模式6:团队不够“全栈”121
5.5.7反模式7:系统边界模糊导致出现“巨型系统”121
5.5.8反模式8:不重视基础数据架构建设122
5.6总结123
第6章用户画像系统124
6.1用户画像的概念和作用124
6.2用户画像的价值准则126
6.3用户画像的构成要素128
6.3.1物品侧画像129
6.3.2用户侧画像133
6.3.3用户画像扩展139
6.3.4用户画像和排序特征的关系142
6.4用户画像系统的架构演进143
6.4.1用户画像系统的组成部分143
6.4.2野蛮生长期144
6.4.3统一用户画像系统架构145
6.5总结147
第7章系统效果评测与监控148
7.1评测与监控的概念和意义148
7.2推荐系统的评测指标系统150
7.3常用指标151
7.4离线效果评测方法158
7.5在线效果评测方法163
7.5.1AB实验163
7.5.2交叉实验173
7.6系统监控178
7.7总结181
第8章推荐效果优化182
8.1准确率优化的一般性思路183
8.2覆盖率优化的一般性思路185
8.3行为类相关性算法优化188
8.3.1热度惩罚188
8.3.2时效性优化190
8.3.3随机游走194
8.3.4嵌入表示196
8.4内容类相关性算法优化200
8.4.1非结构化算法201
8.4.2结构化算法201
8.5影响效果的非算法因素205
8.5.1用户因素205
8.5.2产品设计因素206
8.5.3数据因素208
8.5.4算法策略因素208
8.5.5工程架构因素209
8.6总结210
第9章自然语言处理技术的应用211
9.1词袋模型212
9.2权重计算和向量空间模型214
9.3隐语义模型216
9.4概率隐语义模型218
9.5生成式概率模型220
9.6LDA模型的应用222
9.6.1相似度计算222
9.6.2排序特征222
9.6.3物品打标签&用户打标签223
9.6.4主题&词的重要性度量223
9.6.5更多应用224
9.7神经概率语言模型224
9.8行业应用现状226
9.9总结和展望227
第10章探索与利用问题228
10.1多臂老虎机问题228
10.2推荐系统中的EE问题230
10.3解决方案231
10.3.1ε-Greedy算法231
10.3.2UCB234
10.3.3汤普森采样236
10.3.4LinUCB237
10.4探索与利用原理在机器学习系统中的应用239
10.5EE问题的本质和影响240
10.6总结241
第11章推荐系统架构设计242
11.1架构设计概述242
11.2系统边界和外部依赖244
11.3离线层、在线层和近线层架构246
11.4离线层架构247
11.5近线层架构249
11.6在线层架构252
11.7架构层级对比255
11.8系统和架构演进原则256
11.8.1从简单到复杂256
11.8.2从离线到在线258
11.8.3从统一到拆分258
11.9基于领域特定语言的架构设计259
11.10总结262
第12章推荐系统工程师成长路线263
12.1基础开发能力264
12.1.1单元测试264
12.1.2逻辑抽象复用264
12.2概率和统计基础265
12.3机器学习理论266
12.3.1基础理论267
12.3.2监督学习268
12.3.3无监督学习269
12.4开发语言和开发工具270
12.4.1开发语言270
12.4.2开发工具270
12.5算法优化流程271
12.6推荐业务技能273
12.7总结274
第13章推荐系统的挑战275
13.1 数据稀疏性275
13.2推荐结果解释277
13.3相关性和因果性281
13.4信息茧房283
13.5转化率预估偏差问题286
13.6召回模型的局限性问题288
13.7用户行为捕捉粒度问题290
13.8总结291
本书是一本面向实践的企业级推荐系统开发指南,内容包括产品设计、相关性算法、排序模型、工程架构、效果评测、系统监控等推荐系统核心部分的设计与开发,可以帮助开发者逐步构建一个完整的推荐系统,并提供了持续优化的系统性思路。本书注重从系统性和通用性的角度看待推荐系统的核心问题,希望能够帮助读者做到知其然,也知其所以然,更能够举一反三,真正掌握推荐系统的核心本质。此外,本书对于推荐系统开发中常见的问题和陷阱,以及系统构建过程,也做了重点介绍,力求让读者不仅知道做什么,而且知道怎么做。本书的目标读者是推荐系统研发工程师、产品经理以及对推荐系统感兴趣的学生和从业者。
张相於 著
张相於,58集团算法架构师,转转搜索推荐部负责人,负责转转的搜索、推荐以及算法相关工作。多年来主要从事推荐系统以及机器学习相关工作,也做过计算广告、反作弊等相关工作,并热衷于探索大数据技术&机器学习技术在其他领域的应用实践。