Ranking
August 31, 2025About 1 min
Ranking
Multi-task Learning, MTL 多目标模型
排序的依据
- 排序模型预估点击率、点赞率、收藏率、转发率等多种分数。
- 融合这些预估分数。(比如加权和。)
- 根据融合的分数做排序、截断。
模型
- 主要代价在Shared Bottom
- 前期融合:先对所有特征做concatenation,再输入神经网络。
- 线上推理代价大:如果有篇候选笔记,整个大模型要做n次推理。
- 总的损失函数:
加权和损失函数,alpha是根据经验设置的超参
对损失函数求梯度,做梯度下降更新参数。
训练
困难:类别不平衡。
- 每100次曝光,约有10次点击、90次无,点击。
- 每100次,点击,约有10次收藏、90次无收藏。
解决方案:负样本降采样(down-sampling)
保留一小部分负样本。
让正负样本数量平衡,节约计算。
eg. 原本需要10h,降采样完只需要3h
预估值校准
- 真实点击率:
- 预估点击率:
- : 负样本的降采样率
- 校准公式:
参考文献:
- Xinran He et al.Practical lessons from predicting clicks on ads at Facebook.In the 8th International Workshop on Data Mining for Online Advertising.