经典!推荐系统-年度最佳Paper(附实践代码)

发布网友 发布时间:2024-10-24 13:25

我来回答

1个回答

热心网友 时间:2024-11-06 02:01

作为全球最大的视频网站,其推荐系统如何运行呢?让我们通过年度最佳论文《Deep Neural Networks for Recommendations》来揭秘大厂推荐系统的核心机制。

推荐系统的核心在于构建用户观看行为的表示。首先,将用户观看过的视频ID列表转化为向量,计算这些向量的平均值,得到观看向量(watch vector);其次,对用户搜索过的视频ID列表同样进行向量化处理,得出搜索向量(search vector);再者,用户的年龄、性别等人口统计学属性也经过特定处理,转化为地理嵌入(geographic embedding);最后,非多值类特征如性别和数值类特征直接作为深度神经网络(DNN)的输入。对于数值类特征,会进行变换,例如对年龄进行平方或平方根操作,生成新的特征。

的推荐系统架构分为召回阶段与排序阶段。在召回阶段,使用深度候选生成模型来精准预测用户可能感兴趣的视频类别。在排序阶段,采用深度排名模型对召回结果进行排序。

在召回阶段的DNN模型中,系统会为用户在特定上下文条件下预测视频类别。为了应对数据稀疏性问题,训练数据选取用户隐式反馈,即观看行为作为样本。离线训练阶段使用softmax分类器,服务阶段直接通过用户与视频的嵌入向量计算点积,得到候选结果的分数,选取topk结果作为推荐。

主要特征处理方面,用户的历史观看记录转化为固定维度的向量,通过加权平均得到watch vector;搜索历史也以类似方式处理。连续或离散特征如地理位置、设备、性别、年龄、登录状态等均被归一化至[0,1]区间。

在推荐系统中,年龄(example age)特征经过特定处理,如平方、平方根等操作,以增强模型的表示能力。正负样本和上下文选择是推荐系统中的关键问题,负采样(Negative Sampling)方法在训练中被广泛使用。不同网络深度和特征的实验有助于优化模型性能。

排序阶段引入了更多特征,如当前视频的嵌入、用户观看历史、语言嵌入、观看同频道视频时间差、视频曝光次数等。特征工程中,分类特征通过嵌入(Embedding)处理,连续特征进行归一化处理,以提高模型的预测能力。

融合推荐模型中,使用卷积神经网络(CNN)学习视频名称表示,结合文本卷积神经网络,对电影名称进行定长向量表示。通过计算用户与电影的余弦相似度作为个性化推荐分数,优化推荐结果。

本文详细介绍了推荐系统的构建与优化方法,旨在提供深度学习在推荐系统中的实践案例。对于感兴趣的研究者,相关代码已开源至GitHub。

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com