嘿,记得给“机器学习与推荐算法”添加星标
学习多媒体内容的特征表示对多媒体推荐至关重要。目前的表示学习方法大致分为两类:利用历史交互信息来创建用户和物品的ID嵌入,以及将多模态数据作为物品的辅助信息来丰富其ID嵌入。每个用户与物品的交互都提供了监督信号,以优化传统监督学习范式下的表示学习。由于忽视了隐藏在数据中的多模态模式(比如,用户以前看过的短视频中的视频、声音、文本特征,以及它们的行为特征),这些方法不足以创建强大的表征并获得满意的推荐精度。
为了捕捉数据本身的多模态模式,本文在监督学习的范式基础之上,将自监督学习(SSL)的想法纳入到多媒体推荐中。具体来说,SSL包括两个部分:(1)多模态内容的数据增强;(2)对比学习,将一个项目的视图与其他项目的视图区分开来,以提炼出额外的监督信号。显然,SSL使本文能够探索和展示各种模式之间的基本关系,从而产生强大的表征。本文提出了自监督学习指导的多媒体推荐通用框架(SLMRec)。通过在三个真实世界的数据集上进行广泛的实验,表明SLMRec比几个最先进的基线方法如LightGCN、MMGCN取得了明显的改进。