C/C++教程

LARA: Attribute-to-feature Adversarial Learning for New-item Recommendation论文笔记

本文主要是介绍LARA: Attribute-to-feature Adversarial Learning for New-item Recommendation论文笔记,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
图1 项目属性和用户配置文件之间关系的示例。左边列出了鞋子的属性,而右边列出了从相应的属性推断出的可能的用户配置文件

简介

该论文于2020年发表在WSDM上,目的是解决推荐系统中的冷启动问题。作者认为商品的属性可以反映用户的特征,如图1所示,一个鞋子会有不同的特征,这些特征能从侧面反映用户的兴趣爱好。对于一个真实的推荐系统而言,把商品精准地推荐给喜欢它的用户是主要任务,但一些新添加的商品(或者是很少有人购买的商品),由于缺乏与用户的交互数据,所以很难知道哪些用户可能喜欢该商品,因此也就无法完成这类商品的推荐。论文利用生成对抗网络,为商品的每种标签(特征)生成一个与该标签对应的用户特征,这样就得到了一个虚拟的人的特征,然后再从真实用户中找到与生成的用户相似度较高的用户,最后将该商品推荐给这位用户,这样就解决了商品冷启动问题。

论文的主要工作和创新点

主要工作

  • 设计了一个新的商品冷启动推荐模型,使用具有多个生成器的对抗网络从商品的配置文件中建模用户属性。据我们所知,这是第一个学习基于GAN的属性级项目-用户映射的工作。
  • 提出了一些提高系统性能的建议。为了避免稀疏性问题,引入了一种新的表示用户的方法。此外,为了使生成的用户接近真实的用户并与给定的项目相匹配,引入了三个样本来训练模型。
  • 基于零售超市的购买记录,建立了一个全新的大型数据集。此数据集包含三个月内的交易记录,每个项目具有多个属性,如类别、品牌和价格。在两个真实世界的数据集上评估了提出的模型,以比较证明我们的模型的优越性。

创新点

一些基于GAN的推荐方法,如IRGAN、GraphGAN、CFGAN,利用用户和商品的交互信息直接为用户生成可能喜欢的商品,通过用户的购买行为记录训练生成器和判别器,直到生成器可以欺骗判别器。该类方法需要大量的真实购买行为记录,这在数据稀疏和冷启动场景中无法使用。本文的最大创新之处是不需要用户和商品的交互数据,而是从商品的配置文件中直接生成用户,这样可以解决商品冷启动问题。

模型架构

图2 LARA模型的架构。具有多生成器的生成模型,旨在生成与项目属性对应的用户配置文件。判别模型旨在区分生成的配置文件还是真实的配置文件。

LARA 模型由生成器和判别器两部分组成,生成器可以根据输入的物品的属性向量生成一个可能喜欢该物品的用户特征向量,然后从用户集中选出若干个与该用户特征向量最相似的用户,将该物品推荐给这些用户。判别器可以根据输入的用户-物品对,判断输入的用户特征是真实的还是生成的。

生成模型

生成器的个数和商品特征个数一样,对于商品特征\(a_{i}\),将其输入到生成器\(g_{i}\)中,得到和商品特征\(a_{i}\)相关的用户特征向量\(v_{i}\)。然后用一个全连接神经网络汇总所有的用户特征得到一个最终的用户特征向量。

判别模型

文中采用了三种数据对来训练判别器:

  • \((u^{c},I^{c})\) 给定的物品\(I^{c}\)和生成的用户\(u^{c}\)
  • \((u^{+},I^{c})\) 给定的物品\(I^{c}\)和真实用户\(u^{+}\)(ground-truth 数据中对\(I^{c}\)感兴趣的用户)
  • \((u^{-},I^{c})\) 给定的物品\(I^{c}\)和假用户\(u^{-}\)(ground-truth 数据中对\(I^{c}\)不感兴趣的用户)

通过以上三种样本的训练方式,可以使判别器产生的用户特征不仅像真实的用户特征,而且和给定的物品相关。
三种数据对的标签如下:

\(u^{+}\)的确定:先找到一个和物品\(I^{c}\)有交互的用户\(u\),并将其特征向量初始化为0,其中的维数是数据集中属性的数量。然后,我们搜索数据集,查找与用户有交互作用的商品,并获取这些商品的属性来构建一个属性集。最后,我们遍历属性集,并将零向量中相应的值设置为1来表示用户\(u^{+}\)。假用户\(u^{-}\)是先找到一个和物品没有交互的用户\(u\),后续过程跟真实用户的确定相同。

如何推荐

给定一个新商品的属性,生成模型可以生成倾向于购买该商品的用户的属性级特征表示。向量中的每个元素表示用户是否喜欢这个特定的属性,这也反映了用户的配置文件。然后从用户集中选择与生成用户最相似的前n个用户作为推荐对象。

相关实验

实验目的

  • 证明LARA模型是否优于商品冷启动推荐的最先进的基线
  • 证明属性级的用户表示方式是否有助于提高推荐性能
  • 除去\((u^{-},I^{c})\)是否影响最终实验结果

数据集

实验结果

与其他先进模型的对比实验

属性级的用户表示的优越性

本文的另一个贡献是利用属性信息来表示用户。为了验证属性级的用户表示的有效性,我们提出一个新的基线模型的项目属性信息的输入和输出是交互层面用户表示,也就是说,用户表示的尺寸等于商品的数量。

\((u^{-},I^{c})\)的影响

参考

  • https://blog.csdn.net/zuzhiang/article/details/105412789
这篇关于LARA: Attribute-to-feature Adversarial Learning for New-item Recommendation论文笔记的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!