【论文泛读】JSCN: Joint Spectral Convolutional Network for Cross Domain Recommendation

JSCN: Joint Spectral Convolutional Network for Cross Domain Recommendation – 2019 IEEE BigData

本文发在了IEEE BigData 上,虽然非顶会,但其谷歌指数接近IJCNN,并且提供了代码,以借鉴其思路为主,在此分享给大家,具体如下:

论文解决的具体问题和主要假设

这是一篇域自适应相关的文章,也是最近看到的比较有意思的一篇处理文本跨域问题的文章。我在本文共找到两个公平性假设,第一个假设中作者认为域之间存在高阶连通性信息(HOC,high-order connectivity info)会影响到跨域推荐的域兼容性(公平性)。高阶连通性信息指在原本仅关注邻居关系的user-item跨域交互图中进一步关注更深层次的连通关系。因为这里我个人感觉比较有价值,所以解释的详细一点:(例如下面这样一个场景)

【论文泛读】JSCN: Joint Spectral Convolutional Network for Cross Domain Recommendation
作者假设在单个目标域B的user-item二部图中(只关注上图中的绿色部分时),对Item 1和Item 2来说User D与这两个Item是无直接连边的,所以当考虑低阶连通性关系的时候(仅用单层GCN考虑一阶近邻时),对于user D推荐item 1和item 2的机会应该是相似的。但现在我们假设考虑高阶连通性,将任意两点间连边代表1单位距离,此时user D与item 2之间是存在一条item 2–user B–item 3–user C–item 4–user D的高阶连通路径的,那么我们视这条代价为5的路径为userD与item2之间的高阶连通性关系。如此看来,为userD推荐item2的机会应该要更高。但假如是跨域场景,考虑到新的域信息的加入,如蓝色部分,这时候对于item 1,产生了两条新的到达user D的路径:item 1–user A–item 5–user C–item 4–user D and item 1–user A–item 6–user C–item 4–user D,并且都是代价为5的高阶连通性路径,此时是不是更应该给user D 推荐item 1了呢?然而,作者指出现有的基于跨域图使用GCN的跨域推荐方法无论在单域还是跨域都极少关注到高阶近邻关系,所以目前的推荐列表对用户而言是有偏的,是有失公平的。

本文还有第二个与域自适应相关的假设,作者提出如果目标域是user与电影item连接的电影域,而源域是user与服装item连接的服装域,那么它们将彼此不兼容,因为用户的行为差异很大,导致源域中的信息不能直接用于目标域。即作者认为如服装域和电影域这种原本不易解释行为关联性的域之间如果想要跨域,则需要稀释掉行为差异所带来的偏差(这里是我读完本文的推测,作者针对这第二个偏差假设未给出进一步解释,而是给出了一篇引用:

Easing Embedding Learning by Comprehensive Transcription of Heterogeneous Information Networks SIGKDD-2018

我会在稍后对这篇文章进行泛读,根据作者的描述,其中应该着重解释了”不兼容”的意思。

; 论文使用的方法

为了解决第一个问题,即捕捉跨域图中的高阶连通性信息,作者借助数学上的谱图论(spectral graph theory)将跨域图转换为频域(frequency domain),在频域当中根据图的拉普拉斯特征向量,使用傅里叶变换以提取图的综合连通性信息(单域和跨域的高阶连通性信息)。而转换后的频谱表示通过频谱图卷积网络实现(网络结构未精读),该网络首先随机初始化输入图中的users和items作为输入,然后经过K层GCN学习到user和item的频谱表示向量(不出所料还是通过K值作为超参数来调节GCN层数进而调节高阶的程度)。
随后,为了解决第二个问题,作者将GCN输出的不同域的user的表示向量通过一个映射函数映射到”域无关”的表示空间中,最后对空间中每一个user的来自多个域的表示,采取最小化它们之间的距离的方法得到每个用户最终的”域无关”向量表示,以此来稀释不同域间因行为差异所带来的偏差。当需要用的时候,就将”域无关”空间中的用户表示映射到对应的域上,联合该域中的item表示来生成该域的推荐结果。

本文的主要贡献

  1. 本文首次提出了针对跨域图中高阶联通性偏差的公平性假设,并提出了采用频谱图卷积网络来学习表示的方案。
  2. 作者提出了学习用户”域无关”表示的方法,来解决领域间用户行为差异所带来的偏差。

简单读后感

通过简单地阅读分析,个人认为该论文假设的域自适应问题,应该普遍存在于使用user-item跨域图来表示近邻关系的GNN-based跨域方案中。这种来自于跨域图高阶连通关系的偏置,确实可能会影响对user生成混合跨域rank list的公平性,是一个新的跨域推荐里的公平性偏差。
该文章提供的谱卷积方法,是提供了相关代码的,但其实为什么用频域来过滤跨域图可以使学出的表示中包含高阶连通性,作者在方法部分以外的地方解释的是不太多的。由于我还没有精读公式部分,所以尚未完全理解高阶连通性是如何被基于数学方法改进的GCN所考虑到的。
另一方面作者还探讨了,由于域间行为差异大而导致的偏差,他提出了一种将单个user来自多个域的representation映射到”域无关空间”中并获得”中性表示”的思路,比较接近于其他域自适应文章中提到的”中性词嵌入”的思路,或许这是一种用于解决公平性问题的通用范式,这种角度在模型构造中可以加以利用,储备起来在未来的工作中使用。

更多信息

如果您通过阅读我的随记,发现本文对您可能有参考价值,请进一步阅读本文原文:

JSCN: Joint Spectral Convolutional Network for Cross Domain Recommendation

本文的作者提供了代码,该仓库在2022-04-15时是可以有效访问的:

https://github.com/JimLiu96/JSCN

Original: https://blog.csdn.net/qq_39381654/article/details/124198317
Author: JinyuZ1996
Title: 【论文泛读】JSCN: Joint Spectral Convolutional Network for Cross Domain Recommendation

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/692233/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球