【论文泛读】JSCN: Joint Spectral Convolutional Network for Cross Domain Recommendation

2023年7月14日下午2:24 • 人工智能 • 阅读 93

JSCN: Joint Spectral Convolutional Network for Cross Domain Recommendation – 2019 IEEE BigData

本文发在了IEEE BigData 上，虽然非顶会，但其谷歌指数接近IJCNN，并且提供了代码，以借鉴其思路为主，在此分享给大家，具体如下：

论文解决的具体问题和主要假设

这是一篇域自适应相关的文章，也是最近看到的比较有意思的一篇处理文本跨域问题的文章。我在本文共找到两个公平性假设，第一个假设中作者认为域之间存在高阶连通性信息（HOC，high-order connectivity info）会影响到跨域推荐的域兼容性（公平性）。高阶连通性信息指在原本仅关注邻居关系的user-item跨域交互图中进一步关注更深层次的连通关系。因为这里我个人感觉比较有价值，所以解释的详细一点：（例如下面这样一个场景）

【论文泛读】JSCN: Joint Spectral Convolutional Network for Cross Domain Recommendation

作者假设在单个目标域B的user-item二部图中（只关注上图中的绿色部分时），对Item 1和Item 2来说User D与这两个Item是无直接连边的，所以当考虑低阶连通性关系的时候（仅用单层GCN考虑一阶近邻时），对于user D推荐item 1和item 2的机会应该是相似的。但现在我们假设考虑高阶连通性，将任意两点间连边代表1单位距离，此时user D与item 2之间是存在一条item 2–user B–item 3–user C–item 4–user D的高阶连通路径的，那么我们视这条代价为5的路径为userD与item2之间的高阶连通性关系。如此看来，为userD推荐item2的机会应该要更高。但假如是跨域场景，考虑到新的域信息的加入，如蓝色部分，这时候对于item 1，产生了两条新的到达user D的路径：item 1–user A–item 5–user C–item 4–user D and item 1–user A–item 6–user C–item 4–user D，并且都是代价为5的高阶连通性路径，此时是不是更应该给user D 推荐item 1了呢？然而，作者指出现有的基于跨域图使用GCN的跨域推荐方法无论在单域还是跨域都极少关注到高阶近邻关系，所以目前的推荐列表对用户而言是有偏的，是有失公平的。

本文还有第二个与域自适应相关的假设，作者提出如果目标域是user与电影item连接的电影域，而源域是user与服装item连接的服装域，那么它们将彼此不兼容，因为用户的行为差异很大，导致源域中的信息不能直接用于目标域。即作者认为如服装域和电影域这种原本不易解释行为关联性的域之间如果想要跨域，则需要稀释掉行为差异所带来的偏差（这里是我读完本文的推测，作者针对这第二个偏差假设未给出进一步解释，而是给出了一篇引用：

Easing Embedding Learning by Comprehensive Transcription of Heterogeneous Information Networks SIGKDD-2018

我会在稍后对这篇文章进行泛读，根据作者的描述，其中应该着重解释了”不兼容”的意思。

; 论文使用的方法

为了解决第一个问题，即捕捉跨域图中的高阶连通性信息，作者借助数学上的谱图论（spectral graph theory）将跨域图转换为频域（frequency domain），在频域当中根据图的拉普拉斯特征向量，使用傅里叶变换以提取图的综合连通性信息（单域和跨域的高阶连通性信息）。而转换后的频谱表示通过频谱图卷积网络实现（网络结构未精读），该网络首先随机初始化输入图中的users和items作为输入，然后经过K层GCN学习到user和item的频谱表示向量（不出所料还是通过K值作为超参数来调节GCN层数进而调节高阶的程度）。
随后，为了解决第二个问题，作者将GCN输出的不同域的user的表示向量通过一个映射函数映射到”域无关”的表示空间中，最后对空间中每一个user的来自多个域的表示，采取最小化它们之间的距离的方法得到每个用户最终的”域无关”向量表示，以此来稀释不同域间因行为差异所带来的偏差。当需要用的时候，就将”域无关”空间中的用户表示映射到对应的域上，联合该域中的item表示来生成该域的推荐结果。

本文的主要贡献

本文首次提出了针对跨域图中高阶联通性偏差的公平性假设，并提出了采用频谱图卷积网络来学习表示的方案。
作者提出了学习用户”域无关”表示的方法，来解决领域间用户行为差异所带来的偏差。

简单读后感

通过简单地阅读分析，个人认为该论文假设的域自适应问题，应该普遍存在于使用user-item跨域图来表示近邻关系的GNN-based跨域方案中。这种来自于跨域图高阶连通关系的偏置，确实可能会影响对user生成混合跨域rank list的公平性，是一个新的跨域推荐里的公平性偏差。
该文章提供的谱卷积方法，是提供了相关代码的，但其实为什么用频域来过滤跨域图可以使学出的表示中包含高阶连通性，作者在方法部分以外的地方解释的是不太多的。由于我还没有精读公式部分，所以尚未完全理解高阶连通性是如何被基于数学方法改进的GCN所考虑到的。
另一方面作者还探讨了，由于域间行为差异大而导致的偏差，他提出了一种将单个user来自多个域的representation映射到”域无关空间”中并获得”中性表示”的思路，比较接近于其他域自适应文章中提到的”中性词嵌入”的思路，或许这是一种用于解决公平性问题的通用范式，这种角度在模型构造中可以加以利用，储备起来在未来的工作中使用。

更多信息

如果您通过阅读我的随记，发现本文对您可能有参考价值，请进一步阅读本文原文：

JSCN: Joint Spectral Convolutional Network for Cross Domain Recommendation

本文的作者提供了代码，该仓库在2022-04-15时是可以有效访问的：

https://github.com/JimLiu96/JSCN

Original: https://blog.csdn.net/qq_39381654/article/details/124198317
Author: JinyuZ1996
Title: 【论文泛读】JSCN: Joint Spectral Convolutional Network for Cross Domain Recommendation

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/692233/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

PyTorch 使用GPU训练

Pytorch 使用GPU训练使用 GPU 训练只需要在原来的代码中修改几处就可以了。我们有两种方式实现代码在 GPU 上进行训练方法一 .cuda() 我们可以通过对网络模…

人工智能 2023年7月4日
0084
❤️pandas df.loc[] 与 df.iloc[] 详解及其区别，建议收藏❤️

文章目录思维导图一、df.loc[]与df.iloc[]区别二、df.loc[]详解 * df.loc[] 允许输入三、df.iloc[]详解 * df.iloc[] 允许…

人工智能 2023年7月6日
00101
每天五分钟机器学习：神经网络比逻辑回归强大的本质

本文重点：本文就是想讲清楚两点：第一点是神经网络如何进行计算的，这个计算就叫做前向传播。第二点是神经网络可以理解为逻辑回归，它和逻辑回归不同的是，逻辑回归是直接使用样本x，…

人工智能 2023年6月16日
0070
apply、applymap、transform、agg在dataframe中的用法

文章目录 * – + apply() + map() + applymap() + transform() + agg() apply() dataframe的appl…

人工智能 2023年7月7日
0070
图像分类、目标检测、图像分割—-简介

（1）MNIST：10个类别，手写数字体数据集，6万条训练数据和1万条测试数据，28*28的灰度图；（2）FashionMNIST：10个类别，6万条训练数据和1万条测试数据，2…

人工智能 2023年7月2日
0074
YOLOv5训练coco128数据集流程

一、安装pytorch 1、创建虚拟环境使用Anaconda安装，建议先创建一个虚拟环境。启动Anaconda Prompt，在命令行输入： conda create -name…

人工智能 2023年7月22日
0052
机器学习算法介绍-拔草ChatGPT

最近ChatGPT（https://chat.openai.com）特别火，笔者也借此机会尝鲜了一波。ChatGPT是一个一个大型语言模型，它的功能是回答用户提出的问题。它可以回答…

人工智能 2023年7月31日
0057
全新中国交通标志检测数据集2021—CCTSDB 2021: A More Comprehensive Traffic SignDetection Benchmark（全新分类-多算法测评）

CCTSDB 2021 重磅发布！全新数据集！全新分类！多种算法测评！欢迎大家使用！数据集发布网址：GitHub – csust7zhangjm/CCTSDB20…

人工智能 2023年6月17日
0065
一文搞懂如何在VS中使用OpenCV

下载OpenCV并在VS2019上进行配置 1.进入OpenCV官网选择想要的版本进行下载 https://opencv.org/releases/ 点击对应的应用场景即可…

人工智能 2023年7月27日
0065
基于遗传算法、元胞自动机邻域和随机重启爬山混合优化算法（GA-RRHC）的柔性车间调度研究（Matlab代码实现）

💥💥💞💞 欢迎来到本博客❤️❤️💥💥 🏆博主优势： 🌞🌞🌞博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。 ⛳️ 座右铭：行百里者，半于九十。目录💥1 概述📚2 运行结果🎉3 参…

人工智能 2023年6月26日
0080
【深度学习】注意力机制

注意力机制之前接触到的seq2seq模型当中，解码器只依赖编码器最后一个时间步的隐藏状态作为解码器自身的初始隐藏状态。这个隐藏状态融合了所有输入序列的信息。注意力机制的提出与一…

人工智能 2023年5月28日
0094
BERT深入浅出｜用代码说话

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月28日
0076
数据项目总结 – 租房数据分析（完整篇）

Datawhale干货作者：皮钱超，厦门大学，Datawhale成员深圳租房数据分析完整篇从2020年11月发表第一篇深圳租房数据分析的文章，到这篇基于深度学习框架Keras…

人工智能 2023年7月27日
0074
[kaggle] House-price（房价预测）中的代码

*pandas.DataFrame.dtypes 用法： df.dtypes，返回一个 Series（sereies的index是DF每一列的名字，value是每一列的dtype）…

人工智能 2023年7月7日
0067
分类模型评估指标选择、局限、优势

禁止转载，谢谢！分类模型作为使用场景最为广泛的机器学习模型，常用的二分类模型的模型评估指标有准确率（Accuracy），召回率（Recall）、F1指标（F1-Score）、受试…

人工智能 2023年7月2日
00111
你给文字描述，AI艺术作画，精美无比！附源码，快来试试！

💡 作者：韩信子@ShowMeAI📘 深度学习实战系列：https://www.showmeai.tech/tutorials/42📘 TensorFlow 实战系列：https:…

人工智能 2023年6月16日
0071

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31