论文阅读“Augmentation-Free Self-Supervised Learning on Graphs”(AAAI 2022)

2023年5月31日上午8:06 • 人工智能 • 阅读 89

论文标题

Augmentation-Free Self-Supervised Learning on Graphs

论文作者、链接

作者：Lee, Namkyeong and Lee, Junseok and Park, Chanyoung

链接：https://arxiv.org/pdf/2112.02472.pdf

代码：GitHub – Namkyeong/AFGRL: The official source code for “Augmentation-Free Self-Supervised Learning on Graphs” ( https://arxiv.org/abs/2112.02472 )

Introduction逻辑

论文阅读“Augmentation-Free Self-Supervised Learning on Graphs”(AAAI 2022)

自监督学习——自监督中的对比学习——图片中的对比学习——图对比学习——模型表现依靠数据增广的选择，又收到数据增广的超参的影响——本文方法

论文动机&现有工作存在的问题

现有的图对比学习以及图像的对比学习方法往往依赖于数据增广，模型性能直接与选用的数据增广挂钩。

在image上使用的数据增广手法不一定在graph上适用

需要大量负样本

论文核心创新点

不需要数据增广也不需要负样本对

比起生成两个随机的数据增广视图并希望他们保留原视图的语义信息，本文方法将原图视为一个视图，并通过发现原始图中的每个节点，在表示空间中通过k-近邻(k-NN)搜索可以作为正样本的节点，来生成另一个视图。对于这两个语义相关的视图，目标是预测第一个视图中的每个节点在第二个视图中的正节点的潜在表示。然而，基于k-NN搜索的简单地选择正样本来生成另一个视图仍然会改变原始图的语义。

于是本文提出了另一种机制，从k-NN搜索发现的样本中过滤出假阳性样本。两个情况下是正样本：（1）在邻接矩阵中，这是一个目标节点的相邻节点（局部视角）,或（2）与目标节点同属一个簇（全局视角）。

通过数据增广生成可选视图

BGRL 是最近提出的一种学习节点表示的完全非对比方法，受益于BYOL框架，不利用负样本进行学习。BGRL通过手动增强生成一个图的两种不同视图，即节点特征掩蔽和边缘掩蔽。然后两个编码器，即在线和目标编码器，生成给定图形的增强视图对应的嵌入，并使得两个生成的嵌入彼此接近。为了防止表示崩溃成平凡的解，BGRL引入了一种对称打破技术。同样值得注意的是，BGRL有意地考虑了简单的增强技术，以验证在图上应用完全非对比方案的好处。

针对图的增广方法的局限性

在不使用负样本的情况下，本文作者观察到学习到的节点表示的质量依赖于增广方案的选择，并且针对不同的下游任务要设置不同的超参。

基于无数据增广的GRL方法Augmentation-Free GRL (AFGRL )

对于图

中的每一个节点

，根据两个编码器（即在线编码器

和目标编码器

）学习到的节点表示，发现可以作为正样本的节点。这两个编码器根据原始图谱的邻接矩阵

和特征矩阵

初始化，并且计算在线、目标表示：

，其中

的第

行，即

，是第

个节点

的特征表示。对一个给定的查询节点，计算其与其他所有节点的余弦相似性：

即计算在线和目标的特征表示的余弦相似性。给定了相似性信息后，计算每一个节点

的K-近邻的节点集，该集合记作

，可以视为节点

的正样本集。我们希望这K个最近邻点在特征空间属于同一个语义类。

尽管

可以作为节点

的一个合理的正样本候选集合，但（1）它本身是有噪声的，因为我们没有利用任何标签信息，即

包含与查询节点

没有语义关联的样本。此外，如果只考虑表示空间中的最近邻居，可能会忽略（2）图的结构信息，即关系归纳偏差，也可能忽略（3）图的全局语义信息。

为了解决这些局限性，本文引入了一种机制，从K-NN搜索发现的样本中过滤出假阳性，同时也捕获图的局部结构信息和全局语义。

捕获局部结构信息

上文中提到希望K-NN的近邻点都同属于一个类，为了验证预期是否成立，对两个数据集进行分析，即如下图所示，使用的Amazon Computers和WikiCS数据集

首先，从随机初始化的两层GCN中获得节点嵌入，即

，然后对嵌入

进行k-NN搜索。然后对每一个点计算该点与其近邻所属于同一个标签的概率。在上图中，我们观察到，虽然在只考虑少量邻居时，例如k = 4，刚刚的同属一个标签的概率很高，但在两个数据集中，随着k的增大，该比例下降。这意味着，期望在一定程度上是成立的，但仍然存在噪声。

本文为了去除k-NN中的假阳性样本点，利用了节点的局部信息。对于每一个节点

，其邻接点

应倾向于与其使用同一个标签。在图3中，在两个数据集中，相邻节点与查询节点具有相同标签的比例(Adj)约为70%，这证明了平滑性假设的有效性。因此，为了捕捉平滑性假设中反映的关系诱导偏差，在滤除噪声最近邻居的假阳性的同时，我们计算最近邻居和相邻节点之间的交集，即

，将新的集合成为

的剧本正样本集。在图3中，局部正样本集随着k值增加一直保持高相关度。

捕获全局的语义信息

本文通过聚类来获得全局的语义信息。目的是发现与某个节点共享全局语义信息的不相邻节点。作者认为，语义相似但不共享边缘的实例可以通过全局视角的集群发现。

对目标特征

做K-means将节点分成K个簇即

，以及

代表

的簇分布，其中

。然后对于与

同属一个簇的节点集合

作为全局下的语义相似点。最后，我们得到了最近邻点与语义相似节点在全局视角下的交集

，并这个并集记为

的全局正样本集。也就是说，在

的最近邻居中，同时与

属于同一簇的节点被认为是全局正邻居点。

因为K-means对初始化的位置敏感，于是，本文做M次的K-means，得到M组簇集合即

，其中

是第

次的聚类结果。然后定义

，其中

代表

的第

次簇分布。

目标函数

同时考虑局部和全局信息，定义对于节点

的 真实正样本集为：

所以全局的目标是减小

对其真实正样本集中的点的余弦距离：

消融实验设计

模型中每一个组件删去的消融

超参消融

一句话总结

首先不依赖数据增广，其次构建真实样本集。

论文好句摘抄（个人向）

（1）Specififi- cally, contrastive methods, which are at the core of self-supervised learning paradigm, aim to build effective representation by pulling semantically similar (positive) pairs to gether and pushing dissimilar (negative) pairs apart.

（2）Although self-supervised contrastive methods have been shown to be effective on various graph-related tasks, they pay little attention to the inherent distinction between images and graphs: while augmentation is well defifined on im ages, it may behave arbitrarily on graphs.

Original: https://blog.csdn.net/qq_43497436/article/details/124531386
Author: 不吃香菜的zbw
Title: 论文阅读“Augmentation-Free Self-Supervised Learning on Graphs”(AAAI 2022)

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/549944/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

深度学习基础22（数值稳定性）

数值稳定性和模型初始化初始化方案的选择在神经网络学习中起着举足轻重的作用，它对保持数值稳定性至关重要。此外，这些初始化方案的选择可以与非线性激活函数的选择有趣的结合在一起…

人工智能 2023年7月14日
0090
KNN分类模型

KNN分类模型目录 KNN分类模型 * 1.概念 2.寻找最优k值 3.knn案例 4.knn取值问题 – 4.1学习曲线&交叉验证选取k值 4.2 K折交叉…

人工智能 2023年7月1日
00117
深度学习论文精读[7]：nnUNet

相较于常规的自然图像，以UNet为代表的编解码网络在医学图像分割中应用更为广泛。常见的各类医学成像方式，包括计算机断层扫描（Computed Tomography, CT）、核磁共…

人工智能 2023年6月23日
0071
爆肝5万字❤️Open3D 点云数据处理基础（Python版）

Open3D 点云数据处理基础（Python版）文章目录 * – 1 概述 – 2 安装 – + 2.1 PyCharm 与 Python 安…

人工智能 2023年7月3日
0096
【 ubuntu18.04下opencv_contrib安装采坑记录】

本机环境 ubuntu18.04+opencv-3.4.14+opencv_contrib-3.4.14 采坑记录 1. 缺失 boostdesc 和 vgg_generated …

人工智能 2023年7月20日
0049
数据分析一、 pandas库基础知识

pandas库基础知识一、jupyter 代码编辑器概述：Python 数据分析库介绍二、pandas 库基础知识 * （1）常用的Series属性与方法：（2） Data…

人工智能 2023年7月6日
0070
java计算机毕业设计vue开发一个简单音乐播放器源码+mysql数据库+系统+lw文档+部署

本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：idea eclipse 前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAV…

人工智能 2023年6月27日
0069
第六章使用 matplotlib 绘制热力图

系列文章目录第一章使用 matplotlib 绘制折线图第二章使用 matplotlib 绘制条形图第三章使用 matplotlib 绘制直方图第四章使用 matplot…

人工智能 2023年7月4日
0087
每日10行代码165：认识pandas中的DataFrame 数据结构2——DateFrame中的定位

接上一章能创建DateFrame后，自然会关注怎么从DateFrame中取到数据。首先可以用字典的方式： In [73]: frame2 Out[73]: year state p…

人工智能 2023年7月8日
0070
NLP系列之情感分析“五法”

在机器学习中情感分析的5种方法情感分析：用于确定给定文本的情感或观点。情感分析模型可以通过从自然语言中提取意义并将其分配分数来预测给定文本数据是正的、负的还是中性的。现介绍开…

人工智能 2023年5月30日
0067
Python爬虫：为什么你爬取不到网页数据

前言：之前小编写了一篇关于爬虫为什么爬取不到数据文章（文章链接为：https://liuze.blog.csdn.net/article/details/105965562），但…

人工智能 2023年7月5日
0084
win10系统mmdetection训练部署fasterrcnn的全过程

环境搭建首先拷贝之前搭建好的fasterrcnn环境，具体见https://blog.csdn.net/yuanjiaqi_k/article/details/125599570…

人工智能 2023年7月9日
0086
YOLOv5(6.1)安卓端部署记录

分享一下yolov5自己的模型部署到安卓端的踩坑记录，这里跳过yolov5训练部分（这部分网上很多教程），直接说重点。训练得到的为.PT模型，要部署到安卓端首先要转换为onnx模型…

人工智能 2023年6月17日
00122
Python实现导弹自动追踪

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月30日
0049
Aspect-based Sentiment Analysis with Type-aware Graph Convolutional Networks and Layer Ensemble 阅读笔记

1.Introducton 本文是2021年会议NAACL上的一篇文章。在这篇文章中，作者提出了一种具有多层结构的类型感知图卷积神经网络模型（T-GCN）。 2.Model 2.1…

人工智能 2023年5月28日
0063
cuda10.1+cudnn7.6.0+pytorch1.4+tensorflow2.2.0

最近在搭深度学习的环境，在网上看了许多教程，经过多次尝试之后，最后总算成功将pytorch和tensorflow的GPU版成功安装好。在安装cuda和cudnn之前，先确定想要安…

人工智能 2023年5月25日
0082

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31