【知识图谱系列】解耦Transformation和Propagation的深度图神经网络

2023年6月10日上午3:33 • 人工智能 • 阅读 85

作者：CHEONG
公众号：AI机器学习与知识图谱
研究方向：自然语言处理与知识图谱

本文介绍一篇解耦合Transformation和Propagation操作的自适应深度图神经网络模型DAGNN（KDD 2020），介绍DAGNN模型核心点和模型思路，完整汇报ppt获取请关注公众号回复关键字： DAGNN

一、Motivation

1. Over-fitting： 在CNN卷积神经网络中，若CNN网络结构过于复杂过于Deep，且数据量有限的情况下，便会出现Over-fitting问题，Over-fitting就是指模型对于训练数据过度学习，学习到训练数据本身而不是训练数据的规律，导致无法在测试集上准确预测的情况。

2. Over-Smoothing： 在GNN图神经网络中，由于图本身结构上节点与节点之间相互连接的特性，并且图神经网络一般是通过邻域汇聚或随机游走的方式进行表征学习，因此当图网络一旦变深，便会出现Over-Smoothing问题，Over-Smoothing指的是随着图神经网络加深，学习到的节点表征越来越相似，以至于无法区分，模型效果也将大幅下降。且在图网络中一般2 Layers时效果最佳。因此如何在DeepGNN中既能学到更深层次信息又能避免Over-Smoothing显得至关重要。

3. DeepGNN的必要性： 通常对于少标签半监督节点分类任务，或是少特征半监督节点分类任务，DeeperGNN便较为重要，在特征较少时，便想通过多跳传递能学到更多有效信息。

二、 Definition

1. 量化Over-Smoothing指标

首先明确Over-Smoothing是指随着图神经网络变深学习到的节点表征逐渐相似而无法区分。如下公式所示，本文定义用欧几里得距离表示节点i和节点j之间的相似度D(x_i,x_j )，用SVM_i表示节点i和其他所有节点的相似度，而SVM_G表示图中任意两点之间的相似度，作为整个图的是否Over-Smoothing的评估指标。理想状况下，如果图完全Over-Smoothing，则认为图中所有节点表征完全相似，则SVM_G则趋近0。

【知识图谱系列】解耦Transformation和Propagation的深度图神经网络

2. 接下来通过实验看SVM_G指标随着图神经网络层次的加深，如何变化？横坐标代表模型层数，可以看到在模型层数为2层是，Test Accuracy达到最好效果，从3层开始模型效果开始下降。而Smoothness Metric Value SVM_G 随着层数增加因为逐渐Over-Smoothing，所以SVM_G值逐渐减小，最后趋向于一个小且非0的定值。之所以不是趋向0也是因为节点本身特征区别等节点自身因素。

; 三、Method

本文针对Over-Smoothing问题进行理论分析，提出了DAGNN模型，包含两个主要的创新点：

1、 Transformation和 Propagation解耦合：传统GCN模型的Transformation和Propagation操作是交替进行的，DAGNN模型解耦了Transformation和Propagation操作；

2、自适应深度感受野 Adaptive Adjustment：文中提出Over-Smoothing被证明只有当propagation操作时使用非常大的感受野large receptive fields才会影响模型性能，因此本文提出了Deep Adaptive GNN，自适应的从large receptive fields中学习有用的信息。

为了加深对模型的理解，我们先来看一下Transformation和Propagation解耦合的具体含义和操作方式。

1、Transformation操作： Transformation操作指的就是MLP操作，torch.nn.Linear线性映射操作；

2、Propagation操作： Propagation操作指的是图中的邻居节点往中心节点汇聚的操作，最简单的实现方式是AH，A指的是图的邻接矩阵，H指的是图的特征矩阵。

3、传统GCN模型Transformation操作和Propagation操作是耦合在一起交替计算的，口说无凭，直接上代码简单明了。

4、了解了传统GCN模型Transformation和Propagation交替实现的方式，大概也能想一下如果解耦二者便是：先Transformation再Propagation操作，或者先Propagation再Transformation操作，而本文DAGNN模型便是前者，而另一篇论文Grand则是使用的后者，也在DeepGNN取得了很好的效果。

如上图所示展示了DAGNN模型结构，从模型图再理解一下模型的两大创新点实现方式。

1、先看图中虚线上半部分的模型图，将Transformation和Propagation解耦合，初始节点特征X输入后先通过Transformation操作，即MLP得到输出z（官方给的实现代码中是先通过两次MLP操作）；再将z进行k次的Propagation操作；也就是先Transformation操作再Propagation操作；

2、接着看虚线下半部分模型图，自适应选择感受野信息，将Propagation过程得到的中间输出h_i通过一个可学习参数s进行自适应选择每次Propagation输出的h_i，参数s相当于一个Attention权重，可以给每层的h_i赋予一个权值，最终加和后通过softmax函数得到输出x_out

下图是整个DAGNN模型的实现公式，我们从公式角度再来更加深入的理解一下。

X是初始特征，A ̂是归一化的邻接矩阵，A ̂=D ̃^(-1/2) 〖A ̃D ̃〗^(-1/2)，其中D ̃=D+I，A ̃=A+I；先将初始特征X过MLP得到映射后的特征矩阵Z，当前的Z只包含节点本身信息而无结构信息；再和A ̂进行k次的Propagation操作得到H_l，H_l 包含了l层的结构信息；接下来要将所有l层的信息汇聚起来，最简单的方式当然是直接加和或者直接取最后一层信息作为最终输出，但DAGNN模型希望模型能够自适应的学习0-k层信息。

因此引入了可学习参数s，来学习0-k层的权重大小S ̃，再进行有权加和S ̃H，而DAGNN具体实现方式是先将0-k层的表征stack在一起得到H，引入小s参数，通过两步变换得到权重S ̃，最后一步再进行有权加和经过softmax函数得到最终输出X_out

四、Code

1、 DAGNN模型实现思路也很简单，核心代码如下图所示，官网提供代码获取地址：

https://github.com/divelab/DeeperGNN

; 五、Conclusion

1、在Cora、CiteSeer和PubMed三个引文数据上DAGNN模型都获得了最佳的效果。

2、因为是半监督节点分类实验，因此训练集取得标签数目是可控的，本文还采样不同比例标签的训练数据做实验对比，结果显示训练数据中标签越多，实验结果越好。

3、本文将DAGNN模型层数从1-200层均做了实验对比，从图中可以看出，大致在5层时模型取得最优效果，这点说明随着层数叠深，DAGNN模型在一定程度上缓解了Over-Smoothing问题且学到了更多有效信息。但随着5层之后模型效果逐渐下降，这点说明DAGNN模型只是缓解而未完全解决，模型层数过深时仍然会出现Over-Smoothing问题。

六、往期精彩

【知识图谱系列】Over-Smoothing 2020综述

【知识图谱系列】知识图谱的神经符号逻辑推理

【知识图谱系列】知识图谱表示学习综述 | 近30篇优秀论文串讲

【知识图谱系列】探索DeepGNN中Over-Smoothing问题

【知识图谱系列】动态时序知识图谱EvolveGCN

【知识图谱系列】多关系神经网络CompGCN

【面经系列】八位硕博大佬的字节之旅

各大AI研究院共35场NLP算法岗面经奉上

【机器学习系列】机器学习中的两大学派

干货 | Attention注意力机制超全综述

干货 | NLP中的十个预训练模型

干货|一文弄懂机器学习中偏差和方差

FastText原理和文本分类实战，看这一篇就够了

Transformer模型细节理解及Tensorflow实现

GPT,GPT2,Bert,Transformer-XL,XLNet论文阅读速递

机器学习算法篇：最大似然估计证明最小二乘法合理性

Word2vec, Fasttext, Glove, Elmo, Bert, Flair训练词向量教程+数据+源码

汇报完整版ppt可通过关注公众号后回复关键词： DAGNN 来获得，有用就点个赞呗

Original: https://blog.csdn.net/feilong_csdn/article/details/117122149
Author: CHEONG_KG
Title: 【知识图谱系列】解耦Transformation和Propagation的深度图神经网络

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/595186/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

人工智能练习题【含答案】

谓词表示 1(单选题) 命题是可以判断真假的（）正确答案: DA. 祈使句 B. 疑问句 C. 感叹句 D. 陈述句 2(单选题) 李明的父亲是教师，用谓词逻辑可以表示为Teach…

人工智能 2023年7月27日
0043
RASP | 远程Java应用的RASP调试教程

远程Java应用的RASP调试教程介绍 Java RASP是基于Java Agent技术实现的，而Java Agent代码无法独立启动，必须依赖于一个Java运行时程序才能运行。…

人工智能 2023年6月6日
00100
python合并相同索引列表_python如何将两个索引相同的列表的数据合并成一个新列表及绘图注意事项…

在进行测试的过程中，我们的样品数量有很多，但是不同的样品测试完就形成了一个独立的文件，不同样品会形成不同的文件，因此，有时在进行数据处理之前，需要将这些数据列表进行合并统一分析，本…

人工智能 2023年7月8日
0063
感知机算法之Python代码实现

感知机算法之Python代码实现 ; 1.算法简介感知机学习算法原始形式：输入：训练集T输出：w,b感知机模型：f(x)=sign(w·x+b)算法步骤：1.初始化参数w0,b0…

人工智能 2023年7月6日
0056
【论文阅读】【3d目标检测】Voxel Set Transformer: A Set-to-Set Approach to 3D Object Detection from Point Clouds

论文标题：Voxel Set Transformer: A Set-to-Set Approach to 3D Object Detection from Point Clouds…

人工智能 2023年7月9日
0045
对二分查找的重写

import java.util.Arrays; public class BinarySearch { public static void main(String[] args…

人工智能 2023年6月30日
0063
什么是分贝？如何计算声音分贝？一文解析Audition计算方法

前言我们经常谈到声音的分贝数，那么分贝的概念是什么？如何计算音频文件的分贝？ [En] We often talk about the number of decibels of…

人工智能 2023年5月25日
00538
功放的分类

一、A类(甲类)放大器A类(甲类)放大器，是指电流连续地流过所有输出器件的一种放大器。这种放大器，由于避免了器件开关所产生的非线性，只要偏置和动态范围控制得当，仅从失真的角度来看…

人工智能 2023年7月2日
0083
优化算法 | 基于粒子群优化算法的Bp神经网络预测21~22赛季NBA总冠军（附MATLAB代码）

文章目录前言一、数据准备二、基于PSO的Bp神经网络预测 * 1.粒子表达方式 2.目标函数 3.粒子速度和位置的更新三、MATLAB代码四、预测结果五、代码获取方式 …

人工智能 2023年7月14日
00102
使用CycleGAN训练自己制作的数据集，通俗教程，快速上手

总结了使用 CycleGAN训练自己制作的数据集，这里的教程例子主要就是官网给出的斑马变马，马变斑马，两个不同域之间的相互转换。教程中提供了官网给的源码包和我自己调试优化好的源码包…

人工智能 2023年6月26日
0071
如何选择合适的超参数

如何选择合适的超参数在机器学习中，超参数是指在模型训练之前需要人为设定的参数。选择合适的超参数对于机器学习模型的性能和泛化能力至关重要。本文将详细介绍如何选择合适的超参数，包括算…

人工智能 2024年1月6日
0040
【ROS wiki】ros wiki中查阅常见的消息类型

ROS wiki系列文章简介：ROS wiki系列文章是本人ROS专栏下的子专题。该系列文章主要用来介绍：ROS初学者如何利用好ROS官方提供的ROS wiki平台，来查询ROS资…

人工智能 2023年6月10日
0085
Python脚本处理标注文件和音频匹配个数问题

目录引题数据说明代码说明获取脚本关注版权说明引题在语音标注过程中，涉及大量的语音标注，尤其是有多人分工进行时，难免会出现很多不匹配的文件，标注类的文件（通常为.Te…

人工智能 2023年5月23日
0085
Scanpy(六)空间转录组数据的分析与可视化

目录 Reading data QC and preprocessing Manifold embedding and clustering based on transcript…

人工智能 2023年6月15日
0088
二值化最佳阈值选取方法以及matlab实现

文章目录前言一、真彩色图像转换为灰值图像 * 1.转换公式 2.转换过程二、最佳阈值选取方法以及matlab实现 * 1.迭代法 2.双峰法 3.最大类间方差法 4.最大熵阈…

人工智能 2023年6月17日
0092
是否有一种统一的解决方案来避免所有类型的过拟合

问题概述过拟合是机器学习中常见的问题之一，它指的是模型在训练集上表现良好，但在测试集或未知数据上表现较差的现象。为了避免过拟合，常常需要采用一些手段来限制模型的复杂度。本文将介绍…

人工智能 2023年12月30日
0055

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

【知识图谱系列】解耦Transformation和Propagation的深度图神经网络

大家都在看