图神经网络(GNN)简述

2023年6月16日下午1:06 • 人工智能 • 阅读 99

一、什么是图(graph)

二、如何将图片(images)表示成图(graph)

三、在机器学习中使用图(graph)的挑战

四、图神经网络(Graph Neural Network, GNN)

(I). The simplest GNN

(II). 如何做预测

(III).如何将图的结构信息引入GNN

(IV).Learning edge representations

(V). 为什么需要全局图信息

本文主要参考的文章：A Gentle Introduction to Graph Neural Networks-Google Research，里面有很多 可交互的插图，大家可以自行进去试一下。

一、什么是图(graph)

A graph represents the relations (edges) between a collection of entities (nodes).

图(graph)就是表示一些 实体(entity)之间关系的一种数据结构，实体在图中用 节点(nodes)表示，它们之间的关系用 边(edges)表示。其中，节点用 V_来表示，边用 E来表示，全局图用 U_来表示，Fig1是一个含有5个节点，6条边的图。

为了进一步描述图，我们在图中各个部分存储一些信息。每个节点用一个长度为n的向量来表示，每条边用长度为m的向量来表示，全局图用长度为t的向量表示，在Fig1中，(n,m,t)=(6,8,5)。

Fig 1.图(graph)所存储的信息

此外，根据边(edges) 是否具备有向性(directed or undirected)将图划分为有向图和无向图。

二、如何将图片(images)表示成图(graph)

在卷积神经网络中，我们将一个RGB图片表示成一个张量(tensor)；在图神经网络中，我们将每一个 像素(pixel)映射为图(graph)中的一个节点， 相邻像素之间视为有连接关系，这种连接关系映射为图(graph)中的一条边，如Fig2所示。这种映射关系可通过一个 邻接矩阵(adjacency matrix)来表示，如Fig2中所示，横轴和纵轴均为像素的标号，两个像素之间存在连接关系时便标为蓝色。 墙裂推荐去A Gentle Introduction to Graph Neural Networks-Google Research里试一下这张图，交互性做的极为惊艳，彩蛋：右边这张图中的节点可以无限拖拽。

Fig 2. 如何将images映射为graph

三、在机器学习中使用图(graph)的挑战

首先要考虑的问题是，如何将表示图(graph)才能让其与神经网络兼容。图的四种属性是非常重要的： 节点(nodes)， 边(edges)， 全局信息(global-context)， 连接性(connectivity)。前三者只要各自采用特征向量的形式就可以与神经网络相兼容了，但是 连接性表征的是哪两个节点之间有连接关系，这用向量并不容易表示。一种想法是用上面提到的邻接矩阵来表示连接性，但是邻接矩阵的大小是节点数×节点数的方阵，当节点数很大的时候会给存储带来麻烦，并且在邻接矩阵中很多节点直接并没有连接关系，是一个稀疏矩阵，那么我们用稀疏矩阵的形式来解决存储问题。但是，稀疏矩阵对于GPU而言难以高效计算。另外，对于邻接矩阵而言，交换行或列不影响对图的表示，即一张图可以有多种邻接矩阵表示，这就要求神经网络在输入同一个图的不同邻接矩阵表示时，必须输出相同的结果。

一种高效表示稀疏矩阵的方法是使用 邻接列表(adjacency list)。如图Fig3所示，该图共有8个节点，为了方便，每个节点用一个标量值进行表示，每条边也用一个标量值表示。邻接列表的长度和边的个数相同，列表中每一个元素表示的是一条边的两个节点的标号。值得注意的是，邻接列表中元素的顺序，与edges中元素的顺序是一致的。

Fig 3. 邻接列表

四、图神经网络(Graph Neural Network, GNN)

A GNN is an optimizable transformation on all attributes of the graph (nodes, edges, global-context) that preserves graph symmetries (permutation invariances).

GNN是一个对图上所有 属性(attributes)进行的一种 可优化的变换，这种变换可以保持图的对称信息，即 排列不变性(permutation invariances)。GNN是一个”graph-in, graph-out“的结构，它会对输入图的属性(nodes, edges, global-context)进行变换，例如用来表示这些属性的向量，但是 唯独不会改变其连接性(connectivity)。

(I). The simplest GNN

对于节点向量、边向量、全局图向量各自构造一个多层感知机（也可以是其他可微分的模型），多层感知机的输入大小和输出大小是一样的。将输入图的属性向量传入对应的MLP，输出得到更新后的属性，如Fig4所示， 输出图相较于输入图仅仅是属性的值被更新，但是图的结构并未发生变化，这就满足了GNN定义中的两个要求。

Fig 4. 最简单的GNN

(II). 如何做预测

以对节点信息进行”二分类”任务为例，将最后一层GNN Layer输出的图中的节点向量传入全连接层，经过全连接层即可输出每个节点的预测结果。

Fig 5. 节点预测二分类任务

You might have information in the graph stored in edges, but no information in nodes, but still need to make predictions on nodes. We need a way to collect information from edges and give them to nodes for prediction. We can do this by pooling.

但是，有一种特殊情况是节点没有向量信息，但是边都具有向量信息，如果仍然要对节点做预测，就要采用一种称为 “汇聚”(pooling)的技术。 _pooling_操作首先将 与该节点相连接的边向量取出，另外还要取 全局图向量，然后对这些向量进行 _sum_操作得到一个新的向量，这个向量作为这个节点的向量信息。注意，这里我们默认节点、边、全局图向量的维度都是相同的，所以可直接进行 _sum_操作，若不相同，需要先 投影变换到节点向量的维度。其实从这一步就可以发现，全局向量类似于一个偏置项。

Fig 6. 汇聚(pooling)操作

综合起来看，对于没有节点信息的二分类任务，其处理流程如下图所示。

Fig 7. 没有节点信息的节点二分类预测（ ρ为 _pooling_操作）

同理，对于有节点信息但没有边信息的图，若要进行边的预测，也是先进行 _pooling_操作，即对边的两个节点向量、全局图向量进行 _sum_操作，即得到该边的向量；对于没有全局图向量的情况，对所有的节点向量进行 _pooling_操作即可得到全局图向量。

Fig8展示了所搭建的最简单的图神经网络进行端到端预测的流程，它有一个明显的弊端——图的属性都是独立进行更新的，且 几乎未涉及到连接性(connectivity)方面的信息，仅仅在pooling操作的时候会涉及到连接性，这会导致 模型不够 leverage 图的信息。

Fig 8. 用GNN进行端到端预测

(III).如何将图的结构信息引入GNN

We could make more sophisticated predictions by using pooling within the GNN layer, in order to make our learned embeddings aware of graph connectivity. We can do this using message passing[18], where neighboring nodes or edges exchange information and influence each other’s updated embeddings.

从上一部分可以看出，”汇聚”(pooling)是可以利用连接性(connectivity)的，那么将 _pooling_的思想 引入到GNN layer中就可以实现更加复杂的预测任务。我们通过采用 “消息传递”(message passing) [1]来实现对连接性的利用，邻节点或邻边交换信息并对属性的更新产生影响。

_message passing_的操作流程如下图所示：首先gather要更新的节点和其邻节点，然后 _sum_得到一个新的节点向量，将这个新的节点向量传入用以更新节点的多层感知机，输出新的节点向量。

Fig 9. _message passing_操作示意图

This is reminiscent of standard convolution: in essence, message passing and convolution are operations to aggregate and process the information of an element’s neighbors in o rder to update the element’s value. In graphs, the element is a node, and in images, the ele ment is a pixel. However, the number of neighboring nodes in a graph can be variable, unl ike in an image where each pixel has a set number of neighboring elements.
By stacking message passing GNN layers together, a node can eventually incorporate information from across the entire graph: after three layers, a node has information about the nodes three steps away from it.

你会发现， message passing 似乎与卷积有异曲同工之妙。_在卷积神经网络中，我们通过卷积核的滑动，对像素进行加权求和，且随着卷积层的叠加， feature map 一个特征点所对应的原图感受野越来越大；在 _message passing_中，我们只进行了求和，可以看成是 _kernel weights_均为1的卷积操作，GNN layer叠加的越多， 最后一层 graph 中一个节点汇聚原graph中的节点越多，这样就完成了较长距离的信息传递过程。另外，CNN中有多输入通道和多输出通道，GNN中对于各个属性各自使用一个多层感知机， 每个多层感知机对应一种”模式”，这样就保留了类似于CNN中通道的信息。这种结构我们称为 Graph Convolutional Layer_，如Fig11所示。

Fig 10. GNN layer叠加使得”感受野”增大

上面的过程可以用下图来简要描述：

Fig 11. 将 _pooling_思想引入GNN layer

(IV).Learning edge representations

这部分没看懂，下面贴一下原文吧，这部分在李沐老师视频36:00有讲。主要的疑惑在于，开头说了是缺失节点信息，但是在第一幅插图里很明显是先对边做pooling，节点信息都没有怎么给边做pooling呢，我不理解。

有一种理解方式是：这里作者写的有歧义，因为本节在建立在message passing的基础上的，所以当边信息缺失时，会间接导致节点信息缺失（因为没法给节点做pooling了），所以要先补全边的信息，就先对边做了pooling，然后补全了边信息后再对节点做pooling，这样就完成了message passing操作。还有一种理解是，这里只是想让节点和边的信息彼此进行传递，因为作者用了”share”这个词。有大佬懂的话给讲一讲。

Our dataset does not always contain all types of information (node, edge, and global context). When we want to make a prediction on nodes, but our dataset only has edge information, we showed above how to use pooling to route information from edges to nodes, but only at the final prediction step of the model. We can share information between nodes and edges within the GNN layer using message passing.
We can incorporate the information from neighboring edges in the same way we used neighboring node information earlier, by first pooling the edge information, transforming it with an update function, and storing it.
However, the node and edge information stored in a graph are not necessarily the same size or shape, so it is not immediately clear how to combine them. One way is to learn a linear mapping from the space of edges to the space of nodes, and vice versa. Alternatively, one may concatenate them together before the update function.

Architecture schematic for Message Passing layer. The first step “prepares” a message composed of information from an edge and it’s connected nodes and then “passes” the message to the node.
Which graph attributes we update and in which order we update them is one design decision when constructing GNNs. We could choose whether to update node embeddings before edge embeddings, or the other way around. This is an open area of research with a variety of solutions– for example we could update in a ‘weave’ fashion where we have four updated representations that get combined into new node and edge representations: node to node (linear), edge to edge (linear), node to edge (edge layer), edge to node (node layer).

(V). 为什么需要全局图信息

在图中彼此距离较远的节点可能永远无法有效地相互传递信息，即使我们多次应用消息传递。对于一个节点，如果我们有 k_层GNN layers，信息最多传播k步。对于预测任务取决于相距较远的节点或节点组的情况，这可能是一个问题。解决这个问题的一个办法是使用图的全局表示（ U），这个有时被称为 master node_，它与网络中的所有节点和边相连，可以作为它们之间传递信息的桥梁，为整个图建立起一个表示。

Original: https://blog.csdn.net/weixin_44808161/article/details/126152908
Author: Taylor不想被展开
Title: 图神经网络(GNN)简述

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/624242/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

基于ssm的学生成绩分析系统maven idea

目录1 绪论 51.1课题背景 51.2 课题研究的意义 51.3 系统实现的功能 51.4 课题研究现状 52系统相关技术 72.1 Java技术 72.2 B/S架构 72…

人工智能 2023年6月26日
0069
qy2音乐格式转换mp3_怎么转化音频格式？常见的音频格式转换方法

这是一款专业的多功能音频格式转换器，支持普通音频格式转换、多音频合并、音频压缩，也支持音频分段。它可以说是一个非常强大的音频转换器。而且软件还支持文件的批量操作，提高了我们的工作效…

人工智能 2023年5月27日
0055
泰坦尼克号乘客获救预测

1. import pandas as pd import seaborn as sns import matplotlib.pyplot as plt from sklearn….

人工智能 2023年7月7日
0070
浅谈深度学习归一化加快模型收敛速度

在训练模型时，我们经常会对数据进行归一化，甚至在隐藏层中也加入归一化。这样做的主要目的是为了加快模型收敛速度。假设特征在经过卷积层后没有经过归一化的数据如下图分布（xx表示数据点）…

人工智能 2023年7月14日
0088
[算法整理]可能是最全的无监督/自监督单目深度估计方法汇总 – Part1:视频序列篇

借着最近开题写开题报告的机会，比较细致地整理了一下之前看过的自监督单目深度估计相关的论文。合计了一下，感觉写篇综述有点太耗时耗力，干脆就在这里分享出来好了。论文列表持续更新中 20…

人工智能 2023年5月26日
00100
【湖仓一体化】存OR算之争？SPL 我都要

在互联网技术飞速发展的今天，数据已经成为了最为宝贵的资源之一。数据的产生、收集和分析，已经成为了科技公司最为重要的一环。到底什么是湖仓一体？它和数据仓库、数据湖的关系是什么？为什么…

人工智能 2023年6月2日
0060
【需特殊处理】如何使用request.post(Python)直接发送数组类型的方式

关于api：如何使用request.post(Python)发送数组？ “值错误：太多值无法解包” | 码农家园 """ 声明…

人工智能 2023年6月28日
0068
机器学习/深度学习实战——kaggle房价预测比赛实战（机器学习回归算法）

文章目录 * – 3. 构建模型 – + 3.1 使用lazyPredict寻找最优拟合算法 + 3.2 超参数调整 + 3.3 Ridge Regress…

人工智能 2023年6月18日
0090
YOLOV5更换轻量级的backbone：mobilenetV2

目录简洁概要：修改主干网络：一：添加自己主干网络二：在yolo.py中添加common中的两个函数三：制作mobilenetv2的yaml配置文件四：制作数据集VOC的…

人工智能 2023年7月26日
0071
Pycharm配置虚拟环境，安装tensorflow-cpu

Pycharm创建虚拟环境并安装tensorflow-cpu （非gpu加速）（1）点击齿轮，然后点击添加（2）确定一个存放的位置，建议在某个地方新建一个文件夹，选择合适的…

人工智能 2023年5月23日
0082
python之 pyCharm pip安装pandas库失败

目录安装报错解决尝试pip3 -—default-time=100 install pandas失败尝试pip -—default-time=100 install pan…

人工智能 2023年7月6日
00112
学1个月爬虫就月赚6000？别被骗了，老师傅告诉你爬虫的真实情况！

这是我前几天看到的一个真实事件，也是我写这篇文章的缘由：前几天有粉丝跟我反馈说，某机构的人跟他说学爬虫1个月就能接单，让这小伙子去报名那个机构的爬虫课程，学完之后1个月就能把60…

人工智能 2023年7月4日
0097
C++进阶-3-4stack容器、queue容器

C++进阶-3-4stack容器、queue容器 C++进阶-3-4stack容器、queue容器 1 #include 2 #include 3 #include 4 using…

人工智能 2023年6月4日
0075
深度学习笔记(十三):IOU、GIOU、DIOU、CIOU、EIOU、Focal EIOU、alpha IOU损失函数分析及Pytorch实现

文章目录 IOU-loss GIOU-loss DIOU-loss CIOU-loss EIOU-loss和Focal EIOU-loss alpha IOU SIOU-loss …

人工智能 2023年7月20日
00424
请查收来自一线数据科学家和大数据工程师的实战经验 | IDP Meetup No.02 回顾

4月16日我们举行了IDP Meetup No.02，邀请到领先互联网企业的一线数据科学家和大数据工程师——腾讯赵喜生和领先金融科技公司李峰，分别从个性化推荐场景和大数据处理的角…

人工智能 2023年7月17日
0053
PointNet代码详细解释(Pytorch版本)

2.1 代码结构思维导图 2.2 代码注释按照代码运行的顺序，先从pointnet.pytorch/scripts/build.sh开始解释： SCRIPT=realpath $…

人工智能 2023年7月20日
0054

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

图神经网络(GNN)简述

一、什么是图(graph)

二、如何将图片(images)表示成图(graph)

三、在机器学习中使用图(graph)的挑战

四、图神经网络(Graph Neural Network, GNN)

(I). The simplest GNN

(II). 如何做预测

(III).如何将图的结构信息引入GNN

(IV).Learning edge representations

(V). 为什么需要全局图信息

大家都在看