图机器学习——5.10 图神经网络：预测任务

2023年6月16日上午9:10 • 人工智能 • 阅读 81

首先回顾一下整个GNN的结构，前面我们所介绍的都是红色框内所解决的任务。

最终得到的节点嵌入结果，是一个关于每个在L L L层节点嵌入的集合：

{ h v ( L ) , ∀ v ∈ G } \left{\mathbf{h}_{v}^{(L)}, \forall v \in G\right}{h v (L ),∀v ∈G }

下面来我们来介绍图网络里，蓝色框中的预测任务（prediction head），其中包括：节点水平、边水平、图水平的三种预测：

; ① 节点水平预测

节点水平的预测我们可以直接采用最终的嵌入结果。也可以再进行一个线性变换最终得到所需要的结果。这里假设在经过 GNN 的计算后，我们可以得到一个 d d d 维的嵌入向量：{ h v ( L ) ∈ R d , ∀ v ∈ G } \left{\mathbf{h}_{v}^{(L)} \in \mathbb{R}^{d}, \forall v \in G\right}{h v (L )∈R d ,∀v ∈G }。

假设我们需要的实际结果是 k k k 个目标的（可以为 k k k 维的分类问题；或者是 k k k 个目标的回归问题），那么最终的预测结果如下：

y ^ v = Head ⁡ node ( h v ( L ) ) = W ( H ) h v ( L ) \widehat{y}{v}=\operatorname{Head}{\text {node }}\left(\mathbf{h}{v}^{(L)}\right)=\mathbf{W}^{(H)} \mathbf{h}{v}^{(L)}y v =H e a d node (h v (L ))=W (H )h v (L )

其中 W ( H ) ∈ R k ∗ d \mathbf{W}^{(H)} \in \mathbb{R}^{k * d}W (H )∈R k ∗d，为权重矩阵。

② 边水平预测

假设边水平的预测也同样需要输出k k k个预测结果，需要预测u , v u, v u ,v两个节点之间的边嵌入结果。

预测公式如下：

y ^ u v = Head ⁡ edge ( h u ( L ) , h v ( L ) ) \widehat{\boldsymbol{y}}{u v}=\operatorname{Head}{\text {edge }}\left(\mathbf{h}{u}^{(L)}, \mathbf{h}{v}^{(L)}\right)y u v =H e a d edge (h u (L ),h v (L ))

*方式一：拼接+线性变换

这种方式之前在 attention 机制中出现过：

具体操作方式是先拼接，再进行线性变换。

y ^ u v = Linear ⁡ ( Concat ⁡ ( h u ( L ) , h v ( L ) ) ) \widehat{\boldsymbol{y}}{u v}=\operatorname{Linear}\left(\operatorname{Concat}\left(\mathbf{h}{u}^{(L)}, \mathbf{h}_{v}^{(L)}\right)\right)y u v =L i n e a r (C o n c a t (h u (L ),h v (L )))

*方式二：内积

要求输出的边嵌入为一维时，可以直接通过如下内积方式得到：

y ^ u v = ( h u ( L ) ) T h v ( L ) \widehat{y}{u v}=\left(\mathbf{h}{u}^{(L)}\right)^{T} \mathbf{h}_{v}^{(L)}y u v =(h u (L ))T h v (L )

要求为k k k维时，参考多头注意力机制，构建一系列可训练的权重矩阵：W ( 1 ) , … , W ( k ) \mathbf{W}^{(1)}, \ldots, \mathbf{W}^{(k)}W (1 ),…,W (k )。具体k k k个维度的构造如下：

y ^ u v ( 1 ) = ( h u ( L ) ) T W ( 1 ) h v ( L ) y ^ u v ( k ) = ( h u ( L ) ) T W ( k ) h v ( L ) y ^ u v = Concat ⁡ ( y ^ u v ( 1 ) , … , y ^ u v ( k ) ) ∈ R k \begin{gathered} \widehat{y}{u v}^{(1)}=\left(\mathbf{h}{u}^{(L)}\right)^{T} \mathbf{W}^{(1)} \mathbf{h}{v}^{(L)} \ \widehat{y}{u v}^{(k)}=\left(\mathbf{h}{u}^{(L)}\right)^{T} \mathbf{W}^{(k)} \mathbf{h}{v}^{(L)} \ \widehat{\boldsymbol{y}}{u v}=\operatorname{Concat}\left(\widehat{y}{u v}^{(1)}, \ldots, \widehat{y}_{u v}^{(k)}\right) \in \mathbb{R}^{k} \end{gathered}y u v (1 )=(h u (L ))T W (1 )h v (L )y u v (k )=(h u (L ))T W (k )h v (L )y u v =C o n c a t (y u v (1 ),…,y u v (k ))∈R k

; ③ 图水平预测

图水平的预测其实非常类似GNN中的聚合操作：

y ^ G = AGG ⁡ ( { h v ( L ) ∈ R d , ∀ v ∈ G } ) \widehat{\boldsymbol{y}}{G} = \operatorname{AGG}\left( \left{\mathbf{h}{v}^{(L)} \in \mathbb{R}^{d}, \forall v \in G\right}\right)y G =A G G ({h v (L )∈R d ,∀v ∈G })

其中的 AGG ⁡ \operatorname{AGG}A G G 可以为 Mean ⁡ , Max ⁡ , Sum ⁡ \operatorname{Mean}, \operatorname{Max}, \operatorname{Sum}M e a n ,M a x ,S u m 等。

但这样的嵌入可能会损失一些信息，特别是针对一些比较大的图结构时。例如两个完全不同的图，节点嵌入分别为：
G 1 : { − 1 , − 2 , 0 , 1 , 2 } G_{1}:{-1,-2,0,1,2}G 1 :{−1 ,−2 ,0 ,1 ,2 }
G 2 : { − 10 , − 20 , 0 , 10 , 20 } G_{2}:{-10,-20,0,10,20}G 2 :{−1 0 ,−2 0 ,0 ,1 0 ,2 0 }

如果聚合函数选择为Sum ⁡ \operatorname{Sum}S u m时，图嵌入为：
G 1 : y ^ G = Sum ⁡ ( { − 1 , − 2 , 0 , 1 , 2 } ) = 0 G_{1}: \hat{y}{G}=\operatorname{Sum}({-1,-2,0,1,2})=0 G 1 :y ^G =S u m ({−1 ,−2 ,0 ,1 ,2 })=0
G 2 : y ^ G = Sum ⁡ ( { − 10 , − 20 , 0 , 10 , 20 } ) = 0 G{2}: \hat{y}_{G}=\operatorname{Sum}({-10,-20,0,10,20})=0 G 2 :y ^G =S u m ({−1 0 ,−2 0 ,0 ,1 0 ,2 0 })=0

两者结果完全一致。因此我们考虑一种层级全局池化方法（hierarchical global pooling），进行聚合操作，得到最终的图嵌入。

我们的GNN网络分别用于两种操作，第一种就是前面介绍的节点嵌入。第二种就是构建一个聚类网络，对原始网络中的每个节点进行聚类，而后在根据层级聚类结果进行一层一层的池化聚合操作，最终得到我们需要的整个图的嵌入结果。整个流程如下：

以前面的方法举例，假设我们根据 G 1 , G 2 G_{1}, G_{2}G 1 ,G 2 由五个节点组成的图最终被聚成了两类（前两个节点一类，后两个节点一类），那么我们逐层进行聚合：

G 1 G_{1}G 1 的节点嵌入：{ − 1 , − 2 , 0 , 1 , 2 } {-1,-2,0,1,2}{−1 ,−2 ,0 ,1 ,2 }
第一轮： y ^ a = ReLU ⁡ ( Sum ⁡ ( { − 1 , − 2 } ) ) = 0 , y ^ b = ReLU ⁡ ( Sum ⁡ ( { 0 , 1 , 2 } ) ) = 3 第二轮： y ^ G = ReLU ⁡ ( Sum ⁡ ( { y a , y b } ) ) = 3 \begin{aligned} &\text { 第一轮：} \hat{y}{a}=\operatorname{ReLU}(\operatorname{Sum}({-1,-2}))=0, \quad \hat{y}{b}= \operatorname{ReLU}(\operatorname{Sum}({0,1,2}))=3 \ &\text { 第二轮：} \hat{y}{G}=\operatorname{ReLU}\left(\operatorname{Sum}\left(\left{y{a}, y_{b}\right}\right)\right)=3 \end{aligned}第一轮：y ^a =R e L U (S u m ({−1 ,−2 }))=0 ,y ^b =R e L U (S u m ({0 ,1 ,2 }))=3 第二轮：y ^G =R e L U (S u m ({y a ,y b }))=3
G 2 G_{2}G 2 的节点嵌入：{ − 10 , − 20 , 0 , 10 , 20 } {-10,-20,0,10,20}{−1 0 ,−2 0 ,0 ,1 0 ,2 0 }
第一轮： y ^ a = ReLU ⁡ ( Sum ⁡ ( { − 10 , − 20 } ) ) = 0 , y ^ b = ReLU ⁡ ( Sum ⁡ ( { 0 , 10 , 20 } ) ) = 30 第二轮： y ^ G = ReLU ⁡ ( Sum ⁡ ( { y a , y b } ) ) = 30 \begin{aligned} &\text { 第一轮：} \hat{y}{a}=\operatorname{ReLU}(\operatorname{Sum}({-10,-20}))=0, \quad \hat{y}{b}= \operatorname{ReLU}(\operatorname{Sum}({0,10,20}))=30 \ &\text { 第二轮：} \hat{y}{G}=\operatorname{ReLU}\left(\operatorname{Sum}\left(\left{y{a}, y_{b}\right}\right)\right)=30 \end{aligned}第一轮：y ^a =R e L U (S u m ({−1 0 ,−2 0 }))=0 ,y ^b =R e L U (S u m ({0 ,1 0 ,2 0 }))=3 0 第二轮：y ^G =R e L U (S u m ({y a ,y b }))=3 0

两个图会得到不一样的结果，因此这种方式是能够有效区分这种情形。

Original: https://blog.csdn.net/weixin_41929524/article/details/124931093
Author: Kanny广小隶
Title: 图机器学习——5.10 图神经网络：预测任务

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/622925/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

PRML 概率分布

本文地址：https://www.cnblogs.com/faranten/p/15917369.html转载请注明作者与出处 1 二元变量 1.1 伯努利分布与二项分布考虑…

人工智能 2023年6月4日
0061
实验八 Pandas统计分析基础（任务三）

任务3 从excel文件foods.xlsx读取数据，并将ID列作为索引。程序代码如下 import pandas as pd foods = pd.read_excel(‘D:…

人工智能 2023年7月8日
0054
OpenCV下载、安装以及使用

一、安装Visual Studio OpenCV是一种开源的计算机视觉开发库。既然是开发库，那么必须依托某种语言程序来加载。以C++为例，在安装OpenCV之前，必须安装C++的程…

人工智能 2023年7月25日
0086
泛化nerf系列：pixelNeRF 一种基于NeRF的多视角三维重建网络

1摘要文中提出了一种新的学习框架PixelNeRF，针对的是原本NeRF的不足。即现有的构建神经辐射场的方法往往需要大量的已知观察视角的图片作为输入并且需要花费大量的训练时间。P…

人工智能 2023年6月25日
0074
MATLAB保存数据的几种方式

在利用MATLAB进行数据处理和科研学习的时候经常需要将数据保存下来，软件本身有几种保存方式。由于经常忘记，所以这里总结和整理下来，一是提醒自己，二是若能对他人有一丁点帮助，那也是…

人工智能 2023年6月17日
001.4K
数学建模 – K-means聚类

; 解决问题将样本划分为由类似的对象组成的多个类的过程（聚类）。聚类后，可以更加准确的在每个类中单独使用统计模型进行估计、分析或预测；也可以探究不同类之间的相关性和主要差异。（K…

人工智能 2023年6月16日
00103
深度学习——（7）分类任务

深度学习——（7）分类任务文章目录深度学习——（7）分类任务 * 1. 学习目的 2. 上代码 – + 2.1 下载数据集 2.2 加载数据 2.3 简单查看数据，…

人工智能 2023年7月2日
0067
numpy 数组中的轴 axis

numpy 数组中的轴 numpy有很多维度的数组，一维数组，二维数组，三维数组……n维数组，我们生活的是一个三维世界，因此，在这里就只讨论一维数组，二维…

人工智能 2023年7月16日
0065
【语义分割】类别不平衡损失函数合集

在语义分割领域，我们会常常遇到类别不平衡的问题。比如要分割的目标（前景）可能只占图像的一小部分，因此负样本的比重很大，导致网络倾向于将所有样本判断为负样本。本文介绍了在数据不平衡时…

人工智能 2023年7月27日
0055
读文献—机器学习应用到网络流量分类综述

我爱读文献 review of machine learning techniques for network traffic classification Sharma N, A…

人工智能 2023年7月2日
0071
机器学习实用代码汇总（你想要的这里都有）

机器学习实用代码汇总（你想要的这里都有）文章目录机器学习实用代码汇总（你想要的这里都有）前言一、数据导入 * 1.数据文件读取 2.提取特征和标签 3.数据分布及关系图（P…

人工智能 2023年7月3日
00143
tensorflow-gpu2.X版本安装详解

对应版本官网在安装tensorflow-gpu版本之前，需要安装cuda和cudnn。对应版本可以在官网中寻找，我也把图放在下面了。 ; 2. tensorflow-gpu安装c…

人工智能 2023年5月25日
0097
kmeans聚类分析结果怎么看_【Stata与机器学习】物以类聚-KMeans算法应用案例介绍…

古语有云：物以类聚，人以群分。 KMeans是无监督机器学习中的聚类算法中最简单的一种——基于特征对样本进行归为不同的类，很好地阐述了’物以类聚’这句话的精…

人工智能 2023年6月3日
0073
AI 音辨世界：艺术小白的我，靠这个AI模型，速识音乐流派选择音乐

💡 作者：韩信子@ShowMeAI📘 数据分析实战系列：https://www.showmeai.tech/tutorials/40📘 机器学习实战系列：https://www.s…

人工智能 2023年7月17日
0098
【GPU】Nvidia CUDA 编程高级教程——利用蒙特卡罗法求解的近似值

博主未授权任何人或组织机构转载博主任何原创文章，感谢各位对原创的支持！博主链接本人就职于国际知名终端厂商，负责modem芯片研发。在5G早期负责终端数据业务层、核心网相关的开发工…

人工智能 2023年6月30日
0089
再战ArcaeaB30生成器：Python模块PIL实战图像处理与拼接

书接上回ArcaeaB30录入和导出：Python简单的xlsx、json处理和图片编辑这次是参考上一次经验，经过完全重写的版本的开发笔记。文章目录前言一、数据从哪来？从社区…

人工智能 2023年6月22日
0073

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

图机器学习——5.10 图神经网络：预测任务

; ① 节点水平预测

② 边水平预测

; ③ 图水平预测

大家都在看