图神经网络在节点分类任务中如何进行训练和预测

2024年1月6日下午1:14 • 人工智能 • 阅读 51

问题背景和介绍

在图神经网络（Graph Neural Networks）中，节点分类任务是其中一个常见的任务。节点分类任务是指给定一个图，每个节点都有一个标签值，我们的目标是通过训练模型来预测未知节点的标签值。本文将详细介绍如何使用图神经网络进行节点分类任务的训练和预测。

算法原理

图神经网络使用图的结构和节点特征来进行节点分类。它通过聚合节点邻居的信息来丰富每个节点的特征表示。下面是图神经网络的算法原理。

输入：给定一个图 $G=(V, E)$，其中 $V$ 是节点集合，$E$ 是边集合。每个节点 $v$ 都有一个 $d$ 维的特征向量 $x_v\in \mathbb{R}^d$。
初始化：为每个节点 $v$ 分配一个初始的特征向量 $h_v^{(0)} = x_v$。
更新节点特征向量：对于每个节点 $v$，将其邻居节点的特征向量进行聚合，并更新节点 $v$ 的特征向量。
聚合函数：选择合适的聚合函数（如加和、平均、最大池化等），计算节点 $v$ 邻居节点的聚合特征向量 $a_v$。
更新函数：使用更新函数 $f$ 来更新节点特征向量 $h_v^{(t+1)}$，即 $h_v^{(t+1)} = f(h_v^{(t)}, a_v)$。
迭代更新：重复步骤 3-5 直到达到一定的迭代次数或特定的收敛条件。
输出：最后得到每个节点 $v$ 的最终特征向量 $h_v$，并使用这些特征向量来进行节点分类。

具体算法推导

为了更好地理解和推导图神经网络的具体算法，我们将介绍其中一种常见的图神经网络模型：Graph Convolutional Networks（GCN）。GCN使用邻接矩阵来聚合邻居节点的信息，并通过多层的卷积操作来更新节点特征向量。

GCN 聚合函数推导

GCN 使用邻接矩阵 $A$（$N\times N$ 维矩阵）来表示节点之间的连接关系，其中 $N$ 是节点数量。对于节点 $v$ 来说，其邻居节点集合为 $N_v$。我们可以通过邻接矩阵 $A$ 来获取节点 $v$ 的邻居节点特征向量的加权和。具体来说，节点 $v$ 的邻居节点特征向量加权和为：

$$a_v = \sum_{u\in N_v} \frac{1}{\sqrt{|N_v||N_u|}} h_u$$

其中 $h_u$ 是节点 $u$ 的特征向量，$|N_v|$ 表示节点 $v$ 的邻居数量。

GCN 更新函数推导

GCN 使用一个简单的更新函数来将节点 $v$ 的特征向量与聚合特征向量 $a_v$ 结合起来。更新函数将两个特征向量拼接在一起，并通过一个权重矩阵 $W$ 进行线性变换，然后通过非线性激活函数 $ReLU(\cdot)$ 来得到最终的特征向量。具体的更新函数为：

$$h_v^{(t+1)} = \text{ReLU}(W \cdot h_v^{(t)} + W \cdot a_v)$$

其中 $W$ 是一个可学习的参数矩阵。

计算步骤

接下来，我们将介绍使用 GCN 进行节点分类任务的计算步骤。

输入数据准备：准备好图的邻接矩阵 $A$ 和节点特征矩阵 $X$，其中 $A$ 是一个 $N\times N$ 维矩阵，$X$ 是一个 $N\times d$ 维矩阵，$N$ 是节点数量，$d$ 是特征维度。
初始化：为每个节点 $v$ 分配一个初始的特征向量 $h_v^{(0)} = x_v$。
GCN 迭代更新：重复以下步骤 $T$ 次，其中 $T$ 是迭代次数：
聚合邻居特征：计算聚合特征矩阵 $A_h$，其中第 $i$ 行对应节点 $v_i$ 的聚合特征向量 $a_{v_i}$。
更新节点特征：使用更新函数 $f$，计算下一轮迭代的节点特征矩阵 $H^{(t+1)}$，其中第 $i$ 行对应节点 $v_i$ 的特征向量 $h_{v_i}^{(t+1)}$。
节点分类任务：使用最终的节点特征矩阵 $H$ 进行节点分类。可以使用任何分类器来训练和预测节点的标签。

Python 代码示例

下面是一个使用 PyTorch 实现的完整的 GCN 模型的 Python 代码示例。在此示例中，我们仅包括了 GCN 的核心部分，实际的数据准备和节点分类部分可能有所不同，并根据实际情况进行调整。

首先，我们需要导入必要的库，并定义 GCN 模型的核心类：

import torch
import torch.nn as nn
import torch.nn.functional as F

class GCN(nn.Module):
 def __init__(self, input_dim, hidden_dim, output_dim):
 super(GCN, self).__init__()
 self.fc1 = nn.Linear(input_dim, hidden_dim)
 self.fc2 = nn.Linear(hidden_dim, output_dim)

 def forward(self, A, X):
 H = F.relu(self.fc1(torch.matmul(A, X)))
 H = self.fc2(torch.matmul(A, H))
 return H

然后，我们可以使用创建的 GCN 模型来进行训练和预测。下面是一个示例代码：

# 创建 GCN 模型
gcn = GCN(input_dim, hidden_dim, output_dim)

# 定义损失函数和优化器
criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(gcn.parameters(), lr=learning_rate)

# 训练
for epoch in range(num_epochs):
 # 计算预测值
 outputs = gcn(A, X)

 # 计算损失
 loss = criterion(outputs[train_nodes], labels[train_nodes])

 # 反向传播和优化
 optimizer.zero_grad()
 loss.backward()
 optimizer.step()

# 预测
with torch.no_grad():
 outputs = gcn(A, X)
 _, predicted = torch.max(outputs[test_nodes], 1)

代码细节解释

GCN 类

在 GCN 类的初始化函数中，我们定义了两个线性层（Fully Connected Layers），分别是 self.fc1 和 self.fc2。这两个线性层分别用于聚合邻居特征和更新节点特征。

在 forward 函数中，我们首先进行特征矩阵 $X$ 和邻接矩阵 $A$ 的矩阵乘法操作，然后使用 ReLU 激活函数进行非线性变换，得到新的节点特征矩阵 $H$。最后，我们再次进行一次矩阵乘法操作，得到最终的节点特征矩阵。

训练过程

在训练过程中，我们首先计算模型的预测值 outputs。然后，使用交叉熵损失函数计算预测值和真实标签之间的损失。接下来，我们使用反向传播和优化器来更新模型的参数。

预测过程

在预测过程中，我们使用 torch.no_grad() 来关闭自动求导功能，以节省内存。首先，计算模型的预测值 outputs。然后，使用 torch.max() 函数找到预测值中最大的标签，并将其作为预测结果。

这就是一个简单的图神经网络（GCN）在节点分类任务中的训练和预测过程的完整代码示例。请根据实际情况进行适当的调整和扩展。

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/824279/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Python QT学习——一个简单的入门案例（一）

QT学习文章目录 QT学习前言一、一个简单的例子二、用户操作处理signal和slot 三、封装到类中前言开发QT主要用两个包：PySide2和PyQt5 pip in…

人工智能 2023年7月5日
0046
如何学习新能源汽车技术？新能源汽车岗位选择。

同时，随着互联网信息技术的广泛应用与5G通讯的商业化普及，工科教育正在经历着一场前所未有的深刻变革，数字化课程、智慧课堂、互联网+线上线下相结合的云教学模式正在颠覆近百年来传统的教…

人工智能 2023年6月10日
0070
python中的reindex_Pandas中关于reindex(), set_index()和reset_index()的用法

参考文章： Pandas详解八之ReIndex重新索引 pandas中关于set_index和reset_index的用法 Pandas set_index&reset_i…

人工智能 2023年7月8日
0073
从 ThreadLocal 到 AsyncLocal

前些天跟大佬们在群里讨论如何在不使用构造函数，不增加方法参数的情况下把一个上下文注入到方法内部使用，得出的结论是 AsyncLocal 。感叹自己才疏学浅，居然才知道有 Async…

人工智能 2023年6月6日
0084
Windows下安装及配置CUDA过程详解

安装及配置过程一、下载安装CUDA Toolkit * 1.查看当前系统所支持CUDA版本 2.官网下载安装合适的CUDA 3.配置环境变量 4.测试CUDA安装是否成功二、下…

人工智能 2023年6月23日
0061
huggingface transformers包文档学习笔记（持续更新ing…）

诸神缄默不语-个人CSDN博文目录最近更新日期：2023.4.14最早更新日期：2022.2.17 本文系huggingface（Hugging Face – The AI co…

人工智能 2023年5月28日
00100
LIO-SAM代码学习——imuPreintegration.cpp

imuPreintegration.cpp（IMU预积分进程）主函数 int main(int argc, char **argv) { ros::init(argc, argv…

人工智能 2023年6月10日
0066
06-TensorFlow 自制数据集

1.数据文件介绍数据集下载:https://download.csdn.net/download/qq_41865229/85254826训练集60000张数字图片, 测试集10…

人工智能 2023年5月24日
0091
统计思维：程序员数学之概率统计（第2版）PDF

内容简介 · · · · · · 现实工作中，人们常常需要用数据说话。可是，数据自己不会说话，需要人对它进行分析和挖掘才能找到有价值的信息。概率统计是数据分析的通用语言，是大数据时…

人工智能 2023年7月16日
0085
VIO视觉无人机室内定点自主飞行（T265+PX4+Mavros+NX）

利用雷迅V5+、Ubuntu 18.04、ROS Melodic、T265、Jetson Xavier NX机载电脑实现无人机在室内无GPS情况下的定点稳定飞行。文章目录一、环…

人工智能 2023年6月1日
00277
特征金字塔网络FPN

一、FPN 特征金字塔网络（FPN）是一种旨在提高准确率和速度的特征提取器。它取代了检测器（如 Faster R-CNN）中的特征提取器，并生成更高质量的特征图金字塔 FPN 由…

人工智能 2023年7月9日
0073
Entity Linking with a Knowledge Base:Issues, Techniques, and Solutions笔记

Entity Linking with a Knowledge Base:Issues, Techniques, and Solutions笔记阅读文献笔记 1 引言 1.1 动…

人工智能 2023年6月1日
0073
java学习笔记 day03-Java基础语法

就是对常量或者变量进行操作的符号。比如： + – * / 用运算符把常量或者变量连接起来的，符合Java语法的式子就是表达式。比如：a + b 这个…

人工智能 2023年6月30日
0070
论文浅尝 | 探索用于归纳型知识图谱补全的关系语义

笔记整理：徐雅静，浙江大学在读硕士，研究方向为知识图谱的表示学习，零样本学习。 KGC指的是在不完整的KG中推理出缺失的实体。以前的多数工作仅仅考虑到直推式场景（实体都存在KG中）…

人工智能 2023年6月1日
0074
小目标检测方法介绍

目标检测发展很快，但对于小目标的检测还是有一定的瓶颈，特别是大分辨率图像小目标检测。比如7920 _2160，甚至16000_16000的图像，还有一些遥感图像。图像…

人工智能 2023年7月10日
0057
分析如烹饪：让我们一起做数据大厨

作者介绍鲸歌电商行业数据分析师为头部品牌提供数据咨询服务热衷学习与分析 “数据人创作者联盟”成员还记得，指引我数据分析入门的那本书，它将数据分析…

人工智能 2023年7月17日
0052

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31