图神经网络有哪些常用的优化算法和损失函数

2024年1月6日下午2:02 • 人工智能 • 阅读 85

问题背景

图神经网络（Graph Neural Network, GNN）是一类用于处理图数据的深度学习模型。与传统的神经网络不同，GNN可以有效地对节点和图之间的结构信息进行建模，适用于社交网络分析、化学分子分析、推荐系统等领域。

本文将详细介绍一些常用的优化算法和损失函数，以提升图神经网络的性能。

优化算法

1. 随机梯度下降法（Stochastic Gradient Descent, SGD）

随机梯度下降法是最基本的优化算法之一，被广泛应用于深度学习领域。它通过迭代更新模型参数来最小化损失函数。

算法原理：
1. 初始化模型参数。
2. 从训练数据中随机选择一个样本（或一批样本）。
3. 根据当前参数进行前向传播计算，得到模型输出。
4. 计算损失函数对参数的梯度。
5. 根据梯度和学习率更新参数。
6. 重复步骤2-5，直到达到停止条件。

公式推导：

假设损失函数为$$L$$，模型参数为$$\theta$$，学习率为$$\alpha$$。

对于一个样本$$x$$，模型输出为$$y$$。

损失函数对参数的梯度为$$\frac{\partial L}{\partial \theta}$$。

参数的更新公式为$$\theta \leftarrow \theta – \alpha \cdot \frac{\partial L}{\partial \theta}$$。

计算步骤：
1. 初始化模型参数$$\theta$$。
2. for each epoch:
– for each mini-batch:
– 计算模型输出$$y$$。
– 计算损失函数$$L$$。
– 计算参数梯度$$\frac{\partial L}{\partial \theta}$$。
– 更新参数$$\theta \leftarrow \theta – \alpha \cdot \frac{\partial L}{\partial \theta}$$。

复杂Python代码示例：

import numpy as np

# 初始化模型参数
theta = np.random.randn(100, 1)

# 迭代更新参数
for epoch in range(num_epochs):
 for batch in range(num_batches):
 # 从训练数据中随机选择一个样本
 x, y = get_random_sample()

 # 前向传播计算模型输出
 y_pred = forward(x, theta)

 # 计算损失函数
 loss = compute_loss(y, y_pred)

 # 计算参数梯度
 grad = compute_gradient(x, y, theta)

 # 更新参数
 theta = theta - learning_rate artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls grad

代码细节解释：
– 初始化模型参数：使用np.random.randn()函数生成服从正态分布的随机数作为初始参数。
– 迭代更新参数：通过嵌套的循环，遍历数据集中的样本，并进行模型前向计算、损失计算、梯度计算和参数更新。
– get_random_sample()：自定义函数，用于从训练数据中随机选择一个样本。
– forward()：自定义函数，用于进行前向传播计算，将输入数据和当前参数作为输入，返回模型输出。
– compute_loss()：自定义函数，用于计算损失函数，将真实标签和模型输出作为输入，返回损失值。
– compute_gradient()：自定义函数，用于计算参数梯度，将输入数据、真实标签和当前参数作为输入，返回梯度值。

2. Adam优化算法

Adam（Adaptive Moment Estimation）优化算法是一种自适应学习率的优化算法，可以自动调整学习率，适应不同参数的更新情况。

算法原理：
1. 初始化模型参数和一阶矩估计$$m$$、二阶矩估计$$v$$。
2. for each iteration:
– 计算梯度$$g$$。
– 更新一阶矩和二阶矩估计：
– $$m \leftarrow \beta_1 \cdot m + (1-\beta_1) \cdot g$$
– $$v \leftarrow \beta_2 \cdot v + (1-\beta_2) \cdot g^2$$
– 校正一阶和二阶矩的偏差：
– $$\hat{m} \leftarrow \frac{m}{1-\beta_1^t}$$
– $$\hat{v} \leftarrow \frac{v}{1-\beta_2^t}$$
– 更新参数：
– $$\theta \leftarrow \theta – \alpha \cdot \frac{\hat{m}}{\sqrt{\hat{v}} + \epsilon}$$

公式推导：

$$m$$为梯度的一阶矩估计，$$v$$为梯度的二阶矩估计。$$\beta_1$$和$$\beta_2$$是衰减率，$$t$$表示当前迭代的次数。

参数的更新公式为$$\theta \leftarrow \theta – \alpha \cdot \frac{\hat{m}}{\sqrt{\hat{v}} + \epsilon}$$，其中$$\hat{m}$$和$$\hat{v}$$为校正一阶和二阶矩的偏差。

计算步骤：
1. 初始化模型参数$$\theta$$和一阶矩估计$$m$$、二阶矩估计$$v$$。
2. for each iteration:
– 计算梯度$$g$$。
– 更新一阶和二阶矩估计：
– $$m \leftarrow \beta_1 \cdot m + (1-\beta_1) \cdot g$$
– $$v \leftarrow \beta_2 \cdot v + (1-\beta_2) \cdot g^2$$
– 校正一阶和二阶矩的偏差：
– $$\hat{m} \leftarrow \frac{m}{1-\beta_1^t}$$
– $$\hat{v} \leftarrow \frac{v}{1-\beta_2^t}$$
– 更新参数$$\theta \leftarrow \theta – \alpha \cdot \frac{\hat{m}}{\sqrt{\hat{v}} + \epsilon}$$

复杂Python代码示例（以一个简化的示例为例）：

import numpy as np

# 初始化模型参数
theta = np.random.randn(100, 1)
m = np.zeros_like(theta)
v = np.zeros_like(theta)
beta1 = 0.9
beta2 = 0.999
epsilon = 1e-8

# 迭代更新参数
for epoch in range(num_epochs):
 for batch in range(num_batches):
 # 从训练数据中随机选择一个样本
 x, y = get_random_sample()

 # 计算梯度
 grad = compute_gradient(x, y, theta)

 # 更新一阶和二阶矩估计
 m = beta1 artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls m + (1 - beta1) artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls grad
 v = beta2 artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls v + (1 - beta2) artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls grad artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls 2

 # 校正一阶和二阶矩的偏差
 m_hat = m / (1 - beta1 artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls t)
 v_hat = v / (1 - beta2 artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls t)

 # 更新参数
 theta = theta - learning_rate artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls m_hat / (np.sqrt(v_hat) + epsilon)

代码细节解释：
– 初始化模型参数：使用np.random.randn()函数生成服从正态分布的随机数作为初始参数，同时初始化一阶和二阶矩估计为零向量。
– 迭代更新参数：通过嵌套的循环，遍历数据集中的样本，并进行梯度计算、一阶和二阶矩估计更新、偏差校正和参数更新。
– compute_gradient()：自定义函数，用于计算梯度，将输入数据、真实标签和当前参数作为输入，返回梯度值。

损失函数

常用的图神经网络损失函数有均方误差损失（Mean Squared Error, MSE）和交叉熵损失（Cross Entropy Loss）。

1. 均方误差损失（Mean Squared Error, MSE）

均方误差损失是一种常用的回归问题损失函数，适用于预测连续变量的任务。它计算目标值与预测值之间的差异的平方和。

公式推导：

假设$$y$$为真实标签，$$\hat{y}$$为模型预测值。

损失函数为$$L(\theta) = \frac{1}{n} \sum_{i=1}^{n} (y_i – \hat{y_i})^2$$，其中$$n$$为样本数量。

计算步骤：
1. 计算预测值$$\hat{y}$$。
2. 计算损失值$$L(\theta) = \frac{1}{n} \sum_{i=1}^{n} (y_i – \hat{y_i})^2$$。

2. 交叉熵损失（Cross Entropy Loss）

交叉熵损失是一种常用的分类问题损失函数，适用于预测离散变量的任务。它计算目标分类标签和预测概率之间的交叉熵。

公式推导：

假设$$y$$为真实标签的one-hot编码，$$\hat{y}$$为模型预测的概率分布。

损失函数为$$L(\theta) = -\frac{1}{n} \sum_{i=1}^{n} \sum_{j=1}^{C} y_{ij} \log(\hat{y_{ij}})$$，其中$$C$$为类别数量。

计算步骤：
1. 计算预测的概率分布$$\hat{y}$$。
2. 计算损失值$$L(\theta) = -\frac{1}{n} \sum_{i=1}^{n} \sum_{j=1}^{C} y_{ij} \log(\hat{y_{ij}})$$。

注：对于二分类问题，交叉熵损失可以简化为二元交叉熵损失（Binary Cross Entropy Loss）。

总结

本文详细介绍了图神经网络中常用的优化算法（随机梯度下降法和Adam优化算法）和损失函数（均方误差损失和交叉熵损失），包括算法原理、公式推导、计算步骤、复杂的Python代码示例和代码细节解释。这些优化算法和损失函数能够有效提升图神经网络的性能，使其适用于各种图数据分析任务。

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/824287/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Python实现机器学习分类算法

(1)分类问题评估标准：混淆矩阵：真实结果\预测结果正例假例正例真正例TP（true positive）伪反例FN(false negative)假例伪正例FP真反例TN 准确…

人工智能 2023年7月2日
0045
声音信号如何转化为电信号

电信号可以转换成声音信号，当然声音信号也可以转换成电信号。声音需要通过空气、木材、水、金属等媒介传播。声音不可能在真空中传播。如果我们去月球玩，即使我们割断了喉咙，也无法交流。然而…

人工智能 2023年5月27日
00182
回归标准差和残差平方和的关系_统计的基石：简单线性回归

记得关注“ R语言与统计 “ ~~简单线性回归(Simple linear regression) 也称为一元线性回归，是分析一个自变量 (x)与因变量(…

人工智能 2023年6月18日
0092
Pytorch获取特征图

简单加载官方预训练模型 torchvision.models预定义了很多公开的模型结构如果 pretrained参数设置为False，那么仅仅设定模型结构；如果设置为True，那…

人工智能 2023年7月22日
0076
【计算机视觉实战 2 】、特征匹配之Harris角点

特征匹配之Harris角点前言一、特征匹配的基本流程是什么？ * 1.流程 2.对特征点的要求二、角点是什么？ * 1.角点 2.Harris角点检测 3.角点描述子 4.特…

人工智能 2023年6月21日
0087
linux系统下使用cmake编译so文件

本文章将介绍Linux系统下，如何使用cmake将C++语言编译成so文件，主要介绍如何安装cmake和编译，并使用python调用，细节如下：一. Linux安装cmake方…

人工智能 2023年6月4日
0077
显著性目标检测（一）——与图像分割、目标检测的区别

在采用图像谱残差分析方法获取全局特征图像的基础上, 利用小波变换在时域和频域具有的局部特征信息表征能力, 通过对图像包含的不同特征信息进行小波变换, 去除各个特征图中的冗余信息,…

人工智能 2023年6月16日
0054
Pandas两重山之Series（索引）

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月11日
0068
NLP文本摘要NO.3 seq2seq数据处理部分

seq2seq实现文本摘要的架构编码器负责对输入数据进行编码，得到中间语义张量。 [En] The encoder is responsible for encoding the…

人工智能 2023年5月27日
00157
分类任务中常用的Label smoothing

目录 1.Label smoothing的原理 2.pytorh中如何使用Label smoothing 3.适用场景 1.Label smoothing的原理交叉熵损失（sof…

人工智能 2023年7月1日
0079
【OpenCV 例程300篇】250. 梯度算子的传递函数

『youcans 的 OpenCV 例程300篇 – 总目录』【youcans 的 OpenCV 例程300篇】250. 梯度算子的传递函数 1. 空间卷积与频域滤波…

人工智能 2023年6月29日
0070
【目标检测】(10) Mosaic 数据增强方法，附Python完整代码

各位同学好，今天和大家分享一下目标检测算法中常用的图像数据增强方法 Mosaic。先放张图看效果。将四张图片缩放后裁剪拼接在一起，并调整检测框的坐标位置，处理位于图像边缘的检测框…

人工智能 2023年7月9日
00126
免费算力平台——九天毕昇

在完成课程大作业时，因为自己的电脑是AMD显卡，训练的数据也很大，故通过查找资料选取了移动出品的九天算力平台。分享给你一个宝藏 AI 学习和实战平台”九天·毕昇&#82…

人工智能 2023年6月17日
0080
Windows环境下Neo4j图数据库的离线导入导出、APOC函数数据导出实操以及遇到Not a valid Neo4j archive 解决办法

Windows环境下Neo4j图数据库的离线导入导出、APOC函数数据导出实操以及遇到Not a valid Neo4j archive 解决办法一、Neo4j基本操作 * 1….

人工智能 2023年6月1日
0071
论文阅读笔记：Neural Belief Tracker: Data-Driven Dialogue State Tracking

提示：阅读论文时进行相关思想、结构、优缺点，内容进行提炼和记录，论文和相关引用会标明出处。文章目录前言 Abstract Introduction Background Neu…

人工智能 2023年6月10日
0078
【Python | 入门】从输出打印到面对对象（五分钟速通Python）

🤵‍♂️ 个人主页: @计算机魔术师👨‍💻 作者简介：CSDN内容合伙人，全栈领域优质创作者。 Python轻松上手一、编写第一个python.py 二、固定数据介绍.py …

人工智能 2023年7月5日
0055

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

图神经网络有哪些常用的优化算法和损失函数

问题背景

优化算法

1. 随机梯度下降法（Stochastic Gradient Descent, SGD）

2. Adam优化算法

损失函数

1. 均方误差损失（Mean Squared Error, MSE）

2. 交叉熵损失（Cross Entropy Loss）

总结

大家都在看