图神经网络如何表示和处理图结构的数据

2024年1月6日下午1:03 • 人工智能 • 阅读 60

1. 介绍

图神经网络是一种用于处理和表示图结构数据的深度学习模型。与传统的神经网络模型只能处理向量和矩阵数据不同，图神经网络能够直接处理图结构数据，这使得其在许多领域，如社交网络分析、化学、推荐系统等任务中有着广泛的应用。

2. 算法原理

图神经网络的核心思想是将节点和边的信息表示为向量形式，并通过更新节点和边的向量表达来进行信息传递和图结构的学习。

图神经网络通常包括两个主要的组件：图卷积层和图池化层。图卷积层用于对节点的向量表示进行更新，而图池化层则对图的结构进行降维操作。

3. 公式推导

3.1 图卷积层

假设有一个图 $G=(V, E)$，其中 $V$ 为节点集合，$E$ 为边集合。每个节点 $v_i$ 都有一个初始的特征向量表示 $h_i^0$。

图卷积层的目标是通过传递每个节点的邻居信息来更新节点的特征表示。图卷积层可以表示为以下公式：

$$h_i^{(l+1)} = \sigma\left(\sum_{j \in N(i)} \frac{1}{\sqrt{{|{j: (v_i, v_j) \in E}| \cdot |{k: (v_j, v_k) \in E}|}}}\cdot f\left(h_i^{(l)}, h_j^{(l)}\right)\right)$$

其中 $h_i^{(l)}$ 表示第 l 层节点 i 的特征向量，$N(i)$ 为节点 i 的邻居节点集合，$f$ 是一个用于更新节点特征向量的函数，例如多层感知机(MLP)。

3.2 图池化层

图池化层的目标是对图的结构进行降维操作，以减少图的规模。

常用的图池化层是图池化算法，如图结构化自编码器(Graph Structure Autoencoders)。其具体公式如下：

$$s_{ij} = \text{Sim}(h_i^{(l)}, h_j^{(l)})$$

$$a_i = \text{softmax}\left(\frac{s_{ij}}{c_i}\right)$$

$$h_i^{(l+1)} = \sigma\left(\sum_{j \in N(i)} a_i \cdot f(h_i^{(l)}, h_j^{(l)})\right)$$

其中 $\text{Sim}$ 是节点特征之间的相似度函数，$c_i$ 是归一化因子。

4. 计算步骤

初始化节点特征向量 $h_i^0$。
进行 l 层的图卷积操作，使用公式进行特征向量更新。
可选择进行图池化操作，使用公式进行降维。
重复步骤 2 和 3 直到达到目标层数。

5. 复杂Python代码示例

下面是一个使用 Tensorflow 框架实现的简单图神经网络示例代码：

import tensorflow as tf
import numpy as np

class GraphConvolutionLayer(tf.keras.layers.Layer):
 def __init__(self, num_units):
 super(GraphConvolutionLayer, self).__init__()
 self.num_units = num_units

 def build(self, input_shape):
 self.weights = self.add_weight("weights", shape=[input_shape[-1], self.num_units])
 self.bias = self.add_weight("bias", shape=[self.num_units])

 def call(self, inputs, adjacency_matrix):
 # Graph Convolution operation
 outputs = tf.matmul(adjacency_matrix, tf.matmul(inputs, self.weights)) + self.bias
 return tf.nn.relu(outputs)

class GraphPoolingLayer(tf.keras.layers.Layer):
 def __init__(self, num_units):
 super(GraphPoolingLayer, self).__init__()
 self.num_units = num_units

 def build(self, input_shape):
 self.weights = self.add_weight("weights", shape=[input_shape[-1], self.num_units])
 self.bias = self.add_weight("bias", shape=[self.num_units])

 def call(self, inputs, adjacency_matrix):
 # Graph Pooling operation
 pool_weights = tf.nn.softmax(tf.matmul(adjacency_matrix, tf.matmul(inputs, self.weights)) / inputs.shape[0], axis=1)
 outputs = tf.matmul(tf.transpose(pool_weights), tf.matmul(inputs, self.weights)) + self.bias
 return tf.nn.relu(outputs)

# Create a toy graph
adjacency_matrix = np.array([[0, 1, 1],
 [1, 0, 1],
 [1, 1, 0]])
feature_matrix = np.array([[0.5, 0.2],
 [0.3, 0.1],
 [0.4, 0.3]])

# Convert to tensors
adjacency_matrix = tf.constant(adjacency_matrix, dtype=tf.float32)
feature_matrix = tf.constant(feature_matrix, dtype=tf.float32)

# Create the graph neural network model
model = tf.keras.Sequential([
 GraphConvolutionLayer(4),
 GraphPoolingLayer(2),
 GraphConvolutionLayer(2)
])

# Forward pass
outputs = model(feature_matrix, adjacency_matrix)
print(outputs)

6. 代码细节解释

GraphConvolutionLayer 类定义了图卷积层的操作，使用权重矩阵和偏差进行线性变换，并通过 ReLU 激活函数进行非线性操作。
GraphPoolingLayer 类定义了图池化层的操作，通过 Softmax 函数计算池化权重，然后进行线性变换，并通过 ReLU 激活函数进行非线性操作。
adjacency_matrix 和 feature_matrix 分别表示图的邻接矩阵和节点特征矩阵。
model 定义了一个图神经网络模型，包含两个图卷积层和一个图池化层。
outputs 表示模型的输出结果。

以上是一个图神经网络的示例，可以将其用于图结构数据的表征和处理。注意，这只是一个简化的实现，实际应用中可能需要更复杂的模型和更大规模的数据集。

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/824277/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Python3 DataFrame数据排序与排名

pandas的DataFrame极大地简化了数据分析过程中一些烦琐操作，它是一个表格型的数据结构, 每一列代表一个变量，而每一行则是一条记录。简答地说，DataFrame是共享同一…

人工智能 2023年7月7日
0077
pytorch-textclassification是一个专注于中文文本分类（多类分类、多标签分类）的轻量级自然语言处理工具包，基于pytorch和transformers，包含各种实验

pytorch-textclassification是一个以pytorch和transformers为基础，专注于文本分类的轻量级自然语言处理工具包。支持中文长文本、短文本的多类分…

人工智能 2023年5月30日
0085
EMNLP 2020 | 基于超边融合的文本增强知识图谱开放域问答

©PaperWeekly 原创 · 作者｜舒意恒学校｜南京大学硕士生研究方向｜知识图谱论文标题： Open Domain Question Answering based o…

人工智能 2023年6月1日
0078
损失函数 | BCE Loss（Binary CrossEntropy Loss）

BCE（Binary CrossEntropy）损失函数 * – + 图像二分类问题—>多标签分类 + Sigmoid和Softmax的本质及其相应的…

人工智能 2023年7月25日
0096
CDA LEVELⅠ2021最新模拟题一（全网最详细有答案）

1.卡方检验是用途非常广的一种假设检验方法，卡方检验中，将任意两行互换，卡方值（） A.变大 B.变小 C.不变 D.不确定解析：卡方检验的结果与分类变量的顺序无关，将任意两行…

人工智能 2023年6月19日
0099
数字图像处理

数字图像处理 1.1数字图像与数字图像处理图像处理方法 1、数字图像处理 2、模拟图像处理（光学方法，处理的信息量大，难有判断功能） 3、光电结合处理图像处理（狭义）：输入和输…

人工智能 2023年6月20日
00101
5.2 tensorflow2实现多元线性回归、完成广告投放销售额预测——python实战

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月17日
0055
在Windows使用miniconda安装Tensorflow-GPU版，无需去Nvidia官网下载安装cuda和cudnn

Windows版miniconda下载路径：https://docs.conda.io/en/latest/miniconda.html#windows-installers 我选…

人工智能 2023年5月25日
0076
达观智能文本分析系统，赋能企业大数据加工处理

企业面临的痛点和挑战标签是用来标志产品目标和分类或内容的关键字词，是便于自己和他人查找和定位目标的便捷工具。下面我们通过几段业务调研，了解一下目前标签应用的现状综上反馈，我们…

人工智能 2023年7月17日
0067
JAVA – 方法使用的扩展

这里写目录标题 * – 一、Lambda 表达式 – + 1.1 函数式编程思想概述 + 1.2 Lambda 表达式和匿名内部类的标准格式 + 1.3 L…

人工智能 2023年6月28日
0073
VS2019 MFC配置OpenCV430

一、环境变量配置下载OpenCV，解压结束后，鼠标右键此电脑，打开属性，打开高级系统设置，选择环境变量，找到系统变量中的path变量，双击，点击新建，将解压后opencv文件夹中…

人工智能 2023年7月20日
0055
全球及中国溴锗行业需求趋势及未来发展战略规划建议报告2022-2028年

全球及中国溴锗行业需求趋势及未来发展战略规划建议报告2022-2028年详情内容请咨询鸿晟信合研究网！【全新修订】：2022年3月【撰写单位】：鸿晟信合研究网1 溴锗行业概述1….

人工智能 2023年6月11日
0058
智能驾驶域控制器硬件方案演进趋势分析

交流群 |进”传感器群/滑板底盘群”请加微信号：xsh041388 交流群 |进”域控制器群/操作系统群”请加微信号：ckc1087…

人工智能 2023年6月25日
00100
Bert模型学习之环境配置（一）

Bert模型学习之环境配置（一）毕业论文结束时，我开始增加数据量，但结果是模型翻了个底朝天，模型变得不可靠(实际模型太不稳健了)。 [En] At the end of the …

人工智能 2023年5月23日
0065
python 数据分析(pandas)

1.Series的使用 1.1使用列表作为数据源 1.2使用数组作为数据源 1.3使用字典作为数据源 1.4索引的使用 1.5使用name给数据序列起别名 1.6常用属性 1.7索…

人工智能 2023年7月7日
0068
Python大数据-电商产品评论情感数据分析

目录一、项目背景二、项目目标三、分析方法与分析过程四、数据清洗数据抓取评论去重分词停用词词云图绘制五、数据分析评论数据情感倾向分析匹配情感词修正情感倾向LDA模型进行主题分析寻找…

人工智能 2023年7月18日
0068

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31