图神经网络（二）—GCN-pytorch版本代码详解

2023年7月20日下午5:17 • 人工智能 • 阅读 66

GCN代码详解-pytorch版本

1 GCN基本介绍
2 代码解析
*
2.1 导入数据
2.2 GCN模型框架
2.3 评估与训练
参考资料

写在前面…

在研究生的工作中使用到了图神经网络，所以平时会看一些与图神经网络相关的论文和代码。写这个系列的目的是为了帮助自己再理一遍算法的基本思想和流程，如果同时也能对其他人提供帮助是极好的~博主也是在学习过程中，有些地方有误还请大家批评指正！

github: https://github.com/OuYangg/GNNs

1 GCN基本介绍

论文标题：Semi-supervised classification with graph convolutional networks
作者：Thomas N. Kipf, Max Welling

GCN是一种基于谱域的图卷积神经网络。在spectral-based GCN模型中，会将每个节点的输入看作是信号，并且在进行卷积操作之前，会利用转置后的归一化拉普拉斯矩阵的特征向量将节点的信号进行傅里叶变换，卷积完了之后再用归一化拉普拉斯矩阵的特征向量转换回来。其中，将信号进行傅里叶变换的公式如下：
F ( x ) = U T x F(x)=U^Tx F (x )=U T x
F − 1 ( x ) = U x F^{-1}(x) = Ux F −1 (x )=U x
其中，U U U为归一化拉普拉斯矩阵L = I N − D − 1 / 2 A D − 1 / 2 L=I_N-D^{-1/2}AD^{-1/2}L =I N −D −1 /2 A D −1 /2的特征向量。基于卷积理论，卷积操作被定义为：
g x = F − 1 ( F ( g ) F ( x ) ) = U ( U T g U T x ) , g x=F^{-1}(F(g) F(x))=U(U^TgU^Tx),g x =F −1 (F (g )F (x ))=U (U T g U T x ),
其中，U T g U^Tg U T g为谱域的过滤器，若将U T g U^Tg U T g简化为一个可学习的对角矩阵g w g_w g w ，则有
g x = U g w U T x g x=Ug_wU^Tx g x =U g w U T x.

一个比较有名的spectral-based GCN模型是ChebNet的思想就是利用切比雪夫多项式来作为参数，得到
g x = ∑ k = 0 K w k T k ( L ~ ) x gx=\sum_{k=0}^K w_kT_k(\widetilde{L}) x g x =k =0 ∑K w k T k (L )x,
其中，T k ( x ) = 2 x T k − 1 ( x ) − T k − 2 ( x ) , T 0 ( x ) = 1 , T 1 ( x ) = x T_k(x) =2xT_{k-1}(x)-T_{k-2}(x), T_0(x)=1,T_1(x)=x T k (x )=2 x T k −1 (x )−T k −2 (x ),T 0 (x )=1 ,T 1 (x )=x，L ~ = 2 λ m a x L − I N \widetilde{L}=\frac{2}{\lambda_{max}}L-I_N L =λm a x 2 L −I N ，λ m a x \lambda_{max}λm a x 为L L L的最大特征值。

GCN是在ChebNet的基础上，令K = 1 K=1 K =1，λ m a x ≈ 2 \lambda_{max} \approx 2 λm a x ≈2，得到
g w x = w 0 x + w 1 L ~ x g_w x = w_0x+w_1 \widetilde{L} x g w x =w 0 x +w 1 L x，其中，L ~ \widetilde{L}L被简化为了D − 1 / 2 A D − 1 / 2 D^{-1/2}AD^{-1/2}D −1 /2 A D −1 /2，得到
g w x = w ( I N + D − 1 / 2 A D − 1 / 2 ) x g_w x=w(I_N+D^{-1/2}AD^{-1/2})x g w x =w (I N +D −1 /2 A D −1 /2 )x，令I N + D − 1 / 2 A D − 1 / 2 = D ~ − 1 / 2 A ~ D ~ − 1 / 2 I_N+D^{-1/2}AD^{-1/2} = \widetilde{D}^{-1/2}\widetilde{A}\widetilde{D}^{-1/2}I N +D −1 /2 A D −1 /2 =D −1 /2 A D −1 /2，得到
H = σ { D ~ − 1 / 2 A ~ D ~ − 1 / 2 X W } H=\sigma{\widetilde{D}^{-1/2}\widetilde{A}\widetilde{D}^{-1/2}XW }H =σ{D −1 /2 A D −1 /2 X W }
其中，X ∈ R N × F X \in R^{N \times F}X ∈R N ×F为输入，即节点的特征矩阵，W ∈ R F × F ′ W\in R^{F \times F’}W ∈R F ×F ′为参数，F ′ F’F ′为第一层输出size，σ \sigma σ为ReLU激活函数。以上就是GCN的前向传播公式。

上面一大堆公式看不懂其实不要紧！！
大家只要知道GCN是一个比较简单且好用的图神经网络模型就可以了。至于有多好用，可以看下面这张图，下图为未经过训练的三层GCN，其中所有的参数均为随机的参数，可以看到他还没训练就可以对节点有一个非常准确的分类，非常的震惊有没有。

; 2 代码解析

代码参考地址：pyGCN
导入所需的库

import math
import time
import numpy as np
import torch
import torch.nn as nn
import torch.optim as optim
import torch.nn.functional as F
import scipy.sparse as sp
import argparse

2.1 导入数据

def encode_onehot(labels):
    """使用one-hot对标签进行编码"""
    classes = set(labels)
    classes_dict = {c: np.identity(len(classes))[i, :] for i, c in
                    enumerate(classes)}
    labels_onehot = np.array(list(map(classes_dict.get, labels)),
                             dtype=np.int32)
    return labels_onehot

def normalize(mx):
    """行归一化"""
    rowsum = np.array(mx.sum(1))
    r_inv = np.power(rowsum, -1).flatten()
    r_inv[np.isinf(r_inv)] = 0.

    r_mat_inv = sp.diags(r_inv)
    mx = r_mat_inv.dot(mx)
    return mx

def sparse_mx_to_torch_sparse_tensor(sparse_mx):
    """将一个scipy sparse matrix转化为torch sparse tensor."""
    sparse_mx = sparse_mx.tocoo().astype(np.float32)
    indices = torch.from_numpy(
        np.vstack((sparse_mx.row, sparse_mx.col)).astype(np.int64))
    values = torch.from_numpy(sparse_mx.data)
    shape = torch.Size(sparse_mx.shape)
    return torch.sparse.FloatTensor(indices, values, shape)

def load_data(path="./cora/", dataset="cora"):
    """读取引文网络数据cora"""
    print('Loading {} dataset...'.format(dataset))
    idx_features_labels = np.genfromtxt("{}{}.content".format(path, dataset),
                                        dtype=np.dtype(str))
    features = sp.csr_matrix(idx_features_labels[:, 1:-1], dtype=np.float32)
    labels = encode_onehot(idx_features_labels[:, -1])

    idx = np.array(idx_features_labels[:, 0], dtype=np.int32)
    idx_map = {j: i for i, j in enumerate(idx)}
    edges_unordered = np.genfromtxt("{}{}.cites".format(path, dataset),
                                    dtype=np.int32)
    edges = np.array(list(map(idx_map.get, edges_unordered.flatten())),
                     dtype=np.int32).reshape(edges_unordered.shape)
    adj = sp.coo_matrix((np.ones(edges.shape[0]), (edges[:, 0], edges[:, 1])),
                        shape=(labels.shape[0], labels.shape[0]),
                        dtype=np.float32)

    adj = adj + adj.T.multiply(adj.T > adj) - adj.multiply(adj.T > adj)

    features = normalize(features)
    adj = normalize(adj + sp.eye(adj.shape[0]))

    idx_train = range(140)
    idx_val = range(200, 500)
    idx_test = range(500, 1500)

    features = torch.FloatTensor(np.array(features.todense()))
    labels = torch.LongTensor(np.where(labels)[1])
    adj = sparse_mx_to_torch_sparse_tensor(adj)

    idx_train = torch.LongTensor(idx_train)
    idx_val = torch.LongTensor(idx_val)
    idx_test = torch.LongTensor(idx_test)

    return adj, features, labels, idx_train, idx_val, idx_test

2.2 GCN模型框架

class GCNLayer(nn.Module):
    """GCN层"""
    def __init__(self,input_features,output_features,bias=False):
        super(GCNLayer,self).__init__()
        self.input_features = input_features
        self.output_features = output_features
        self.weights = nn.Parameter(torch.FloatTensor(input_features,output_features))
        if bias:
            self.bias = nn.Parameter(torch.FloatTensor(output_features))
        else:
            self.register_parameter('bias',None)
        self.reset_parameters()

    def reset_parameters(self):
        """初始化参数"""
        std = 1./math.sqrt(self.weights.size(1))
        self.weights.data.uniform_(-std,std)
        if self.bias is not None:
            self.bias.data.uniform_(-std,std)

    def forward(self,adj,x):
        support = torch.mm(x,self.weights)
        output = torch.spmm(adj,support)
        if self.bias is not None:
            return output+self.bias
        return output

class GCN(nn.Module):
    """两层GCN模型"""
    def __init__(self,input_size,hidden_size,num_class,dropout,bias=False):
        super(GCN,self).__init__()
        self.input_size=input_size
        self.hidden_size=hidden_size
        self.num_class = num_class
        self.gcn1 = GCNLayer(input_size,hidden_size,bias=bias)
        self.gcn2 = GCNLayer(hidden_size,num_class,bias=bias)
        self.dropout = dropout
    def forward(self,adj,x):
        x = F.relu(self.gcn1(adj,x))
        x = F.dropout(x,self.dropout,training=self.training)
        x = self.gcn2(adj,x)
        return F.log_softmax(x,dim=1)

2.3 评估与训练

def accuracy(output, labels):
    preds = output.max(1)[1].type_as(labels)
    correct = preds.eq(labels).double()
    correct = correct.sum()
    return correct / len(labels)

def train_gcn(epoch):
    t = time.time()
    model.train()
    optimizer.zero_grad()
    output = model(adj,features)
    loss = F.nll_loss(output[idx_train],labels[idx_train])
    acc = accuracy(output[idx_train],labels[idx_train])
    loss.backward()
    optimizer.step()
    loss_val = F.nll_loss(output[idx_val],labels[idx_val])
    acc_val = accuracy(output[idx_val], labels[idx_val])
    print('Epoch: {:04d}'.format(epoch+1),
          'loss_train: {:.4f}'.format(loss.item()),
          'acc_train: {:.4f}'.format(acc.item()),
          'loss_val: {:.4f}'.format(loss_val.item()),
          'acc_val: {:.4f}'.format(acc_val.item()),
          'time: {:.4f}s'.format(time.time() - t))

def test():
    model.eval()
    output = model(adj,features)
    loss_test = F.nll_loss(output[idx_test], labels[idx_test])
    acc_test = accuracy(output[idx_test], labels[idx_test])
    print("Test set results:",
          "loss= {:.4f}".format(loss_test.item()),
          "accuracy= {:.4f}".format(acc_test.item()))

if __name__ == '__main__':

    parser = argparse.ArgumentParser()
    parser.add_argument('--no-cuda', action='store_true', default=False,
                        help='Disables CUDA training.')
    parser.add_argument('--fastmode', action='store_true', default=False,
                        help='Validate during training pass.')
    parser.add_argument('--seed', type=int, default=42, help='Random seed.')
    parser.add_argument('--epochs', type=int, default=200,
                        help='Number of epochs to train.')
    parser.add_argument('--lr', type=float, default=0.01,
                        help='Initial learning rate.')
    parser.add_argument('--weight_decay', type=float, default=5e-4,
                        help='Weight decay (L2 loss on parameters).')
    parser.add_argument('--hidden', type=int, default=16,
                        help='Number of hidden units.')
    parser.add_argument('--dropout', type=float, default=0.5,
                        help='Dropout rate (1 - keep probability).')

    args = parser.parse_args()
    np.random.seed(args.seed)
    adj, features, labels, idx_train, idx_val, idx_test = load_data()
    model = GCN(features.shape[1],args.hidden,labels.max().item() + 1,dropout=args.dropout)
    optimizer = optim.Adam(model.parameters(),lr=args.lr,weight_decay=args.weight_decay)
    for epoch in range(args.epochs):
        train_gcn(epoch)

结果如下：

参考资料

[1] Hamilton W L, Ying R, Leskovec J. Inductive representation learning on large graphs[J]. arXiv preprint arXiv:1706.02216, 2017.
[2] https://github.com/tkipf/pygcn

Original: https://blog.csdn.net/weixin_44027006/article/details/124100199
Author: Arvin Ou
Title: 图神经网络（二）—GCN-pytorch版本代码详解

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/705381/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

系统移植第一天

1.1 系统移植就是给开发板搭建一个Linux操作系统 1.2 从官方获取源码，进行配置和编译，生成板子需要的镜像文件 2.1 为后面学驱动开发课程打基础 2.2 驱动开发工程必备…

人工智能 2023年7月30日
0061
人体姿态检测通过Opencv+Openpose实现

通过一个偶然机会，我了解到了人体姿态解算，在学习K210之余，我便想着通过opencv实现这个功能，查找了很多资料，发现可以利用opencv+openpose实现，接着我又开始找一…

人工智能 2023年7月19日
0059
Collaborativ

问题介绍本问题将探讨Collaborative Filtering（协同过滤）算法在推荐系统中的应用。协同过滤是一种常用的推荐算法，它基于用户或物品之间的相似性来进行推荐。本文将…

人工智能 2024年1月2日
0021
Matlab相机标定——使用Single Camera Calibrator App

什么是相机标定？棋盘格图片采集 Single Camera Calibrator App支持棋盘格、圆圈格和自定义检测器图案。有关这些图案的细节和包含可打印图案的P…

人工智能 2023年5月26日
0074
Yolov5的配置+训练（超级详细！！！）

我本来说只是单纯的记录一下第一次跑代码的流程的，结果看到了这么多大家都收藏和点赞，我决定再稍微改改他的排版，希望更多地朋友能在CV方向迅速上手！一、NVIDIA驱动安装与更新首先查…

人工智能 2023年7月28日
0065
win10安装yolox，训练自定义模型，使用tensorrt部署全流程

系统环境：win10、cuda10.2、cudnn8.2 一、采集数据有2段视频，先使用ffmpeg对视频进行抽帧，由于视频比较长，所以每隔5秒抽取1张图片。 ffmpeg -i…

人工智能 2023年7月10日
0049
如何在PyTorch中创建和训练一个神经网络模型

1. 介绍在PyTorch中创建和训练一个神经网络模型是一个非常常见的任务。神经网络是机器学习中的一个重要组件，可以用来解决各种问题，如图像分类、目标检测、语言处理等。本文将详细…

人工智能 2024年1月2日
0029
「大模型」之所短，「知识图谱」之所长

近两年，人工智能领域的大模型可谓炙手可热。以自然语言处理领域为例，自BERT横空出世，在各种评测上分数一飞冲天，在斯坦福阅读理解评测集上超越人类水平之后，各种越来越大的自然语言处理…

人工智能 2023年6月10日
0075
【毕业季】这四年一路走来都很值得——老学长の忠告

活动地址：毕业季·进击的技术er 大家好，我是路飞！又是一年毕业季，大学四年还没来得及好好体验校园生活，就匆忙收尾了！这四年时光里，有过目标和追求，也有过遗憾和不舍，从四年前刚踏…

人工智能 2023年7月31日
0049
【PyTorch深度学习实践】学习笔记第九节实践篇手写数字图像多分类

课程链接PyTorch深度学习实践第九节课程。go go go~！原理介绍在前面第六讲时，介绍过了可以将逻辑回归看做是仅含有一层神经元的单层的神经网络。一般用于二分类网络，线…

人工智能 2023年7月1日
0072
【深度学习】(2) Transformer 网络解析，代码复现，附Pytorch完整代码

大家好，今天和各位分享一下如何使用 Pytorch 构建 Transformer 模型。本文的重点在代码复现，部分知识点介绍的不多，我会在之后的四篇博文中详细介绍 Encoder…

人工智能 2023年7月22日
0086
RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED

解决方法： 1、每隔一段时间清除一下缓存【慎用】 if hasattr(torch.cuda, “empty_cache”):torch.cuda.emp…

人工智能 2023年7月23日
0058
计算机视觉学习第5章——多视图几何

目录一、外极几何 1.1 简单数据集 1.2 用Matplotlib绘制三维数据 1.3 计算F：八点法 1.4 外极点和外极线二、照相机和三维结构的计算 2.1 三角部分 …

人工智能 2023年6月25日
0085
python之dict3—— 用dict 将dataframe 聚类；根据一列，对另一列进行分类/聚类

用dict 将dataframe 聚类。根据一列，对另一列进行分类/聚类比如：对以下这个idc的dataframe，选取各大指数成分股先在dataframe中根据一列选取另一…

人工智能 2023年5月31日
0057
八数码问题

八数码问题我想大家小时候一定玩过八数码的游戏，如下图：在一个九宫格里面放入8个数字，数字只能上下左右移动，并且只能移动到空白处。通过若干此移动后，能把数字移动成图1.1右方所示图…

人工智能 2023年6月30日
0059
KeyError: “None of [Int64Index([…],n dtype=‘int64‘, length=739)] are in the [columns]“

KeyError: “None of [Int64Index([ 0, 1, 2, 3, 4, 6, 7, 8, 9, 10,\n …\n 907, 908…

人工智能 2023年5月27日
0068

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

图神经网络（二）—GCN-pytorch版本代码详解

GCN代码详解-pytorch版本

2.1 导入数据

2.2 GCN模型框架

2.3 评估与训练

大家都在看