异质网络模型HetGNN论文总结理解

2023年7月14日上午11:41 • 人工智能 • 阅读 53

论文题目：Heterogeneous Graph Neural Network

论文来源：KDD 2019

论文链接：https://www3.nd.edu/~dial/publications/zhang_2019_heterogeneous.pdf

代码链接：https://github.com/chuxuzhang/KDD2019_HetGNN

1.摘要部分：

HetGNN同时考虑到节点 异质的内容信息（节点的不同属性信息的融合），以及图中 异质的结构信息。

两个模块：第一部分，通过编码异质内容深度特征的交互，得到每个节点的content embedding。（或者叫attribute embedding）

第二部分，聚合不同的邻居节点，使用了注意力机制考虑不同类型邻居的不同影响

模型适合多种应用，节点分类、聚类、链接预测、推荐等任务。

思考：比起其他异质网络模型的优势（之前看过HGAT、HAN、GTN等）：

个人理解：首先HAN、GTN这些需要结合Metapath的思想，需要提前定义元路径，这对负责的网络是不容易选择的，像HGAT这种模型（结合注意力机制的），在短文本分类和假新闻检测中都有使用，但是短文本分类的那篇是先求了类型节点的权重（type attention），再根据类型聚合节点（node attention）信息的权重；而另一篇是先求同类型节点的聚合（nodetype attention），然后把不同类型的节点信息聚合（schema attention），两个相反的过程。

相比之下，HetGNN的优势：（1）不用手动选择元路径；（2）不止能够结合1阶邻居的节点进行判断，可以结合更高阶邻居的节点信息，（不会削弱更远邻居的影响）

2.引言部分

模型框架总体概述：

a.异质网络的例子（学术网络和review网络）

b.三个过程，C1，采样邻居节点，对a来说，type1的采样节点为b和c；type2采样节点为g和f；type3采样的节点为e和d

C2，节点的attribute融合，得到节点的content embedding。

C3，不同类别邻居聚合（也包括了同类型邻居的聚合）

问题：b和c的节点是如何聚合的？？？（也放到了在C3的过程中）

GNN方法

GNN使用深层神经网络，强有力地聚合了邻居节点的特征信息。

而且，GNN天然可以进行归纳式学习(inductive learning)，可为训练过程中未出现过的节点生成嵌入表示。例如GCN、GraphSAGE、GAT。

HetGNN的三个挑战：

其实就是上述的三个过程换成了三个挑战：（直接把解决方案写下面了）

1.为每个节点构造邻居节点，大多数只考虑了一届的邻居，但是不相连的节点比如a和v仍然有作用；同时不同类型的邻居节点数目也不同，例如a有5个直接相连得邻居，c只有2个；

解决：首先设计了一个 带重启的随机游走策略，为HetG中的每个节点采样固定数量的 强关联的异质邻居

2.不同节点的content embedding，如何从异构内容（文本、图像等）获得节点的表示。

解决：用了 RNN编码节点异质内容信息间深度的特征交互信息， 得到每个节点的内容(content)嵌入。

不同类型的邻居节点对目标节点的贡献度不同。比如针对author节点，paper节点比起venue相对更重要。

解决：使用另一个 RNN， 聚合不同类别的邻居节点的嵌入，并且运用了 注意力机制，为不同类型的异质邻居节点分配不同的注意力，得到最终的节点嵌入。

3.问题定义

4.模型介绍

模型总框架由四部分组成，就是前面介绍的C1，C2，C3三个过程加上定义目标函数并设计模型训练过程

以下对四个过程详细描述：

一、C1采样邻居节点

本文采用一种random walk with restart(RWR)方法进行采样，主要有两步：

从节点v随机游走采样，采样固定长度，每次以概率p访问邻居节点或返回初始节点，每种类型节点采样数固定，确保每类节点都会被采样到。
对不同类型的邻居分组，不同类型的邻居，根据采样频率返回前k个

上述采样方法中：

对于每种类型的节点都采样到了
每种类型节点数量相同，并且高频邻居被选择
同种类型的邻居放在了一起，邻居信息可以聚合

二、C2节点异构内容的编码

同一个节点，也往往有多种类型的特征，如图像，文字等，文章提出先对这一类特征进行预训练，如类别特征直接利用one-hot，文本特征利用par2vec，图像特征利用CNN，训练得到每类特征的向量表示后，利用Bi-LSTM进行编码后聚合。

（简而言之就是两步：1.每个属性的embedding。2.多个属性的BILSTM聚合——不用考虑顺序）

好处：以往的方法是将不同的属性特征直接拼接，或者将其线性转换到一个向量中。本文是使用Bi-LSTM捕获深层次的特征交互信息，同时增强了模型的表达能力。

FC是用作维度统一化，将不同尺寸的数据转化成统一规格，双向的LSTM具体运用为：从左开始：LSTM{x0，x1，x2….xn},从右开始LSTM{xn,xn-1…..x2,x1,x0},两部分拼接起来得到一个输出；

论文中提到这种编码方式有以下3个优点：

结构简单参数少，模型实现和微调相对容易；
可融合异质的内容/属性信息，表达能力强；
模型易于扩展，可以额外添加属性特征。

三、C3聚合异质邻居的信息（两个过程分别做如下描述）

（1）同一类型邻居的聚合：same type neighbors aggregation

（2）不同类型邻居的聚合：types combination

针对每种类型的节点进行了聚合，生成了∣ O V ∣个聚合向量，接下来要将它们再聚合起来。由于不同类型的邻居节点对学习到节点v最终的表示贡献度不同，所以使用注意力机制，为不同类型分配不同的注意力。

节点v最终的向量表示为：

f1(v)是中心节点的content embedding.。

f2(v)是type embedding的聚合

（

u∈R2d×1is the attention parameter

四、目标和模型训练

为了执行异构图表示学习，我们用参数Θ:定义以下目标:

由于分母计算的难度，使用负采样，最终优化目标函数为

这部分没太看懂，具体在附录和实践中再仔细琢磨！！！

更新：大概看懂了：v就是当前节点，vc就是正例，就是一阶二阶的同类型content embedding，vc’就是负采样，负采样你们肯定懂，采样到的负例节点的content embedding

上式中的三元组基于图上的随机游走序列生成。大致过程为：生成异构图随机游走序列，基于一个序列选择节点v的正节点v_c，采样生成与v_c对应的节点v的负节点v_c’。

明确目标函数后，模型基于mini-batch的方式训练，优化器是Adam optimizer。不断地进行训练迭代，直至指标收敛为止。

5.实验

该部分只分析实验结果，代码部分见后续博客更新。

代码中使用了学术图数据如下：

实验结果包括：

1.链接预测 2.推荐实验 3.节点分类和聚类 4.inductive的节点分类和聚类(分清直推式和归纳式的区别)，归纳式类似于监督学习，直推式指训练集和测试集的数据都出现在图网络中5.不同模块对实验结果的影响 6.超参数的设置对实验结果的影响

直推式和归纳式：

Original: https://blog.csdn.net/weixin_44630230/article/details/124164611
Author: ren.yz
Title: 异质网络模型HetGNN论文总结理解

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/691980/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

CVPR 2022 Self-augmented Unpaired Image Dehazing via Density and Depth Decomposition个人学习笔记

1. Introduction 雾霾是由气溶胶粒子在大气中的散射效应引起的一种自然现象。它会导致视觉内容的严重模糊，从而给人类观察者和计算机视觉系统带来麻烦。去雾方法的目的是去除雾…

人工智能 2023年6月16日
0089
FindFundamentalMat(python)函数解析——三维视觉

最近在入门三维视觉，在SFM算法的代码中看到了这个函数，没有找到满意的帖子，所以打算自己总结一下。什么是Fundamental Matrix？基础矩阵（Fundamental …

人工智能 2023年5月28日
0050
数学建模|预测方法：灰色预测模型

简介灰色系统理论是由华中理工大学邓聚龙教授于1982年提出并加以发展的。二十几年来，引起了不少国内外学者的关注，得到了长足的发展。目前，在我国已经成为社会、经济、科学技术在等诸多…

人工智能 2023年6月15日
00143
人工智能——监督学习，驱动核心源码详解和Binder超系统学习资源

(2)回归：当输出是连续的，学习任务为回归任务。 2 分类任务 3 回归分析 ; 3.1 回归回归：统计学分析数据的方法，目的在于了解两个或多个变数间是否相关、研究其相关方向与强…

人工智能 2023年6月17日
0073
【Pandas 数据分析4-2】Pandas 基础操作

目录 4.4 位置计算 4.4.1 位置差值diff() 4.4.2 位置移动shift() 4.4.3 位置序号rank() 4.5 数据选择 4.5.1 选择列 4.5.2 切…

人工智能 2023年7月7日
0083
HMM(隐马尔科夫模型)

HMM模型基础隐马尔科夫模型（Hidden Markov Model，以下简称HMM）是比较经典的机器学习模型了，它在语言识别，自然语言处理，模式识别等领域得到广泛的应用。当然，…

人工智能 2023年5月27日
0091
机器学习常见问题

文章目录一、过拟合 * 过拟合的原因解决过拟合方法二、Bagging和Bosting * Bagging介绍 Boosting介绍 Bagging和Boosting的区别三…

人工智能 2023年7月17日
0060
Pytorch创建多任务学习模型

在机器学习中，我们通常致力于针对单个任务，也就是优化单个指标。但是多任务学习(MTL)在机器学习的许多应用中都取得了成功，从自然语言处理和语音识别到计算机视觉和药物发现。 MTL最…

人工智能 2023年7月21日
00113
C++基础10：并行加速与OpenCV数据结构

目录一.程序加速 1.编程基本原则 2.代码优化策略 3.SIMD 4.openMP 二.避免内存拷贝（OpenCV） 1.什么是图像 2.Mat 3.Step 4.ROI 一….

人工智能 2023年7月20日
0050
如何使用Keras构建一个全连接神经网络

介绍本文将详细解决如何使用Keras构建一个全连接神经网络的问题。全连接神经网络是一种最基本的神经网络模型，其每个神经元与上一层的所有神经元相连。我们将首先介绍全连接神经网络的算…

人工智能 2024年1月4日
0028
Python：从清华源安装第三方库

python 在使用pip安装的时候，一些小一点的还好，安装一些大的包的时候，会非常的慢甚至出现timeout的报错，这时我们就可以使用清华大学的镜像来安装，打开终端： pip i…

人工智能 2023年7月29日
0059
NeuS: Learning Neural Implicit Surfaces by Volume Rendering for Multi-view Reconstruction 论文笔记

文章目录 Related Works 方法 * Rendering Procedure – 场景表示 Scene Representation 渲染 Rendering…

人工智能 2023年6月25日
0044
Pandas:如何修改DataFrame中某一列的值？

写这篇博客主要是因为在修改DataFrame列值的时候经常遇到bug，但到目前还没把这种错误复现出来。 DataFrame是Pandas中的主要数据结构之一，本篇博客主要介绍如何D…

人工智能 2023年7月8日
0053
聚类算法之密度聚类方法

密度聚类方法 DBSCAN DBSCAN算法的若干概念 DBSCAN具体实现步骤 DBSCAN的优缺点密度聚类方法的核心思想是，只要样本点的密度大于某阈值，则将该样本添加到最近的…

人工智能 2023年5月31日
0083
【机器学习】sklearn实现SVM分类算法

概念讲解 1.什么是支持向量机?#小鲸云课堂的说法支持向量机(support vector machines,SVM)是一种二分类模型，它的基本模型是定义在特征空间上的间隔最大的…

人工智能 2023年6月30日
0095
Linux环境下OpenCV的安装与配置

目录安装 1.准备工作 1.1C/C++编译环境配置 1.2安装相关依赖库 2.安装OpenCV 3.OpenCV测试问题汇总问题1：部分软件包无法下载，网络连接失败问题2…

人工智能 2023年6月18日
0088

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

异质网络模型HetGNN论文总结理解

大家都在看