谣言检测（GACL）《Rumor Detection on Social Media with Graph Adversarial Contrastive Learning》

2023年10月20日下午3:23 • Python • 阅读 34

论文标题：Rumor Detection on Social Media with Graph AdversarialContrastive Learning
论文作者：Tiening Sun、Zhong Qian、Sujun Dong
论文来源：2022, WWW
论文地址：download
论文代码：download

尽管基于GNN的方法在谣言检测领域取得了一些成功，但是这些基于交叉熵损失的方法常常导致泛化能力差，并且缺乏对一些带有噪声的或者对抗性的样本的鲁棒性，尤其是一些恶意谣言。有时，仅仅设置一个简单的扰动就会导致标签被高度置信地错误分类，这对谣言分类系统无疑是一个巨大的潜在危害。因此，现有的数据驱动模型需要变得更加健壮，以应对通常由正常用户无意识地产生和传播的错误信息或者由谣言制造者恶意设计的混乱对话结构。

在本文中，我们提出了一种新的图对抗对比学习（GACL）方法来对抗这些复杂的情况，其中引入对比学习作为损失函数的一部分，用于明确感知同类和不同类的会话线程之间的差异。同时，设计了一个对抗性特征变换（AFT）模块来产生相互冲突的样本，以加压模型以挖掘事件不变的特征。这些对抗性样本也被用作对比学习的硬负样本，使模型更鲁棒和有效。在三个公共基准数据集上的实验结果表明，我们的 GACL 方法比其他最先进的模型取得了更好的结果。

本文提出一个图对抗对比学习（GACL）方法谣言检测。具体来说，首先采用 edge perturbation 和 dropout 等图数据增强策略掩模来模拟 Figure 1(b) 的情况，它为模型提供了丰富噪声的输入数据。然后，我们引入 Figure 2 所示的监督图对比学习来训练 GNN 编码器明确地感知增强数据的差异，并学习鲁棒表示。与自监督对比学习策略不同，本文的方法可以更有效地利用标签信息。这样，就可以防止在一些包含噪声的情况下，如错误的注释和混乱的字符被检测模型错误地分类。

本文贡献：

*
– 据我们所知，这是第一个将对比学习引入谣言检测任务的研究，旨在通过感知同一标签和不同标签样本之间的差异来提高表征质量。
– 我们提出了GACL模型，它不仅考虑了谣言的传播结构信息，还模拟了噪声和对抗性情况，并利用对比学习捕获了事件不变特征。
– 在GACL框架下，我们开发了AFT模块来生成对抗性特征，这些特征作为对比学习中的硬负样本，以学习更鲁棒的表示。
– 我们通过实验证明，我们的模型在真实世界的数据集上优于最先进的基线。

2.1 Definition

本文将谣言检测定义为一种分类任务，其目的是从一组带标签的训练事件中学习一个分类器，然后用它来预测测试事件的标签。使用 $C=\left{c_{1}, c_{2}, \cdots, c_{n}\right}$ ， $c_{i}$ 是第 $i$ 个事件， $n$ 是事件的数量。每个事件 $c=(y, G)$ 包含 ground-truth 标签 $y \in{R, N}$ (也就是 Rumor 和 Non-rumor) 和其传播结构树 $G=(V, E)$ ， $V$ 和 $E$ 分别是节点和边的集合。有时谣言检测被定义为一个四类的分类任务，相应的 $y \in{N, F, T, U}$ ( Non-rumor、False Rumor、True Rumor、Unverified Rumor)。在模型训练阶段，$\hat{G}$ 由数据增强生成，目的是与原图 $G$ 一起学习一个分类器 $f(\cdot)$ 。在测试阶段，只有原图 $G$ 会被用来预测给定事件 $c_{i}$ 的标签。

2.2 Framework

2.3 Graph Data Augmentation

GACL采用 Edge perturbation 策略进行数据增强。对于一个图 $G=(V, E) $ ，其邻接矩阵为 $A$ ，特征矩阵为 $X$ ， Edge perturbation 在训练时将会根据一定的概率 $r$ 来随机丢弃、添加或者误置一些边，以此来干扰 $G$ 的连接。假设新生成的增强图为 $\hat{G}^{\prime}$，$A_{\text {perturbation }}$ 为一个从原来的边集合中随机采样的矩阵，则 $\hat{G}$ 的邻接矩阵 $A^{\prime}$ 可以计算为对谣言制造者设计的伪装结构。

此外，对于谣言检测任务，上图中由 $post$ 组成的图节点的文本信息也是正确分类谣言的关键线索之一，还需要对其进行增强以提供一些噪声。本文采用 Dropout mask 来对这些文本进行增强，也就是随机 mask 每个 post 中的一些词，如上图所示。

2.4 Graph Representation

本文使用 BERT 来获取事件的原文和评论的句子表示，以构建新的 $X$ 。为了强调 source post 的重要性，以 [CLS] Source [SEP] Comment [SEP] 的形式来将原文和评论连接起来，以 [CLS] 这个 token 的最终表示作为节点的表示。

本文使用一个两层 $\mathrm{GCN}$ 作为 encoder 。当前图记为 $G_{k} $ ，其增强图为 $\hat{G}{k}$ ，经过两层 $\mathrm{GCN}$ 后学习到的节点表示矩阵为 $H{k}^{(2)}$ ，最后使用一个 mean-pooling 来获得图的表示：

$h_{k}=M E A N\left(H_{k}^{(2)}\right)$

2.5 AFT Component

即使 AFT module 不存在，由 GCN 生成的图表示 $h$ 也可以直接输入最终的 $softmax$ 层进行谣言分类。然而，由于该模型在训练阶段只暴露于包含随机噪声的数据增强生成的输入样本中，因此它缺乏对对抗性样本（特别是一些被人类仔细干扰的数据）的鲁棒性，如 Figure1(c). 所示为了逃避模型检测，谣言产生者可能会使用图伪装策略，使会话线程更接近非谣言实例，从而混淆了图检测模型。他们也可以利用谣言机器人来发布大量的评论，其中包含许多高频和指示性的词，以掩盖事实。这些案例的最终目标是使谣言特征向量更接近于潜在空间中的非谣言特征向量。提出的基于对抗学习的 AFTmodule 试图在高维空间中模拟这些行为，并生成对抗向量，用于挖掘训练阶段的事件不变特征。

如 Figure 3 所示，AFT 由 $L = 2$ fully connected layers、Dropout 和 Normalization (DN) 组成。经过 AFT module 后，$h_k$ 转换为 $z_k$，公式为

$z_{k}=D N\left(\max \left(0, h_{k} W_{1}^{A F T}+b_{1}\right) W_{2}^{A F T}+b_{2}\right)$

将得到的 $z_k$ 向量作为对比学习中的硬负样本。

现在，对于 batch 中的每一个 post，我们得到了 GCN 编码的相应图表示 $h_{k}$，以及 AFT 生成的对抗表示 $z_{k}$。然后，我们将它们连接起来，以将信息合并为

$m_{k}=\operatorname{concat}\left(h_{k}, z_{k}\right)$

接下来，将 $m_{k}$ 输入全连接层和 softmax 层，输出计算为

$\hat{y}{k}=\operatorname{softmax}\left(W{k}^{F} m_{k}+b_{k}^{F}\right)$

其中，$\hat{y} \in \mathbb{R}^{1 \times C}$ 为预测的概率分布。$W^{F}$ 和 $b^{F}$ 分别为可训练的权重矩阵和偏差。

2.6 Adversarial Contrastive Learning

本文采用的损失函数旨在给定标签信息的条件下最大化正样本之间的一致性同时拉远负样本。如 Figure 3 ，以 $m_{k}$ 作为锚点，具备与 $m_{k}$ 相同标签的 $m_{p}$ 作为正样本，具备与 $m_{k}$ 不同标签的 $m_{a}$ 作为负样本。对比损失的目的是让具有相同标签的样本余弦相似度变大，具有不同标签的样本余弦相似度变小。最终的损失函数为:

$\mathcal{L}=\mathcal{L}{c e}+\alpha \mathcal{L}{s u p}$

这两部分损失分别是：

$\mathcal{L}{c e}=-\frac{1}{N} \sum\limits ^{N} \sum\limits^{M} y{k, c} \log \left(\hat{y}_{k, c}\right)$

${\large \mathcal{L}{s u p}=-\sum\limits {k \in K} \log \left{\frac{1}{|P(k)|} \sum\limits {p \in P(k)} \frac{\exp \left(\operatorname{sim}\left(m{k}, m_{p}\right) \tau\right)}{\sum\limits {a \in A(k)} \exp \left(\operatorname{sim}\left(m{k}, m_{a}\right) \tau\right)}\right}} $

$k$ 代表第几个样本， $c$ 代表类别， $A(k)=\left{a \in K: y_{a} \neq y_{k}\right}$ 是负样本索引，$P(k)=\left{p \in K: y_{p}=y_{k}\right}$ 是正样本索引， $\operatorname{sim}(\cdot)$ 为余弦相似度，即 $\operatorname{sim}\left(m_{k}, m_{p}\right)=m_{k}^{T} m_{p} /\left\|m_{k}\right\|\left\|m_{p}\right\|$ ， $\tau \in \mathbb{R}^{\dagger}$ 是温度超参数。

一部分研究表明BERT驱动的句子表示容易造成坍塌现象，这是由于句子的语义信息由高频词主导。在谣言检测中，高频词经常被谣言制造者利用来逃避检测。因此采用对比学习的方式能够平滑化句子的语义信息，并且理论上能够增加低频但重要的词的权重。本文通过最小化 $\mathcal{L}$ 来更新模型的参数，但不包括 AFT 的参数。

AFT 基于对抗学习单独训练。模型中 AFT 的参数记作 $\theta_{a}$ ，其他参数记作 $\theta_{s}$ 。在每一个 epoch 中，我们最小化 $\mathcal{L}$ 来更新 $\theta_{s}$ ，最大化 \mathcal{L} 来更新 \theta_{a} 。我们利用对抗学习来最小化对抗样本与相同标签样本的一致性，最大化对抗样本与不同标签样本的一致性。整个算法如下:

Datasets

Results

Ablation study

Early Rumor Detection

本文提出了一种新的谣言检测模型，即GACL。首先，采用训练前模型BERT获得GACL中每个帖子的表示，然后使用GCN对谣言传播的结构信息进行编码。其次，引入对比学习，通过捕获同一类实例之间的共性和不同类实例之间的差异来提高表示的质量。最后，将AFT模块加载到模型中，采用对抗性学习策略进行训练，以生成对抗性特征。这些对抗性特征在对比学习中作为硬负样本，并在训练阶段作为输入向量的一部分输入到softmax模块中，有利于捕获事件不变特征。实验结果表明，我们的GACL方法对三个公共真实数据集的谣言检测具有良好的有效性和鲁棒性，并且在早期谣言检测任务中显著优于其他最先进的模型。

我们未来的工作将集中于多模态信息的融合和提取、偏见检测和模型决策的可解释性。

Original: https://www.cnblogs.com/BlairGrowing/p/16737902.html
Author: 加微信X466550探讨
Title: 谣言检测（GACL）《Rumor Detection on Social Media with Graph Adversarial Contrastive Learning》

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/801732/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Python+OpenCV手势识别Mediapipe（基础篇）

Python+OpenCV手势识别Mediapipe（新手入门）前言 * 项目效果图认识Mediapipe 项目环境代码 * 核心代码 – 视频帧率计算完整代码…

Python 2023年8月1日
0055
[美化] 博客园美化历程

标题上写着美化，但怎么看自己的界面，仿佛每条线都在呐喊着：”实际上是简化吧！” /扶额在入驻博客园的一周时间里，我使用各种课上时间抽空研究了一下博客园的页…

Python 2023年6月6日
0073
Pygame实战：传承四十年的封神之作—炸弹人学院游戏【附源码】

导语在现在这个浮躁的年代：小编每次登陆王者荣耀，还有每次登陆刺激战场Z！看着里面的聊天界面，各种代打、各种的找cp。小小编觉得，我们已经失去了玩游戏的初心。接下来，小台将带领…

Python 2023年9月23日
0046
999策略手机论坛_scrapy爬虫学习系列一：scrapy爬虫环境的准备

系列文章列表： 1.scrapy简介 Scrapy是一个为了爬取网站数据，提取结构性数据而编写的应用框架。可以应用在包括数据挖掘，信息处理或存储历史数据等一系列的程序中。 1.1…

Python 2023年10月3日
0047
python dataframe dropna_python DataFrame方法汇总,导入表

import pandas as pd import numpy as np 读取excel数据 df=pd.read_excel(“data/朝阳区药品销售数据.xl…

Python 2023年8月8日
0053
Centos8搭建Redis Cluster集群

准备集群搭建之前需要先安装单机版 cd /usr/local wget http://download.redis.io/releases/redis-4.0.7.tar.gz …

Python 2023年11月7日
0030
python爬虫框架——scrapy(3) scrapy中间件

此文主要是按照上一篇的介绍能够定制爬虫项目中间件，scrapy框架里面的代码和基本和上一篇的相同，这里进行一一介绍。这是scrapy框架的流程图（scrapy原理，安装方法都在上一…

Python 2023年10月5日
0048
Python123题库—04简单循环

1. 用一行代码求和类型：简单循环描述‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬…

Python 2023年5月24日
00123
Flask 极致细节：1. 路由和请求响应规则，GET/POST，重定向

Flask 极致细节：1. 路由和请求响应规则，GET/POST，重定向提示：此博客包含如下概念的介绍：路由（装饰器），请求与响应（Request&Response），G…

Python 2023年8月14日
0089
【NumPy基础】- Numpy数组和矢量计算

🤖🤖🤖🤖 欢迎浏览本博客 🤖🤖🤖🤖😆😆😆😆😆😆😆大家好，我是：我菜就爱学😆😆😆😆😆😆😆一名刚刚入行的小白👻👻👻👻从事方向：计算机视觉🔔🔔我菜就爱学，分享有误，欢迎大佬指出🔔🔔🌏🌏🌏…

Python 2023年8月24日
0052
pygame 之最小开发框架&壁球游戏

看了几个小时课本，企图看懂。但是几个小时之后我放弃了这样的尝试。之前提到的课本里讲述pygame是从类入手的。这对于一个类学了半吊子的家伙，显然并不友好。于是，我果断放弃了课本，…

Python 2023年9月21日
0048
response 200是什么_2个案例带你快速实现Response返回值

今天先来学习一下 Response的相关知识。所有返回前台的内容其实都应该是 Response的对象或者其子类，我们看到如果返回的是字符串直接可以写成 return u’&amp…

Python 2023年8月13日
0055
动手实现深度学习(4): 神经网络的backward实现

在第二篇中介绍了用数值微分的形式计算神经网络的梯度，数值微分的形式比较简单也容易实现，但是计算上比较耗时。本章会介绍一种能够较为高效的计算出梯度的方法：基于图的误差反向传播。根据…

Python 2023年10月28日
0044
Python代码阅读（第35篇）：完全（深度）展开嵌套列表

本篇阅读的代码实现了将一个嵌套列表的所有嵌套层次完全展开，形成一个简单的列表的功能。 deep_flatten from collections.abc import Iterab…

Python 2023年6月15日
0077
Django之路由配置

Django之路由配置 path()函数导入：from django.urls import path 语法：path(route,views,name=None) 参数： 1….

Python 2023年8月6日
0053
OpenAI最新对话模型ChatGPT：文本生成实用化的曙光！ChatGPT实践指南-手把手教你Chat with ChatGPT!

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

Python 2023年11月3日
0076

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31