Embracing Domain Differences in Fake News- Cross-domain Fake News Detection using Multimodal Data-AAAI21

2023年10月28日上午8:03 • Python • 阅读 47

一、摘要

随着社交媒体的快速发展，假新闻已经成为一个重大的社会问题，它无法通过人工调查及时解决。这激发了大量关于自动假新闻检测的研究。

大多数研究探索了基于新闻记录中不同模态信息（如文本、图像和传播网络）的有监督模型来识别假新闻。然而，如果新闻记录来自不同的领域（如政治、娱乐），特别是在训练时未见过的或很少见过的领域，这些方法的效果通常会下降。

本文经过探索性数据分析发现，来自不同领域的新闻记录具有显著不同的单词使用模式和传播模式。此外，由于未加标签的新闻记录数量庞大，选择新闻记录进行人工加标签，从而使加标签数据集的域覆盖最大化具有挑战性。因此，本工作：

提出了一种新的框架，在新闻记录中联合保存特定领域和跨领域的知识，以检测来自不同领域的假新闻；
设计了一种选择一组未标记的Informative新闻记录进行人工标签的无监督方法，其结果可用于训练一个假新闻检测模型，训练好的模型在许多领域表现良好，同时最小化标签成本。

实验表明，所提出的假新闻模型和选择性标注方法在跨领域新闻数据集上取得了最先进的性能，同时对新闻数据集中很少出现的领域有了显著的改进。

二、内容

**本文的创新是在跨领域假新闻检测问题上，从文本和传播网络的多模态数据中联合提取领域不变和领域特定的，来缓解跨领域检测问题。

其中，本文设计了一种基于网络社区的无监督领域划分，来获取新闻记录的领域嵌入。

后续，在假设标注预算有限的情况下，使用局部敏感哈希LSH将相似的记录分到同一个桶，从而实现经可能均匀地选择不同领域的样本来进行标注，从而提升领域覆盖度。

下图为论文PPT总结。

Embracing Domain Differences in Fake News- Cross-domain Fake News Detection using Multimodal Data-AAAI21

Original: https://www.cnblogs.com/justLittleStar/p/17055337.html
Author: LeonYi
Title: Embracing Domain Differences in Fake News- Cross-domain Fake News Detection using Multimodal Data-AAAI21

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/806750/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Python 文件的读写操作

Python 在文件读写操作中，会使用「内置函数」和「Pandas 库」两种方式。先来看内置函数，包括 open()、read()、readline()、readlines()、…

Python 2023年7月31日
0064
三、pytest的断言

常用的断言 assert assert关键字后面可以接一个表达式，只要…

Python 2023年9月10日
0057
flask中的session伪造问题

前言这段时间刷题遇见过几次在flask框架中伪造session的，也经常和其他flask框架的两大漏洞SSTI和py反序列化结合来考，今天就写这篇文章学习一下在ctf题目里fla…

Python 2023年8月14日
0065
遥感影像语义分割难点对应解决思路

目录一、像素级精度问题 1. 结合多尺度特征 1.1 空洞卷积 1.2 转置卷积和跳跃连接 1.3 将边缘图集成到分割 2. 基于数据融合的策略 2.1 结合几何和光谱信息来提高…

Python 2023年10月26日
0033
ElasticSearch实战系列六: Logstash快速入门

前言本文主要介绍的是ELK日志系统中的Logstash快速入门 ELK介绍 ELK是三个开源软件的缩写，分别表示：Elasticsearch , Logstash, Kibana…

Python 2023年6月3日
0079
pytest-进阶

pytest-进阶一、什么是自动化测试框架？二、自动化前置条件三、fixture装饰器实现部分用例的前后置 * 1.它存在的意义？ 2.声明方式： 3.五个参数解析 4.五…

Python 2023年9月14日
0044
python第三方库02：NumPy基础及取值操作

文章目录前言一、NumPy是什么？二、使用步骤 * 1.引入库 2.什么是ndarray对象 3.如何实例化ndarray对象 – 3.1列表实例化 3.2zer…

Python 2023年8月27日
0057
【python游戏制作】拼图永不过时，这就是我这个年龄该玩的游戏~

前言嗨喽~大家好呀，这里是魔王呐 ! 拼图游戏是广受欢迎的一种智力游戏，它的变化多端，难度不一它分为单面拼图、双面拼图、立体拼图、球形拼图、虚拟拼图今天我就给带来虚拟的单面拼…

Python 2023年9月18日
0060
阿里天池数据分析入门利用Pandas分析数据

pd.read_csv用法 ccl = pd.read_csv("1_usa_candidate/ccl.txt", sep = ‘|’,names=[‘CAN…

Python 2023年8月20日
0056
Lua 支持虚函数的解决方案

概述 2023-02 据实际开发情况，对原来的方案优化，放在了后面 lua的__index元方法本身没有提供类似C++虚函数机制，调用的父类方法调用虚函数可能会出现问题。问题分析…

Python 2023年10月22日
0038
Flask 学习-85.Flask-SQLAlchemy 多个不确定条件查询

在后台管理数据的时候，经常会有多个条件查询，查询参数可以是一个也可以是多个，如果没有查询参数就返回全部数据。 SQLAlchemy 使用query查询的时，可以使用filter()…

Python 2023年8月9日
0081
送你一个Python 数据排序的好方法

摘要：学习 Pandas排序方法是开始或练习使用 Python进行基本数据分析的好方法。最常见的数据分析是使用电子表格、SQL或pandas 完成的。使用 Pandas 的一大优点…

Python 2023年8月17日
0037
python 绘图库Matplotlib总结

本节导图：https://www.processon.com/view/link/5fde0dbfe0b34d66b824203b 绘图库Matplotlib matplotib是…

Python 2023年9月1日
0062
正则表达式

文章目录一、正则初体验二、匹配规则三、字符串方法的使用 ; 一、正则初体验正则表达式是特殊的字符序列，利用事先定义好的特定字符以及他们的组合组成了一个规则，然后检查一个字符…

Python 2023年8月22日
0046
SwinUnet官方代码训练自己数据集（单通道灰度图像的分割）

码字不易，收藏之余，别忘了给我点个赞吧！ ———Start 关于swinUnet网络的测试部分请移步另一篇博文官方代码：https://git…

Python 2023年7月31日
00189
【知识图谱】实践篇——基于知识图谱的《红楼梦》人物关系可视化及问答系统实践：part2知识获取与图谱构建、服务搭建

前序文章：【知识图谱】实践篇——基于知识图谱的《红楼梦》人物关系可视化及问答系统实践：part1项目介绍与环境准备 ; 知识获取与图谱构建其中原项目提供了关系数据如下：其中五列…

Python 2023年8月10日
0064

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Embracing Domain Differences in Fake News- Cross-domain Fake News Detection using Multimodal Data-AAAI21

大家都在看