KBQA 常用数据集之MetaQA

2023年7月14日上午3:59 • 人工智能 • 阅读 73

论文相关

MetaQA [Zhang et al., 2018]
源自论文：Variational reasoning for question answering with knowledge graph

数据集：https://github.com/yuyuz/MetaQA（也可以直接点击下边链接下载数据集：https://drive.google.com/drive/folders/0B-36Uca2AvwhTWVFSUZqRXVtbUE?resourcekey=0-kdv6ho5KcpEXdI2aUdLn_g）

各种模型在MetaQA上的性能比较：MetaQA Dataset | Papers With Code

数据集概述

MetaQA是 Movie Text Audio QA的缩写。

2.1 内容介绍

数据集提供问答对，不提供SPARQL查询。这个数据集包括3个主要的组件：

① Vanilla text data

它总共有三个数据集：1-hop，2-hop，3-hop。其中 1-hop源自Facebook MovieQA(也称 WikiMovies)数据集中的”wiki_entities”分支，相比MovieQA，Vanilla 1-hop 移除了问题中有歧义的实体，故该数据集也相对较小。

2-hop和3-hop也源于同一个知识库。其中2-hop有21种问题类型，3-hop有15种问题类型，每种类型都有10种文本模板。(如下图所示)

② NTM(Neural translation model) text data

在神经翻译模型的帮助下，可以自动引入更多的问题变量。我们将Vanilla数据集中的每个问题翻译成法语，然后用beam search 将其翻译回英语，以得到一个释义问题。实体被证实保留在释义问题中。

③ Audio data

用 Google text-to-speech API 读取Vanilla数据集中所有的问题并将音频保存为mp3文件。为了用户的方便，我们还提供对每个问题提取的MFCC特征。

2.2 使用的知识库

MetaQA中的所有问题都是从MovieQA中的电影知识库Wikidata中生成的。

知识库中存储的三元组形式： subject|relation|object

例：

2.3 数据统计

该数据集给1-hop,2-hop,3-hop分别提供了train / dev / test ，且所有组件数据划分相同。数据集划分情况如下：

MetaQA数据集划分情况 1-hop2-hop3-hopTrain96,106118,980114,196Dev9,99214,87214,274Test9,94714,87214,274

2.4 文件内容介绍

kb.txt:知识库。每行都是一个知识三元组。

qa_(test/train/dev)_qtype.txt:问题类型相关文件(将性能分解为不同的问题类型，通常用于QA系统的评估)

entity(文件夹):存储了知识库中所有实体的音频。

entity_mp3.tar.gz:初始的MP3文件(与kb_entity_dict.txt中的索引顺序一致)；

kb_entity_dict.txt:有索引的实体(从0开始)；

kb_entity.npz:提取到的每个实体的MFCC特征。

模型性能比较

这一部分主要是根据我看的论文进行了整理，在MetaQA数据集上的性能比较。

各模型在MetaQA数据集上的表现模型(年份)跳数

Vanilla

Hit@1

论文代码链接

KV-Mem(KV-MemNN)(2016)

1-hop 2-hop 3-hop

95.8

25.1

10.1
Key-value memory networks for directly reading documents Key-Value Memory Networks for Directly Reading Documents | Papers With Code

VRN(2017)1-hop 2-hop 3-hop

97.5

89.9

62.5
Variational Reasoning for Question Answering with Knowledge Graph GitHub – yuyuz/Variational-Reasoning-Networks

GRAFT-Net(2018)1-hop 2-hop 3-hop

97.0

94.8

77.2
Open domain question answering using early fusion of knowledge bases and text https://github.com/haitian-sun/GraftNet

PullNet(2019)1-hop 2-hop 3-hop

97.0

99.9

91.4
Pullnet: Open domain question answering with iterative retrieval on knowledge bases and text

SRN(2020)1-hop 2-hop 3-hop

97.0

95.1

75.2
Stepwise reasoning for multi-relation question answering over knowledge graph with weak supervision

EmbedKGQA(2020)1-hop 2-hop 3-hop

97.5

98.8

94.8
Improving multi-hop question answering over knowledge graphs using knowledge base embeddings https://github.com/malllabiisc/EmbedKGQA

ReifKB(2020)

1-hop

2-hop

3-hop

96.2

81.1

72.3

Scalable neural methods for reasoning with a symbolic knowledge base

RecHyperNet(2021)

1-hop

2-hop

3-hop

99.1

99.2

95.0
Knowledge Base Question Answering through Recursive Hypergraphs

TransferNet(2021)1-hop 2-hop 3-hop

97.5

100

100
TransferNet: An Effective and Transparent Framework for Multi-hop Question Answering over Relation Graph https://github.com/shijx12/TransferNet

NSM(2021)1-hop 2-hop 3-hop

97.1

99.9

98.9

Improving Multi-hop Knowledge Base Question Answering by Learning Intermediate Supervision Signals https://github.com/RichardHGL/WSDM2021_NSM

BART-large(2021)3-hop99.9
Unseen Entity Handling in Complex Question Answering over Knowledge Base via Language Generation

以上整理的内容若有不正确的地方，欢迎大家评论补充~

Original: https://blog.csdn.net/lft_happiness/article/details/122864711
Author: Toady 元气满满
Title: KBQA 常用数据集之MetaQA

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/691251/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

TypeError: ‘cv2.CascadeClassifier‘ object is not callable

【opencv】:TypeError: ‘cv2.CascadeClassifier’ object is not callable 问题 &#x6…

人工智能 2023年7月20日
0085
torch.nn.functional.interpolate()函数详解

通常可以使用pytorch中的torch.nn.functional.interpolate()实现插值和上采样。上采样，在深度学习框架中，可以简单理解为任何可以让你的图像变成…

人工智能 2023年5月26日
00110
自然语言处理NLP系列：第二次星空智能对话机器人Zoom线上演示安排

时间：北京时间2021年9月1号晚上9-10:30 地点：Zoom (会议前一天会在群中发布会议链接，大家可以通过https://zoom.us/download安装下载) 内容：…

人工智能 2023年6月1日
0069
kaggle比赛：Classify Leaves（使用resnet50预训练模型进行：图片树叶分类）

目录 1、比赛介绍： 2、数据划分： 3、图像增广： 4、读取数据： 5、模型构造： 6、计算损失： 7、模型训练： 8、模型推理： 9、上传预测结果到kaggle: 本文内容来源…

人工智能 2023年7月2日
0098
python-matplotlib给图像添加文本标签与注释

python-matplotlib给图像添加文本标签与注释文章目录 1.添加文本标签 plt.text() 2. 添加注释 plt.annotate() ʚʕ̯•͡˔•̯᷅ʔɞʚ…

人工智能 2023年7月4日
0089
爬虫+数据可视化分析

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档简单爬虫及数据分析一、前程无忧数据分析岗位爬虫二、Python 数据清洗+可视化分析 * 1.数据清洗 2. …

人工智能 2023年7月15日
00101
java实现语音识别功能_Java实现的百度语音识别功能示例

本文实例讲述了Java实现的百度语音识别功能。分享给大家供大家参考，具体如下： SDK以及示例代码下载地址： http://yuyin.baidu.com/sdk 最近一直在搞ja…

人工智能 2023年5月25日
00106
ubuntu如何升级python版本号

步骤总结 ubuntu升级python版本号的方法：1、打开ubuntu终端；2、输入命令获取最新的python3.6；3、输入命令移除旧版本；4、输入命令更换默认python3版…

人工智能 2023年7月4日
0094
论文阅读 TEMPORAL GRAPH NETWORKS FOR DEEP LEARNING ON DYNAMIC GRAPHS

14 TEMPORAL GRAPH NETWORKS FOR DEEP LEARNING ON DYNAMIC GRAPHS link:https://scholar.google…

人工智能 2023年6月4日
0081
字节跳动多媒体实验室联合 ISCAS 举办第二届神经网络视频编码竞赛

近日，ISCAS 宣布将于 2023 年 5 月 21 日 – 5 月 25 日在美国加州蒙特雷举办。作为 IEEE 旗下电路与系统学会旗舰会议，本届 ISCAS 将继…

人工智能 2023年7月12日
0073
unity 访问安卓相册获取图片或视频

项目要解决的问题：unity访问安卓相册获取图片或视频，且该activity不能继承UnityPlayerActivity（避免与其他包起冲突）解决方式：在C#中获取UnityPl…

人工智能 2023年5月25日
0085
重启随机游走(RWR)算法

RWR介绍 Random Walk with Restart(RWR) RWR是最早提出的一种用于图像分割的算法。它迭代地探索网络的整体结构，以估计两个节点之间的接近度(亲和力分数…

人工智能 2023年7月17日
0084
Tensorflow Object Detection库使用及训练预测自己的数据集

接着前面系列博客讲，此篇来介绍下tensorflow的模型库的使用，当前安装tensorflow的时候，models中库不会自动安装，可能对比pytorch，会觉得tensorfl…

人工智能 2023年5月25日
0090
R语言把dataframe中的字符类型数据列转化为数值类型数据列、使用as.numeric函数

R语言把dataframe中的字符类型数据列转化为数值类型数据列、使用as.numeric函数目录 R语言把dataframe中的字符类型数据列转化为数值类型数据列、使用as.n…

人工智能 2023年6月15日
00102
机器学习笔记 – 时间序列使用机器学习进行预测

一、概述在最基本的情况下，我们将预测视为一个简单的回归问题，所有特征都来自单个输入，即时间索引。只需生成想要的趋势和季节性特征，我们就可以轻松地创建未来任何时间的预测。然后，…

人工智能 2023年6月16日
00117
基于mmdetection 旋转目标检测（OBB detection)+DOTA数据集&自定义数据集+配docker

这两周得益于组里的任务需求，肝了一个遥感类的飞机旋转框目标检测，在给定的4096*4096的大尺度分辨率图片上去识别检测飞机。经过模型检测后输出结果图如下图所示：可以看到最终的结…

人工智能 2023年5月28日
00114

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

KBQA 常用数据集之MetaQA

2.1 内容介绍

2.2 使用的知识库

2.3 数据统计

2.4 文件内容介绍

大家都在看