论文浅尝 – EMNLP2020 | ConceptBert：视觉问题回答的概念感知表示

2023年6月10日上午4:56 • 人工智能 • 阅读 80

笔记整理 | 陈卓，浙江大学计算机科学与技术系，博士研究生

研究方向 | 知识图谱/图神经网络/多模态

论文浅尝 - EMNLP2020 | ConceptBert：视觉问题回答的概念感知表示

论文链接：https://www.aclweb.org/anthology/2020.findings-emnlp.44.pdf

代码：https://github.com/ZiaMaryam/ConceptBERT

发表会议：EMNLP 2020

任务核心ideas

模型概览

流程如下：

得到对应模态的嵌入表示
通过两个并行模态融合模块
*
视觉-语言（输出2个向量）
知识-语言（输出1个向量）
聚合三种向量
*
带有语言信息的视觉向量
带有视觉信息的语言向量
带有外部知识的语言向量
分类器进行答案分类

背景知识

借鉴AAAI2020的一篇文章（Commonsense knowledge base completion with structural and semantic context）中所提到的ConceptNet embedding 作为I2020 常识概念图中的实体表示

借鉴NIPS2019中一篇文章中的多模态交叉attention方法，交叉视觉和语言两条stream分别使用了自己的query和来自另一边的key和value向量，进行信息融合

模型方法

输入模块：

编码模块：

包括：

1：图片与bert的联合编码

2：bert与Kgembedding的联合编码

3：3个编码方式的聚合

实验

作者在OK-VQA数据集上达到了sota，但是在VQA标准数据集VQA2.0上并没有达到。主要原因是因为该方法侧重于常识与背景知识，在trick上不如当前SOTA的VQA模型（效果接近76%）。

同时，该论文避开了FVQA数据集，猜测原因是在该数据集上表现不佳（该数据上大部分方法都是基于pipeline，这种end2end的方法不好去对标）

总结与灵感

常识知识库某种程度上可增强许多VQA任务，哪怕不是显式地需要外部知识
多模态任务中以图的形式引入外部知识依然有很大的潜力可以挖掘
预训练fine-tune +（交叉）注意力机制 + 外部知识 + KG图结构 – – > 信息最大化

OpenKG

开放知识图谱（简称 OpenKG）旨在促进中文知识图谱数据的开放与互联，促进知识图谱和语义技术的普及和广泛应用。

点击 阅读原文，进入 OpenKG 网站。

Original: https://blog.csdn.net/TgqDT3gGaMdkHasLZv/article/details/113009524
Author: 开放知识图谱
Title: 论文浅尝 – EMNLP2020 | ConceptBert：视觉问题回答的概念感知表示

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/595394/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

明火烟雾目标检测项目部署（YoloV5+Flask）

明火烟雾目标检测项目部署文章目录明火烟雾目标检测项目部署 1. 拉取Docker PyToch镜像 2. 配置系统环境 * 2.1 更换软件源 2.2 下载vim 2.3 解决…

人工智能 2023年7月9日
0092
Word2Vec实战

Word2Vec实战 – 潘登同学的NLP学习笔记文章目录 * – Word2Vec实战 — 潘登同学的NLP学习笔记* 回顾词向量算法* –…

人工智能 2023年5月28日
0068
自动驾驶行业数据防泄漏解决方案分享

行业背景：随着新一代信息通信及人工智能技术的快速发展，汽车作为这些新技术应用的重要载体，正在加速向智能化和网联化转型，以自动驾驶研发为主业的企业也越来越多，如何保障自己研发的算法…

人工智能 2023年6月10日
0055
使用深度学习进行图像分类

使用深度学习进行图像分类解决任何真实问题的重要一步是获取数据。Kaggle提供了大量不同数据科学问题的竞赛。我们将挑选一个2014年提出的问题，然后使用这个问题测试本章的深度学习…

人工智能 2023年7月22日
0049
论文笔记：Universal Adversarial Triggers for Attacking and Analyzing NLP

论文链接：https://arxiv.org/abs/1908.07125 代码开源：https://github.com/Eric-Wallace/universal-trigg…

人工智能 2023年5月31日
0090
YOLOv5改进之十：损失函数改进为SIOU

前言：作为当前先进的深度学习目标检测算法YOLOv5，已经集合了大量的trick，但是还是有提高和改进的空间，针对具体应用场景下的检测难点，可以不同的改进方法。此后的系列文章，…

人工智能 2023年6月16日
0063
JanusGraph安装教程1-基础安装

背景：学习图数据库，单机PC，Windows环境目的： 1 帮助小白（我自己就是），或者看不懂英文官方文档的同学。 2 弥补官方文档的缺失，比如一些首次安装会出现的异常，还有只教…

人工智能 2023年6月1日
0068
【机器学习算法】聚类算法-4 模糊聚类密度聚类，如何判断超参数：数据群数

目录聚类算法模糊聚类法密度聚类法DBSCAN的介绍2个概念密度可达（Density-Reachable）和密度相连（Density-Connected）DBSCAN的优缺点数据群…

人工智能 2023年6月19日
0092
吴恩达DeepLearning第二部分作业week3(1) Tensorflow环境搭建以及基本功能介绍

又麻了，搭建环境花了半天。因为兼容问题Tensorflow版本和其他库版本的要求非常复杂。推荐用anaconda和pycharm。anaconda很容易创建各个版本的python的…

人工智能 2023年7月14日
0062
【Matlab 六自由度机器人】运动学逆解（附MATLAB机器人逆解代码）

【Matlab 六自由度机器人】求运动学逆解往期回顾前言正文 * 一、运动学逆解 – 1. Pieper 法 2. 《机器人学》常规求解二、代码实现 &#821…

人工智能 2023年7月25日
0070
mmclassification训练分类网络

最近因为开发需要测试不同深度学习框架下模型的转换和解析，经常需要使用不同的框架训练模型。然后问题就出现了，当我尝试转换一个caffe模型结果不好这时候是我本身配置不正确导致的还是数…

人工智能 2023年7月3日
0064
八股文随笔3

1.http2多路复用自述：http1版本使用的是单链路，每一个请求都会进行一次TCP链接，当同一域名下进行多次请求时，会同时创建多个链接，浏览器最多处理的并发链路是6-8个。h…

人工智能 2023年6月29日
0060
Improving Few-Shot Part Segmentation using Coarse Supervision学习笔记

摘要鉴于部件分割中训练网络详细标注的开销巨大瓶颈问题，论文提出一个可利用诸如图像背景Mask、关键点位置信息等易获得的粗粒度标签信息的框架，借此优化部件分割模型。框架面临的第一个…

人工智能 2023年7月10日
0054
MMCV学习——基础篇1（配置&注册机制）

博主最近在学习mmcv这个基础库，所以写一个博客记录一下。一来是作为学习笔记，方便日后查阅，二来是和大家分享交流一下我得学习心得。 mmcv是由OpenMMLab开源的一个计算机视…

人工智能 2023年5月26日
0081
论文阅读Knowledge Vault

文章目录题目归属及框架前言概述动机贡献 KV组件 Local closed world assumption(LCWA) 抽取器(Extractors) * 抽取方法 &…

人工智能 2023年6月1日
0086
CMake：编译静态库和动态库

一个程序通常会按照功能需求，进行一定的划分，拆分成不同的子功能，子功能一般会被编译成库，每个库可能包含多个源文件和头文件，并且由不同的人同时进行开发。可以使用add_librar…

人工智能 2023年7月30日
0065

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30