论文笔记 ACL 2019|Open Domain Event Extraction Using Neural Latent Variable Models

2023年5月31日上午2:38 • 人工智能 • 阅读 74

文章目录

*
– 1 简介
–
+ 1.1 创新
– 2 背景知识
– 3 任务和数据
– 4 方法
–
+ 4.1 模型一
+ 4.2 模型二
+ 4.3 模型三
+ 4.4 推理
– 5 实验

1 简介

论文题目：Open Domain Event Extraction Using Neural Latent Variable Models
论文来源：ACL 2019
论文链接：https://arxiv.org/pdf/1906.06947.pdf
代码链接：https://github.com/lx865712528/ACL2019-ODEE

1.1 创新

提出一个开放域事件提取任务，从新闻集群中提取无约束类型的事件。
提出一个大规模数据集GNBusiness，包含多种事件类型和可解释的事件模式。
提出一个深度隐变量模型，可以从一个新闻集群中抽取多个事件；考虑新闻集群不同报道中的相同实体提及，来提高性能。

2 背景知识

MUC4是一个广泛使用的事件模式规划和事件抽取数据集，定义了4种事件类型(Arson,Attack, Bombing,Kidnapping)和4种slot(Perpetrator,Instrument,Target,Victim)。与本篇论文提出的任务对比如下图：

论文笔记 ACL 2019|Open Domain Event Extraction Using Neural Latent Variable Models

从新闻中抽取事件包含两个子任务：1)schema induction: 提取指定事件类型的论元slot的事件模板。2)event extraction: 从新闻中识别具有已填充slot的事件。
Event Discovery in Tweet Streams任务提取具有新闻价值的词、段落和frame。
First Story Detection任务研究以前未报道的事件的新闻文章。

; 3 任务和数据

在open domain event extraction(ODEE)任务中，输入为一个新闻集群(包含相同事件的报道)，输出为一系列事件，每个事件都包含一个触发词和一个自己模式中的事件论元列表。
从Google Business News爬取数据构造数据集，设计事件模式包括8种可能的slot(Agent,Patient, Time,Place,Aim,Old Value,New Value and Variation)。人工对数据进行标注，数据统计如下图：

4 方法

提出了三个逐渐复杂的深度隐变量模型，如下图：

; 4.1 模型一

给定一个语料库N \mathcal{N}N，对于每个实体e，从均匀分布S种取样一个slot s；从多项式分布中取样一个中心词h；使用ELMo作为上下文编码器，得到连续特征向量f f f(遵循多变量正态分布，其协方差矩阵是对角矩阵)。概率公式和算法流程如下图：

4.2 模型二

模型一忽视了不同的事件可能有不同的slot分布，因此从正态分布中，取样一个潜在事件类型向量t，然后使用t和一个多层感知机编码slot分布，取样slot s。概率公式和算法流程如下图：

; 4.3 模型三

一个共指的实体出现在新闻集群中的频率越高，越有可能是一个重要的slot，冗余的文本信息可以提供复杂的信息。因此额外引入共指的slot的归一化出现频率作为观察到的潜在变量，概率公式和算法流程如下图：

4.4 推理

将离散的潜变量s消去，获得对数似然的证据下界(ELBO)：

其中D K L D_{KL}D K L 为KL散度，计算两个分布的KL散度是困难的和正态分布存在简单有效的重新参数化技巧，因此选择q w ( t ) q_w(t)q w (t )作为由w参数化的正态分布，由神经推理网络学习，如下图。

通过最大化下面的似然公式选择每个实体的slot：

为了得到最终的输出，使用Stanford dependency parser工具的POS-tags和parse trees，抽取每个实体提及中心词的谓词。基于两个规则：1)中心词的governor是VB；2)中心词的governor是NN,属于WordNet中的noun.ACT和noun.EVENT类别。
将相同共指链的实体提及的谓词合并为一个谓词集，对于集合中的每个谓词v，找到其谓词集合包含v的实体，将这些实体视为由v触发的事件的论元。最终，对论元进行排序，得到top-N 开放域事件。

; 5 实验

实验数据集为提出的GNBusiness，Schemas Matching的评价指标为P、R、F1，基于中心词计算，跟随以前的工作，将实体最右边的词或者第一个of、that、which、by以前的最右边词；Slot Coherence的评价指标为normalized pointwise mutual information (NPMI，归一化互信息，常用来表示两个词之间的共现)，公式如下：

schema matching的实验结果如下图：

slot coherence的实验结果如下：

潜事件类型向量的可视化分析如下图，使用T-SNE transformation进行可视化，聚类的数目由Calinski-Harabasz Score选择(当类内之间的协方差越小，类别之间的协方差越大，Calinski-Harabasz分数越高)：

Case study:

Original: https://blog.csdn.net/o11oo11o/article/details/122611460
Author: hlee-top
Title: 论文笔记 ACL 2019|Open Domain Event Extraction Using Neural Latent Variable Models

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/547995/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

目标检测模型——One stage（YOLO v5的模型解析及应用）

简介目标检测分为Two stage和One stage,只使用一个网络同时产生候选区域并预测出物体的类别和位置，所以它们通常被叫做单阶段检测算法（One stage）。本篇文章只…

人工智能 2023年7月9日
0094
LVI-SAM：激光-IMU-相机紧耦合建图

1. 摘要我们提出了一个通过平滑和建图实现激光-视觉-惯性里程计的紧耦合框架LVI-SAM，其实现了高精度和鲁棒性的实时状态估计和地图构建。LVI-SAM采用因子图，由两个子系统…

人工智能 2023年6月2日
0096
利用Python做一个漂亮女生词云跳舞视频

文章目录一、前言二、实现思路 * 1. 下载视频 2. 获取弹幕内容 3. 从视频中提取图片 4. 利用百度AI进行人像分割 5. 小姐姐跳舞词云生成 6. 合成跳舞视频 7….

人工智能 2023年7月20日
0049
BMP图像读取

BMP格式介绍根据百度百科对BMP的定义，我们知道BMP是Bitmap（位图）的简称，是Windows操作系统中的标准图像文件格式。其特点是由于几乎不进行压缩，所以包含的图像信息…

人工智能 2023年6月20日
0075
FPGA实现直方图均衡（一）

直方图均衡的原理笔者就不写了，主要记录如何用verilog写出来。首先需要实现直方图统计，就是统计一幅图中各灰度级的像素数量。那么这里参考《基于FPGA的数字图像处理原理及应用》这…

人工智能 2023年6月22日
0068
kaggle竞赛-树叶图片分类项目

数据集：176种树叶，27152张图片，其中训练集18353张，测试集8799张。准备工作环境：Windows11+Pytorch 1.12.0+Jupyter noteboo…

人工智能 2023年7月1日
0088
1045 Favorite Color Stripe

Eva is trying to make her own color stripe out of a given one. She would like to keep only…

人工智能 2023年6月28日
00159
python 列表间隔取值_在Python中将值列表转换为间隔列表

熊猫解决方案：j = [ {‘flag’: True, ‘value’: 0}, {‘flag’: True…

人工智能 2023年7月7日
0052
「解析」CosineLRScheduler 调度器

在深度学习的训练过程中，需要配置一些超参数，但是在配置的过程中，往往需要根据经验来设置，这对缺乏经验的小白十分不友好，因此就有了动态调整学习率的算法，统称为 LRScheduler…

人工智能 2023年7月22日
00106
数据分析理论

数据分析是指用适当的统计分析方法对收集来的大量原始数据进行分析，为提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。数据分析的目的是提取不易推断的信息并加以分析，一旦理解…

人工智能 2023年7月17日
0046
共享汽车分时租赁T-Box控制设备解决方案随笔

新能源电动汽车&#…

人工智能 2023年6月10日
0057
【图像超分辨（SR）】一文通俗解释blind SR（盲超分）和non-blind SR（非盲超分）的区别

blind和non-blind的区别用一句话来概括就是：是否假设退化核已知并将其作用于图像来做网络训练。 non-blind Super Resolution：这类方法在训练过程…

人工智能 2023年6月24日
0046
SwiftUI———如何使用Core Image官方滤镜（CIFilter）来处理照片

苹果在Core Image API中提供了14个大类、共174个图像处理方式以及一些常见滤镜，其中一些滤镜还能处理视频甚至是实时视频，各个滤镜详情参见：https://develo…

人工智能 2023年6月22日
00102
【CANN训练营】Ascend目标检测与识别-定制自己的AI应用

参考：https://gitee.com/ascend/samples/tree/master/cplusplus/level3_application/1_cv/detect_a…

人工智能 2023年7月9日
0051
C++实例2–职工管理系统

职工管理系统头文件 1.1 workerManager.h 系统类 1.2 worker.h 员工基类（抽象类） 1.3 employee.h 员工类 1.4 manager.h…

人工智能 2023年6月4日
0092
tensorflow-gpu2.X版本安装详解

对应版本官网在安装tensorflow-gpu版本之前，需要安装cuda和cudnn。对应版本可以在官网中寻找，我也把图放在下面了。 ; 2. tensorflow-gpu安装c…

人工智能 2023年5月25日
0090

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30