论文笔记 EMNLP 2021|Modeling Document-Level Context for Event Detection via Important Context Selection

2023年5月27日下午10:45 • 人工智能 • 阅读 77

文章目录

*
– 1 简介
–
+ 1.1 创新
– 2 方法
–
+ 2.1 预测模型
+ 2.2 上下文选择
+ 2.3 训练
– 3 实验

1 简介

论文题目：Modeling Document-Level Context for Event Detection via Important Context Selection
论文来源：EMNLP 2021
组织机构：俄勒冈大学
论文链接：https://aclanthology.org/2021.emnlp-main.439.pdf
代码链接：

1.1 创新

提出一个模型，通过选择句子的重要上下文(不需要对长句子进行截断)，使用BERT进行事件检测(序列标注和词分类)，性能得到SOTA。

2 方法

模型主要包括两个部分：事件检测预测模型和上下文选择。

2.1 预测模型

将上下文选择模型选择的句子标记为C，按照在文档的位置分为两个子集LC和RC。然后选择的上下文和当前句子表示为文档D ′ D’D ′:
D ′ = [ [ C L S ] , w 1 L C , w 2 L C , . . . , w n L C L C , [ S E P ] , w 1 , w 2 , . . . , w n [ S E P ] , w 1 R C , w 2 R C , . . . , w n R C R C ] D’=[[CLS],w_1^{LC},w_2^{LC},…,w_{nLC}^{LC},[SEP],w_1,w_2,…,w_n[SEP],w_1^{RC},w_2^{RC},…,w_{nRC}^{RC}]D ′=[[C L S ],w 1 L C ,w 2 L C ,…,w n L C L C ,[S E P ],w 1 ,w 2 ,…,w n [S E P ],w 1 R C ,w 2 R C ,…,w n R C R C ]
然后通过BERT进行编码，最后进行分类，序列标注和词分类的Loss如下：

论文笔记 EMNLP 2021|Modeling Document-Level Context for Event Detection via Important Context Selection

; 2.2 上下文选择

该部分对上下文进行选择，首先使用BERT得到句子S j S_j S j 相对于当前句S i S_i S i 的编码(拼接起来，使用CLS表示)，然后使用LSTM对以前选择的句子进行编码，每个time step输出一个最大概率句子为当前选择的句子(以前未被选择过的句子)，直到超过BERT的输出长度(512)结束，公式如下：

2.3 训练

使用REINFORCE algorithm对上下文选择进行训练，其中 Reward包括下面三个部分：

Task-level Reward R i t a s k R_i^{task}R i t a s k : 使用事件检测的指标(F1值、准确率)作为Reward。
emantics-level Reward R i s i m R_i^{sim}R i s i m : 使用当前句子与选择句子的相似性作为Reward，公式如下：

Discourse-level Reward R i d i s c R_i^{disc}R i d i s c : 使用当前句子与选择句子共有的实体作为Reward，使用Stanford CoreNLP获得实体提及和共指簇，公式如下：

总的Reward为上述三个Reward的和，通过REINFORCE最小化负期望Reward，具体公式如下(B为batch size)：

; 3 实验

实验数据集为ACE 2005和CySecED(300篇文章(30个空间安全类型))，实验结果如下：

消融实验：

提出的上下文选择方法与启发式的选择方法对比：

Case Study:

Original: https://blog.csdn.net/o11oo11o/article/details/124135795
Author: hlee-top
Title: 论文笔记 EMNLP 2021|Modeling Document-Level Context for Event Detection via Important Context Selection

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/527953/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

python实现KNN模型分类预测并验证评估（附代码）

实现功能： python实现KNN建模，选择最佳K值，对数据样本进行分类预测，并验证评估。实现代码： # 导入需要&#x7…

人工智能 2023年7月17日
0080
ROS 机器人操作系统：概述

ROS 是 Robot Operating System 的缩写，通常称为”机器人操作系统”。但它并不是一个真正的操作系统，而是一个面向机器人的开源的元操作…

人工智能 2023年7月27日
0079
【Linux】自动化构建工具-make/Makefile&&第一个小程序

大家好我是沐曦希💕 文章目录一.项目自动化构建工具-make/Makefile * 1.背景 2. 举例 3. 原理 4. 总结 5. 项目清理 6. 习题 – 习题…

人工智能 2023年7月30日
0057
OpenCV-Python小应用（一）：人脸识别

OpenCV-Python小应用（一）：人脸识别 * – 前言 – 前提条件 – 实验环境 – 人脸识别 – + Haa…

人工智能 2023年5月28日
0096
【复习笔记】线性代数——向量及向量组的线性相关性

目录一、向量的概念和运算二、向量组的表出与线性相关的概念三、判别线性相关性的七大定理一、向量的概念和运算 1、n维向量：n个数构成的一个有序数组称为一个n维向量，记成 2、…

人工智能 2023年6月16日
0096
TensorboardX和Tensorboard的介绍及使用

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录一、Tensorboard是什么？ * conda环境安装二、Tensorboard可供显示的内容三…

人工智能 2023年7月22日
00112
stata怎么画分类图_Stata怎么画直方图或折线图-Stata教程

软件功能：Stata官方版是一款相当优秀的实用型理科统计软件，Stata官方版功能强悍，高效专业，提供了数据分析、数据管理和绘制专业图表等功能，Stata支持线性混合模型、均衡重复…

人工智能 2023年6月18日
00154
大数据的薪资怎么样？想学大数据了？

猎聘大数据研究院发布了《2022未来人才就业趋势报告》从排名来看，2022年1-4月各行业中高端人才平均年薪来看，人工智能行业中高端人才平均年薪最高，为31.04万元；金融行业中…

人工智能 2023年6月19日
0090
HRNet训练自己的分类数据

### 回答1： hrnet__w18.nb是一种深度学习模型，也称为High-Resolution Network。它被广泛用于图像 _分类、物体检测和语义分割等计算机视觉任务中…

人工智能 2023年7月2日
0075
R 多元相关与回归分析

多元相关与回归分析 1.数据描述 2.调入数据 3.多元相关分析 * 3.1 多元数据散点图 3.2 多元数据相关系数矩阵 3.3 多元数据相关系数检验 4.多元回归分析 * 4….

人工智能 2023年6月17日
0074
Pandas模块（学习笔记）

Pyrhon数据分析基础：Pandas模块安装在命令提示符中，选择以管理员身份运行使用 pip install pandas 再使用 pip list 查看有没有此软件包信息…

人工智能 2023年7月18日
0062
RK3588移植 opencv交叉编译

参考资料：工程参考在RK3588 c++的开发中用到了opencv库，但是官方的SDK例程中的opencv库不完整，如没有读视频的cv::VideoCapture函数，所以重新编…

人工智能 2023年7月28日
0056
逻辑回归算法实战之信用卡欺诈检测

信用卡欺诈检测 1. 数据分析与预处理 * 1.1 数据的读取与分析 1.2 解决样本不均衡 1.3 特征标准化 2. 下采样方案 * 2.1 交叉验证 2.2 模型评估方法 2….

人工智能 2023年6月16日
0095
数据挖掘——第三章：数据预处理

文章目录 1. 数据存在的问题 * 1.1 原始数据存在的问题 1.2 数据质量要求 1.3 预处理主要任务 2. 数据清洗 * 2.1 空缺值处理 2.2 噪声处理 3. 数据集…

人工智能 2023年7月16日
00177
一元一次线性回归详解

一元一次线性回归作为机器学习的入门课程，线性回归是我们必须要学习的第一个算法。今天我们就来详细的讲解一下线性回归。在讲解之前，我们先来解释以下几个问题。可为线性？线性是指自变…

人工智能 2023年6月17日
0092
基于微信小程序的垃圾分类系统的设计与实现

当前的社会科技已经取得了极大的发展和极高的成就，但随之而来逐渐造成了垃圾产出过多的问题。久而久之，这一问题便不断恶化，滋生了一系列新的问题。如垃圾处理问题越来越严峻。伴随着垃圾种类…

人工智能 2023年6月30日
0086

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31