Learning to Ask Neural Question Generation for Reading Comprehension

2023年5月28日上午6:45 • 人工智能 • 阅读 72

1 Abstract

本文提出了一个基于注意力的序列学习模型，研究了对句子级信息和段落信息进行编码的效果。

1 Introduction

问题生成QG的目的是从给定的句子或段落中产生自然的问题。如图1所示：

自然的问题通常压缩其句子，使用段落中术语的同义词(question2的”form”代替原文的”produce”)，或者应用来自前面的句子或从句的实体

2 Model

给定一个输入句子x \mathrm{x}x，目标是生成一个与句子中的信息相关的自然问题y y y，y y y可以是任意长度的序列:[ y 1 , . . . , y ∣ y ∣ ] [y_1,…,y_{|y|}][y 1 ,…,y ∣y ∣]。若输入句子的长度为 M，则x \mathrm{x}x可以表示为tokens的序列x 1 , . . . , x M x_1,…,x_M x 1 ,…,x M 。QG任务被定义为finding y − \overset{-}{y}y −：
y − = a r g m a x y P ( y ∣ x ) (1) \overset{-}{y}=\underset{y}{argmax}P(y|\mathrm{x})\tag{1}y −=y a r g ma x P (y ∣x )(1 )
其中P ( y ∣ x ) P(y|\mathrm{x})P (y ∣x )是给定输入x \mathrm{x}x的预测问题序列y y y的条件对数似然。

为了提出一个问题，人们首先会注意到输入句子的某些部分，以及与段落中的上下文信息相关联，本文的模型就是基于这种方法。首先使用RNN编码器架构对条件概率进行建模，然后采用全局注意力机制使模型在解码过程中生成每个单词时专注于输入的某些元素。

本文对context进行了两种编码：1.只编码句子；2.同时编码句子和段级信息。

将公式1中的条件因式分解为词级预测的乘积：
P ( y ∣ x ) = ∏ t = 1 ∣ y ∣ ( y t ∣ x , y < t ) (2) P(y|\mathrm{x})=\prod_{t=1}^{|y|}(y_t|\mathrm{x},y_{< t})\tag{2}P (y ∣x )=t =1 ∏∣y ∣(y t ∣x ,y <t )(2 )
基于先前生成的所有单词(y

Attention-based sentence encoder
b t → = L S T M 2 → ( x t , b t − 1 → ) b t ← = L S T M 2 ← ( x t , b t + 1 ← ) \overset{\rightarrow}{b_t}=\overset{\rightarrow}{LSTM_2}(x_t,\overset{\rightarrow}{b_{t-1}})\ \overset{\leftarrow}{b_t}=\overset{\leftarrow}{LSTM_2}(x_t,\overset{\leftarrow}{b_{t+1}})b t →=L ST M 2 →(x t ,b t −1 →)b t ←=L ST M 2 ←(x t ,b t +1 ←)

c t = ∑ i = 1 , . . . , ∣ x ∣ a i , t b i c_t=\sum_{i=1,…,|\mathrm{x}|}a_{i,t}b_i\c t =i =1 ,…,∣x ∣∑a i ,t b i

通过双线性评分函数和softmax归一化计算注意力权重：
a i , t = e x p ( h t T W b b i ) ∑ j e x p ( h t T W b b j ) a_{i,t}=\frac{exp(h^T_tW_bb_i)}{\sum_{j}exp(h^T_tW_bb_j)}a i ,t =∑j e x p (h t T W b b j )e x p (h t T W b b i )
Paragraph encoder

给定句子x \mathrm{x}x，对包含x \mathrm{x}x的段落进行编码。对较长的段落进行硬截断，截断后的段落也叫段落，将段落表示为z z z，然后用BiLSTM进行编码:
d t → = L S T M 3 → ( z t , d t − 1 → ) d t ← = L S T M 3 ← ( z t , d t + 1 ← ) \overset{\rightarrow}{d_t}=\overset{\rightarrow}{LSTM_3}(z_t,\overset{\rightarrow}{d_{t-1}})\ \overset{\leftarrow}{d_t}=\overset{\leftarrow}{LSTM_3}(z_t,\overset{\leftarrow}{d_{t+1}})d t →=L ST M 3 →(z t ,d t −1 →)d t ←=L ST M 3 ←(z t ,d t +1 ←)

给出sentence-question对的训练语料库：
S = { ( x ( i ) ) , y ( i ) } i = 1 S S={(x^{(i)}),y^{(i)}}^{S}{i=1}S ={(x (i )),y (i )}i =1 S
对目标函数进行最小化负对数似然：
L = − ∑ i = 1 S l o g P ( y ( i ) ∣ x ( i ) ; θ ) = − ∑ i = 1 S ∑ j = 1 ∣ y ( i ) ∣ l o g P ( y j ( i ) ∣ x ( i ) , y < j ( i ) ; θ ) L=-\sum^{S}{i=1}logP(y^{(i)}|\mathrm{x}^{(i)};\theta)\ =-\sum^{S}{i=1}\sum^{|y^{(i)}|}{j=1}logP(y_j^{(i)}|x^{(i)},y^{(i)}_{
使用波束搜索进行推理。

由于输入句子中可能有许多不在目标端词典中的生词，在解码过程中将输出许多U N K UNK U N K标记。对于在时间步t处解码U N K UNK U N K token，，本文将其替换为具有最高注意力分数的输入句子中的token，其索引为a r g m a x x i a i , t argmax\ \mathrm{x}ia{i,t}a r g m a x x i a i ,t

3 启示

Original: https://blog.csdn.net/Jeaksun/article/details/123445364
Author: 自然语言处理CS
Title: Learning to Ask Neural Question Generation for Reading Comprehension

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/530269/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

用强化学习来玩Atari游戏(基于Tensorflow的深度Q学习模型)

在之前的博客用Tensorflow Agents实现强化学习DQN_gzroy的博客-CSDN博客中，我用TF-Agents实现了一个深度Q学习模型，并且对小车上山这个环境进行了训…

人工智能 2023年5月25日
00101
excel回归分析结果解读

对于简单数据使用excel进行回归分析，操作简单,方法数据-分析工具-点击回归（ps.如果你的excel中没有数据分析这一选项，需要设置一下方法：文件-选项-加载项-勾选数据分…

人工智能 2023年6月23日
0057
selenium打开网页被检测，怎么屏蔽和绕过

Selenium 操作被检测屏蔽 selenium打开浏览器模仿人工操作是诸多爬虫小白最万能的网页数据获取方式，但是在做自动化爬虫时，经常被检测到是selenium驱动。前段时间s…

人工智能 2023年7月30日
0059
【深度学习】Pytorch实现CIFAR10图像分类任务测试集准确率达95%

文章目录 * – 前言 – CIFAR10简介 – Backbone选择 – 训练+测试 – + 训练环境及超参设置 +…

人工智能 2023年6月23日
0071
LabelImg（目标检测标注工具）的安装与使用教程

🔝🔝🔝🔝🔝🔝🔝🔝🔝🔝🔝🔝🥰 博客首页： knighthood2001😗 欢迎点赞👍评论🗨️❤️ 热爱python，期待与大家一同进步成长！！❤️👀给大家推荐一款很火爆的刷题、面试求…

人工智能 2023年6月3日
0095
详解Python正则表达式（含丰富案例）

前言：正则表达式在网络爬虫、数据分析中有着广泛使用，掌握正则表达式能够达到事半功倍的效果。本文详细介绍正则表达式中各种规则及其符号含义，并结合Python中的Re库进行演示，由浅入…

人工智能 2023年7月6日
0053
区域合并方法

区域合并区域合并方法将合并具有相似性的相邻区域。步骤如下：（1）图像初始区域分割：在极端情况下，可以认为每个像素为一个小区域。（2）确定相似性准则：可以基于相邻区域的灰度、颜…

人工智能 2023年6月20日
0097
Spark DataSet 、DataFrame 一些使用示例

以前使用过DS和DF，最近使用Spark ML跑实验，再次用到简单复习一下。 //案例数据 1,2,3 4,5,6 7,8,9 10,11,12 13,14,15 1,2,3 4,…

人工智能 2023年6月2日
00102
Python正则表达式保姆式教学，带你精通大名鼎鼎的正则！

正则作为处理字符串的一个实用工具，在Python中经常会用到，比如爬虫爬取数据时常用正则来检索字符串等等。正则表达式已经内嵌在Python中，通过导入re模块就可以使用，作为刚学P…

人工智能 2023年7月3日
0062
【OpenCV】OpenCV-Python实现相机标定+利用棋盘格相对位姿估计

写在前面：这次要实现的功能：实时检测棋盘格相对于摄像头的距离以及位姿。为此主要步骤可分为以下三个步骤：标定图片的拍摄、相机的标定、以及棋盘格位姿的实时解算。目录 1. 标定图片…

人工智能 2023年7月19日
0044
用huggingface.transformers.AutoModelForSequenceClassification在文本分类任务上微调预训练模型

诸神缄默不语-个人CSDN博文目录本文属于huggingface.transformers全部文档学习笔记博文的一部分。全文链接：huggingface transformers…

人工智能 2023年6月26日
0065
【论文分享】Spatial-Temporal Transformer Networks for Traffic Flow Forecasting

【arXiv:2001.02908v2 [eess.SP] 29 Mar 2021】用于交通流量预测的时空 Transformer 网络作者：Mingxing Xu, Wenr…

人工智能 2023年7月13日
0048
pytorch.tensorboard的零基础使用

1.Tensorboard的介绍： Tensorboard是tensorflow内置的一个可视化工具，它通过将tensorflow程序输出的日志文件的信息可视化使得tensorfl…

人工智能 2023年5月25日
0081
【机器学习】LR回归（逻辑回归）和softmax回归

LR回归（逻辑回归）和softmax回归 1. LR回归 * Logistic回归的函数形式 Logistic回归的损失函数 Logistic回归的梯度下降法 Logistic回归…

人工智能 2023年6月18日
0092
Educoder 机器学习决策树使用之使用决策树预测隐形眼镜类型

任务描述相关知识如何处理隐形眼镜数据集编程要求测试说明任务描述本关任务：编写一个例子讲解决策树如何预测患者需要佩戴的隐形眼镜类型。使用小数据集，我们就可以利用决策树学到…

人工智能 2023年6月16日
0093
python中axis和value_python – Pandas错误“*** ValueError：长度不匹配：预期的轴有0个元素,新值有……”…

我在访问Pandas DataFrame df中的数据时遇到错误： ipdb> df.loc[1988,’ATTEND’] *** ValueErro…

人工智能 2023年7月9日
0066

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Learning to Ask Neural Question Generation for Reading Comprehension

1 Abstract

1 Introduction

2 Model

3 启示

大家都在看