论文解读：Generated Knowledge Prompting for Commonsense Reasoning

2023年5月28日上午8:09 • 人工智能 • 阅读 116

论文解读：Generated Knowledge Prompting for Commonsense Reasoning

地址：https://arxiv.org/abs/2110.08387

尽管大型语言模型能够在预训练期间捕获大量知识，但它们通常受益于整合外部知识库，尤其是在常识推理任务上。

这促使我们探索如何更好地利用从语言模型中获得的知识。作者建议使用通用提示格式直接从语言模型生成知识语句，然后选择使得预测概率最大的知识。

尽管它很简单，但这种方法提高了预训练模型在数字常识、通用常识和科学常识上的性能。值得注意的是，使用模型自己生成的知识，它的预测可以提高，这表明了符号知识表示在神经推理过程中的重要性。

Introduction

进行常识推理需要常识知识，而预训练语言模型隐含了大量的知识，可以直接作为常识推理的推理模型，一方面，整合外部知识库可以提高其中一些任务的性能。

另一方面，语言模型本身可以充当知识库的角色，因为它们允许查询符号知识。为了利用语言模型中包含的知识来回答常识问题，最近的一些工作通过设计cloze-style模板来生成某种类型的知识陈述，例如阐明、对比说明等。

然而，任务通常需要不同类型的知识，这超出了预定义模板的范围(表1)。如何从语言模型中灵活地引出一般类型的有用知识，并将这些知识整合到预测中?

表1：生成知识提示修正预测的例子

每部分绿色表示正确的回答

红色表示错误的回答

每一行的第一句表示问题

第二句表示知识生成模型生成的知识语句

作者开发了一个简单而有效的方法来生成知识并使用它来提高预测性能。作者提出的方法使用两种语言模型:一种是知识模型，它使用带有通用提示符的演示生成与问题相关的知识陈述；

一个推理模型，它接收每个知识陈述所增加的问题，然后使用这些知识，从而使其预测的概率最高(图1)。生成性知识提示(generated knowledge prompting )在数值常识、一般常识以及科学常识可以提高现成模型和经过微调的模型的推理性能。

值得注意的是，当使用相同的语言模型进行知识生成和推理时，该方法是有效的。

图1：上面：没有符号知识的推理预测模型

下面：生成知识的提示：

1、生成问题相关的符号知识

2、在推理模型中使用知识陈述

作者发现有三个因素对基于生成性知识提示的推理任务有帮助：1、知识质量，2、知识数量，3、整合知识的推理策略。通过定性分析，生成的知识可以将常识性问题简化为明确的推理流程。

Method

作者聚焦在多项选择任务上，即给定一个问题，预测一个答案，答案是有限的可以根据问题而变化，问题和答案都是可变长度的文本序列。

本文将分两步来介绍生成性知识提示。第一步使用知识模型根据问题生成知识陈述:

其中每个知识陈述是一个变长文本序列，每个陈述都包含了与问题相关的信息。第二步根据问题和知识陈述，使用推理模型来预测答案:

这是对不需要知识的推理模型的自然扩展

2.1知识生成

利用问题相关的知识示例，通过提示语言模型生成知识陈述。在所有任务中使用同样的提示形式：由一个命令句子，一些问题-知识对示例，然后以问题占位符结束，如表2所示。

表2：NumerSense和QASC知识生成提示的例子

提示由一个指令句子、五个问题-知识对示例和问题占位组成

对于一个给定的问答任务，给出同问题类似的五个问题，然后为每个问题写一个相应的知识陈述。理想情况下，提供的知识陈述应该把常识问题变成明确的推理过程。

当然，不应该简单地将答案插入到问题后面，而是鼓励多样的知识生成。比如对于问题Penguins havewings, 可以将知识陈述写成Birds have two wings. Penguin is a kind of bird。

知识陈述中的两句话可以看作是演绎推理的完备集。而Penguins have two wings是一个不好的知识陈述示例，因为直接将问题和答案显示出来了。

2.2通过提示进行知识整合

假设我们为每个问题q生成M个知识陈述:。通过知识来提示推理模型。首先将知识陈述分别后置到问题中，形成M个知识扩充问题:

实验

本文在四个常识推理数据集上评估生成性知识提示：NumerSense (NS), CommonsenseQA (CSQA), CommonsenseQA 2.0 (CSQA2), and QASC。这些数据集包含了推理和问题多样性。

使用GPT-3进行知识生成，一般对每个问题生成20个知识陈述，将重复的和空字符串丢弃。当超过64个token或者遇到’\n’时，生成终止。

NumerSense由多个关于常见的物体和概念的陈述组成的，对于每个句子需要恢复一个被掩盖的数字。选项是从0到10的整数，加上单词no，所以这个任务可以被定为一个多项选择题。

在推理阶段使用T5进行推断，同时使用零样本的GPT-3进行推断，将每个选项插入到句子中，并将答案的概率作为整个句子的生成概率:

CSQA 是一个关于现实世界的多个选项的问答数据集。通过T5进行推断，将问题形式化为文本填充，并以最高的序列到序列语言建模概率预测选择。

CSQA2 是一个二元分类数据集，需要判断常识性陈述是对还是错。

QASC 是一个关于小学科学的多项选择的数据集。这个数据集还包括每个问题的两个背景知识，背景知识完全回答了问题。

表3：不同先进方法的比较

将本文提出的方法与之前的最好的方法进行比较，如表3所示。在每种情况下，在之前SOTA中使用的相同推理模型上应用本文提出的方法，可以看出NumerSense实现了6%的提升，CSQA2实现了2%的提升，QASC实现了3%的提升。

表4：在零样本模型上的提升

表4显示了在零样本推理模型中，应用本文提到的方法，在NumerSense, CSQA和QASC上提高7%到10%不等，在CSQA2上表现不好，作者也没分析原因。

表5表明，本文方法在微调推理模型上也能给模型的性能带来提升。

表5：在微调模型上的提升

通过定量分析，作者发现本文提到的方法要优于基于检索的知识提示方法，以及优于基于模板的知识生成方法，同时推理阶段利用的知识越好，对性能提升也越好。生成的知识越多，对推理越有帮助，如表8所示。

表7：每个问题生成不同数量的知识陈述的性能

表9显示了在不同大小的推理模型下NumerSense的性能增益。

第三行显示，gpt-3既是知识生成模型，也是推理模型，模型越小，提升越大，但个人觉得第三行要有意义些，因为其他模型太小了，可能gpt-3直接把答案告诉推理模型了，可以再做两个推理模型比gpt-3强的实验。

表9：不同知识集成算法的性能

本文提出生成性知识提示模型，从预训练语言模型中抽取知识，然后整合知识提升常识推理任务的性能。这种方法在多个推理数据集上被证明是有效的。

Original: https://blog.csdn.net/NLPlunwenjiedu/article/details/122436851
Author: NLP论文解读
Title: 论文解读：Generated Knowledge Prompting for Commonsense Reasoning

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/530504/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

ffmpeg api实现aac语音文件转pcm

人工智能 2023年5月23日
0078
豆瓣评分预测（如何用自己的数据集进行文本分类）——基于pytorch的 BERT中文文本分类，超详细教程必会！！！

前言相信大多数人在看完一部电影或电视剧后，难免会去豆瓣刷别人的评论和评分，看看这部电影或电视剧是什么样的，或者是谁分享了自己的好恶。 [En] I believe that af…

人工智能 2023年5月27日
00106
PyTorch实现MNIST数据集手写数字识别

本篇文章基于卷积神经网络CNN，使用PyTorch实现MNIST数据集手写数字识别。 PyTorch 是一个 Torch7 团队开源的 Python 优先的深度学习框架，提供两个高…

人工智能 2023年7月12日
0092
电气领域相关数据集（目标检测，分类图像数据及负荷预测），输电线路图像数据

电气相关图像数据集集及负荷数据集如下（包含缺陷检测与分类）： 1.输电线路巡检鸟巢检测图像数据集（含标签）下载地址：输电线路鸟巢图像数据集（200张图像 VOC标签） 2.输电线…

人工智能 2023年7月3日
00102
ChatGPT 大智近妖，从宇宙人生到手搓光刻机，从哄女友到写年终总结我们聊得非常开心，反而让人越来越忧心

文章目录宇宙人生 * – 问：你觉得人生的意义是什么？问：你觉得思维意识到底是什么问：我之前的两个问题大概有多少人问过你？问：宇宙的边界在哪里？手搓狠活 * …

人工智能 2023年7月31日
0079
站在巨人的肩膀上，用Node+ChatGPT模块实现一个接口

目录前言准备工作功能实现写在最后前言蹭一下最近比较火的人工智能ChatGPT的热度，最近看到许多小伙伴都在调戏ChatGPT，看到这我就坐不住了，这种事怎么能少了我，于…

人工智能 2023年7月31日
0082
成功安装了TensorFlow

今天安装tensorflow，安装了大概一天的时间，一直出错，最后终于安装成功。记录一下安装的步骤。 1.打开Anaconda Prompt 2.创建一个虚拟环境 conda cr…

人工智能 2023年5月24日
00104
从零开始数据分析Kaggle项目—泰坦尼克号（二）

从零开始数据分析Kaggle项目—泰坦尼克号1—1.2 import pandas as pd import numpy as np import os df = pd.read_…

人工智能 2023年7月6日
00101
Neo4j Cypher 查询语法

Created: Oct 13, 2020 9:22 PMTags: Cypher, DB, Neo4j 节点通常会表示为一实体节点可以包含属性关系是连接实体的边，通过关系看可…

人工智能 2023年6月10日
0093
5 线性回归

from sklearn.datasets import load_boston from sklearn.model_selection import train_test_sp…

人工智能 2023年7月17日
0069
【OpenCV 例程300篇】09. 图像的裁剪（cv2.selectROI）

专栏地址：『youcans 的 OpenCV 例程 300 篇』【OpenCV 例程300篇】09. 图像的裁剪（cv2.selectROI）用 Numpy 的切片方法可以进行…

人工智能 2023年5月26日
0089
什么是路由守卫？

第一次认识路由守卫：之前我做过的小项目里面，我们直接在浏览器网址的地方进行修改就能跳转页面，这是不安全的，因此就需要路由守卫，实现通过路由拦截，来判断用户是否登录，该页面用户是否有…

人工智能 2023年7月23日
0078
【Numpy总结】第七节：Numpy常用的函数（汇总所有函数，收藏这一篇就OK啦~）

一、Numpy 的加减乘除 numpy 进行加减乘除时，可以使用运算符号，即： +，-，*，/ ，也可以使用对应的…

人工智能 2023年7月5日
0054
WinHex(二)

目录 1.我们打开WinHex，点击打开磁盘按钮 2.不同的文件在WinHex中有不同的文件显示 3.WinHex简单使用 4.删除之前所创建的虚拟磁盘 1.我们打开WinHex，…

人工智能 2023年6月29日
0074
机器学习-学习笔记(二) –> 模型评估与选择

二、评估方法模型评估方法 1. 留出法（hold-out） 2. 交叉验证法（cross validation） 3. 自助法（bootstrapping）调参（paramet…

人工智能 2023年6月4日
00106
每日论文阅读 2022-11-11

VL-BERT: P RE -TRAINING OF G ENERIC V ISUAL LINGUISTIC R EPRESENTATIONS pre-training fine-…

人工智能 2023年6月28日
0081

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

论文解读：Generated Knowledge Prompting for Commonsense Reasoning

大家都在看