prompt综述论文阅读:Pre-train, Prompt, and Predict: A Systematic Survey of Prompting Methods in Natural La

  • Exploiting cloze questions for few shot text classification and
    natural language inference. github 该论文提出了PET的概念,提供了一种半监督学习方式,在低资源场景下成功超过了监督学习模型的结果;该论文的主要贡献是:基于 手动设计的离散的prompt,针对半监督任务,提出了一种交替训练+蒸馏学习的方法;
  • Multimodal Few-Shot Learning with Frozen Language Models
    该论文对多模态prompt模型进行了研究。该论文采用 连续prompt的思路,通过一个图像编码器将图像转换为连续的嵌入序列,作为一种prompt,与文本信息一起送入语言模型中,训练图像文本生成任务。为了将LM中的知识迁移到多模态领域,在训练时选择冻结LM的参数,仅优化图像编码器有关参数。视觉前缀的构造方式:将视觉编码器的输出映射为D*n的矩阵,D为嵌入维度,n可以看作token的个数。训练时的输入是形如(image, text)的一堆pair,训练时统一使用Conceptual Captions作为训练集。
  • Making Pre-trained Language Models Better Few-shot Learners
    一种基于语言模型的小样本微调方法(LM-BFF);主要分为两个部分(1)自动化生成prompt和answer(2)将样本示例以上下文的形式添加到每个输入中;
    1、自动化选择answer
    自动化构建answer,即固定模板、选择最佳的answer映射关系M,使得在验证集的分类准确率最高。
    2、自动化选择prompt
    自动化构建prompt,即固定answer构建prompt。LM-BFF 使用T5模型生成prompt

Original: https://blog.csdn.net/weixin_40683960/article/details/122928905
Author: 开心的火龙果
Title: prompt综述论文阅读:Pre-train, Prompt, and Predict: A Systematic Survey of Prompting Methods in Natural La

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/547969/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球