No Fine-Tuning, Only Prefix-Tuning

2023年5月31日上午2:26 • 人工智能 • 阅读 95

说起fine-tuning，大家再熟悉不过了，NLP和CV领域基本都是各种预训练模型了。

使用预训练模型最重要的一步就是fine-tuning，因为下游任务是多种多样的，所以每种下游任务都要有个副本，并且finetune会改变所有的参数。这篇论文

问题定义

生成式任务就是给个上下文x，然后输出一个序列的tokens.这篇论文就聚焦两个任务，一个是table-to-text，x就是一个表格的数据，y就是文本描述.在总结任务中，x就是一篇文章，y就是一小段总结。

假设我们有自回归模型GPT(transformer的结构，12层)，让z = [x;y]，聚合x和y，Xidx是x的索引，Yidx是y的索引，hi(j)是transformer第j步的输出，hi = [hi(1),…,hi(n)]，生成hi的输入是zi和h

Original: https://blog.csdn.net/m0_52122378/article/details/122340652
Author: 炼丹笔记
Title: No Fine-Tuning, Only Prefix-Tuning

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/547949/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【深度学习】(11) 学习率衰减策略（余弦退火衰减，多项式衰减），附TensorFlow完整代码

大家好，今天和各位分享一下如何使用 TensorFlow构建多项式学习率衰减策略、单周期余弦退火学习率衰减策略、多周期余弦退火学习率衰减策略，并使用Mnist数据集来验证构…

人工智能 2023年7月14日
0092
深度学习和机器学习研究方向与框架介绍

深度学习和机器学习研究方向与框架介绍一、人工智能研究方向 1. 计算机视觉（Computer Vision, CV）——纯粹的深度学习方向的研究计算机视觉，是指计算机从图像中识…

人工智能 2023年6月25日
0083
重学深度学习系列—LeNet5实现手写数字识别(TensorFlow2-mnist数据集)

重学深度学习系列—LeNet5实现手写数字识别(TensorFlow2-mnist数据集) 文章目录重学深度学习系列—LeNet5实现手写数字识别(TensorFlo…

人工智能 2023年7月28日
0086
因子分解机 FM

特征组合/特征交叉为什么要特征交叉？特征交叉的目的是「提升模型的效果」：通过特征交叉，将样本映射至高维空间，从而增加模型的非线性能力，提升模型的预测效果。从辛普森悖论的角度…

人工智能 2023年6月4日
00102
史上最全解决ModuleNotFoundError: No module named ‘cv2‘等错误

解决 ModuleNotFoundError: No module named ‘XXXXX’ 以opencv为例子，别的错误类似解决：在安装opevnc…

人工智能 2023年7月5日
0099
关于安装pytorch的简单步骤及一些问题解决

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。 Original: https://blo…

人工智能 2023年7月27日
0062
python实现梯度下降法

文章目录一、什么是梯度下降法二、如何理解梯度下降法 * – 2.1 概念 2.2 举例说明三、求解梯度下降法四、python编程演算】五、资料引用一、什么是…

人工智能 2023年6月16日
0093
主客观语音质量评估

在语音降噪、盲源分离和语音合成等任务中，我们将使用语音质量评价指标来解释我们的算法的效果。今天，我们将对这些方法进行详细梳理。 [En] In the tasks of speec…

人工智能 2023年5月27日
0097
基础的强化学习(RL)算法及代码详细demo

文章目录 * – + 一、Sarsa (悬崖问题) + * 1.1 CliffWalking-v0环境介绍 * 1.2 Sarsa算法流程 * 1.3 具体代码 * 1…

人工智能 2023年7月4日
0074
数据分析师职业规划——数据分析师的职业焦虑与未来发展

身边的数据分析师经常有一种职业焦虑和怠倦感，尤其是三十岁左右的数据分析师。为什么会有这种感觉呢？怎样才能避免这种职业焦虑？一、数据分析师的打杂困惑数据分析师的职业焦虑和怠倦来…

人工智能 2023年7月16日
0069
毕设：基于yolov5的手势识别与应用-项目概况

科技以造福人类为本，构成我们庞大社会的不只有四肢健全，感知正常的普通百姓，更有许许多多身体条件有缺陷的残疾人，为这类朋友们造福也是科学研发的重中之重。手语是聋哑人士的主要沟通工具，…

人工智能 2023年6月25日
00117
PySpark数据分析

Spark SQL 是 Apache Spark 用于处理结构化数据的模块。第一步：PySpark 应用程序从初始化开始， SparkSession这是 PySpark 的入口点…

人工智能 2023年7月6日
0074
回归方法及代码实现

回归定义 Regression 就是找到一个函数function，通过输入特征 xx，输出一个数值 Scalar。模型步骤 step1：模型假设，选择模型框架（线性模型） ste…

人工智能 2023年6月18日
0073
NCHW与NHWC格式

NCHW与NHWC格式下图很好地描述了各种不同的格式。 [En] The following figure well describes a variety of differen…

人工智能 2023年5月24日
00556
【从零开始学习深度学习】15. Pytorch实战Kaggle比赛：房价预测案例【含数据集与源码】

基于之前学习的内容，让我们动手实战一个Kaggle比赛的：房价预测实战案例。Kaggle是一个著名的供机器学习爱好者交流的平台，该房价预测实战网址：https://www.kagg…

人工智能 2023年7月31日
0062
RANSAC点云多平面拟合分割

回答1： pcl是Point Cloud Library的缩写，是一个功能强大的库，提供了多种处理算法。其中，是pcl中比较基础的一个算法。的目的是根据给定的一组出一个 …

人工智能 2023年6月16日
0086

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

No Fine-Tuning, Only Prefix-Tuning

问题定义

大家都在看