《How to Fine-Tune BERT for Text Classification》论文笔记

2023年5月30日下午5:54 • 人工智能 • 阅读 57

方法论

作者提出三种FineTune Bert的方法：1）直接使用下游目标数据集进行FineTune；2）先在目标领域上进一步Pretraining Bert，再利用目标数据集FineTune； 3）与方法2类似，但加入了Multi-Task FineTune。

《How to Fine-Tune BERT for Text Classification》论文笔记

; 进一步预训练

已有很多研究表明，在目标领域进一步预训练预训练模型，能提升预训练模型在下游任务的表现，依据进一步预训练的数据集，可分为三类：1）预训练时，仅能使用下游目标标注数据集；2）预训练时，可以使用目标任务所在领域的大量数据，比如信用分类时，可以使用大量的金融新闻报道；3）通用语料。论文后续实验证明， 进一步的领域预训练是最佳的。

Multi-Task FineTune

MT_DNN已证明 MTL 与 pretraining 技术具有互补性，因此，如果有相关数据集的条件，尽可能进行MT FineTune。

实验结果

长文本分类的处理，取”头+尾”的策略最佳。

取最后一层的输出特征，效果最佳。

遗忘预训练过程学习到的知识，是迁移学习面临的重要问题。通过优化的学习率策略，可以减低该问题的负面效果。实验结果表面，使用 较低的学习率2e-5，比4e-4更好，注意论文使用了ULMFiT中的 “斜三角学习率” 与 ” 为不同层设置不同学习率“的策略， 层学习率的衰减为0.95。

在目标任务的训练集上进一步Pretrain，经过 100K 步之后，效果最优。

进一步的领域预训练有助于提升效果。

下游任务有 100标注数据表现已较优。

Bert_Large 能进一步提升效果。

Original: https://blog.csdn.net/weixin_44815943/article/details/123897952
Author: 凯子要面包
Title: 《How to Fine-Tune BERT for Text Classification》论文笔记

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/544409/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

问题解决之 TypeError: can‘t convert CUDA tensor to numpy. Use Tensor.cpu() to copy the tensor to

运行程序，出现报错信息 TypeError: can’t convert CUDA tensor to numpy. Use Tensor.cpu() to copy the te…

人工智能 2023年7月21日
0032
Apollo学习001: 安装Apollo

本文旨在详细记录 Apollo在个人电脑的 Ubuntu 18.04 系统中的完整安装及运行过程。百度Apollo系统正常需要安装在工业计算机IPC中，在个人电脑上也可以安装。由…

人工智能 2023年6月10日
0053
Kaggle Courses-数据可视化学习

今天是学习的新一天，简单学习完成了Kaggle上的Data Visualization入门课程，简要写一点，方便后续复习。（毕竟要是忘了，也好捡回来）这里主要利用的是 Pytho…

人工智能 2023年7月17日
0032
机器学习（八）聚类

聚类Clustering 机器学习聚类Clustering * K-Means K均值分类 – K-Means 算法 K-Means 的loss function K…

人工智能 2023年5月31日
0065
EXCEL与PYTHON系列第一篇—Pandas(2)to_excel详解-xlsxwriter及openpylx

引言这是excel+python-pandas章的第二篇文章；上一篇我们讲了read_excel，这一篇我们就来讲to_excel pandas和excel其实基本上是独立的，甚…

人工智能 2023年7月8日
0087
OpenCV、EmguCV和OpenCvSharp指针访问图像像素值耗时测评(附源码)

背景介绍 EmguCV和OpenCvSharp都是OpenCV在.Net下的封装，常常会听到有人说EmguCV或OpenCvSharp同样的函数比OpenCV函数运行速度慢，到底是…

人工智能 2023年7月19日
0066
Framework是否提供了跨平台和跨框架的模型转换工具

问题介绍在开发软件应用程序时，经常会遇到需要在不同平台和不同框架之间进行模型转换的问题。模型转换是将一个机器学习模型从一个框架或平台转移到另一个框架或平台的过程，以便在目标平台上…

人工智能 2024年1月1日
0034
RLS递归最小二乘法(Recursive Least Squares)

感谢B站Up 凩子白的讲解视频, 大多数的RLS算法介绍都是从各种专业领域角度讲解的(比如滤波器等角度), 对于缺…

人工智能 2023年6月15日
0074
yolov5超级详细教程（包含win10的错误解决方案）

一、下载yolov5 https://github.com/ultralytics/yolov5 git clone也可以，下载压缩包解压缩也可以得到我们的yolov5文件夹二、…

人工智能 2023年7月12日
0053
【emd分解】图像二维经验模式分解的matlab仿真

1.软件版本 MATLAB2013b 2.本算法理论知识（1）对原始图像进行延拓，然后对进行极值点提取，也就是局部极值点的选取，包括极大值点和极小值点，要求采用领域点比较法，显示…

人工智能 2023年6月20日
0072
成功解决TypeError: only size-1 arrays can be converted to Python scalars

成功解决TypeError: only size-1 arrays can be converted to Python scalars 目录解决问题解决思路解决方法 1、分…

人工智能 2023年7月4日
0082
数据挖掘05-偏相关分析【原理、案例、python实现】

数据挖掘05-偏相关分析【原理、案例、python实现】 * – 一、需求场景 – 二、偏相关分析简介 – + 2.1 引入偏相关分析的原因 +…

人工智能 2023年6月11日
00146
度秘语音引擎app_「资源」9个（实时）语音转文字APP分享（推荐收藏）

” 做会议记录、看无字幕网课再也不用担心，解放双手，提高效率。” 随着语音转文字技术的发展，我们有了更好的方式来记录会议、课堂等。 [En] With th…

人工智能 2023年5月27日
0085
FigDraw 7. SCI 文章绘图之折线图 (Lineplot)

点击关注，桓峰基因桓峰基因生物信息分析，SCI文章撰写及生物信息基础知识学习：R语言学习，perl基础编程，linux系统命令，Python遇见更好的你 110篇原创内容公众…

人工智能 2023年6月17日
0059
深度学习入门-权重初始值(Xavier,He初始值，隐藏层激活函数值的分布)

目录 * – + * – 权重的初始值 – + 2.1非对称结构 + 2.2 隐藏层的激活值的分布权重的初始值（有关此处的坑太深，本文只是深…

人工智能 2023年7月14日
00119
【BOOST C++ 11 时钟数据】（1）计时码表（11-13）

库 Boost.Chrono 提供了多种时钟。例如，您可以获取当前时间，也可以测量流程中经过的时间。 Boost.Chrono 的部分内容已添加到 C++11。如果您的开发环境支持…

人工智能 2023年6月27日
0048

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

《How to Fine-Tune BERT for Text Classification》论文笔记

; 进一步预训练

Multi-Task FineTune

大家都在看