模型微调（fine-tuning）

2023年7月13日下午4:47 • 人工智能 • 阅读 59

微调首先要弄清楚一个概念： 特征提取。
用于图像分类的卷积神经网络包括两部分：一系列的卷积层和池化层（卷积基） + 一个密集连接分类器。对于卷积神经网络而言，特征提取就是取出之前训练好的网络的卷积基，用新数据训练一个新的分类器。那么为什么要重复使用之前的卷积基，而要训练新的分类器呢？这是因为卷积基学到的东西更加通用，而分类器学到的东西则针对于模型训练的输出类别，并且密集连接层舍弃了空间信息。
卷积基的通用性取决于该层在模型中的深度。模型中更靠近输入的层提取的特征更通用，更靠近输出的层提取的特征更抽象。
在特征提取时，应冻结卷积基，不对其进行训练，即训练过程中不改变卷积基的权重，只训练最后的dense层。在keras中，冻结方法为将卷积基每层的trainable属性设为False。

模型微调与特征提取互为补充。对于用于特征提取的冻结的卷积基，微调是指将其靠近输出的几层解冻，并将这几层与分类器联合训练，让模型更加适用于当前要解决的问题。在keras中，解冻即将对应层的trainable属性设为True。

微调，就是基于预训练模型进行微调，比如用大型数据集Imagenet训练好的resnet，再在自己的数据集上训练一部分靠近输出的层，使之更加适用于自己的问题。

需要微调的情况：

是否微调以及微调的方法要根据自己的数据集大小、数据集与预训练模型数据集的相似程度来选择。

不同情况下的微调：

数据量少，相似度高：修改最后几层；
数据量少，相似度低：保留预训练模型的前几层，训练后面的层；
数据量大，相似度高：这是最理想的情况。使用预训练的权重初始化模型，重新训练整个模型；
数据量大，相似度低：直接重新训练整个模型。

Original: https://blog.csdn.net/m0_47702386/article/details/121786549
Author: shimmer_ghq
Title: 模型微调（fine-tuning）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/690228/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

解决 AttributeError: module ‘tensorflow‘ has no attribute ‘contrib‘ 等类似的问题

使用tensorflow2.x版本的时候，使用调用tensorflow1.x函数的代码时，常常会出现module ‘tensorflow’ has no a…

人工智能 2023年7月25日
0049
科比，老大1000天

不知不觉，老大已经走了1000天了，正好这个星期的数据分析的课就是科比投篮可视化，让我一起来分享一下吧。对照列表机翻,仅供参考 action_type 进攻方式（更具体） com…

人工智能 2023年6月26日
0065
神经网络基础之卷积、池化详解

文章目录一、卷积 * 1、计算公式 2、参数详解 3、多图片通道数卷积核运算二、池化 * 1、池化作用 2、池化参数 3、池化分类三、卷积与池化总结一、卷积内容上：卷积核…

人工智能 2023年7月12日
0071
深度学习初学者，如何下载常用公开数据集并使用呢？

深度学习初学者，如何下载常用公开数据集并使用呢？ 1.前言 2.官方文档怎样看 3.动手写代码 4.如何可视化遇到问题：ssl.SSLCertVerificationError:…

人工智能 2023年7月23日
0075
【机器学习算法】神经网络与深度学习-3 BP神经网络

目录 BP神经网络（Back propagation）反向传播神经网络，也被叫做多层感知机。输入字段节点个数如何确定BP神经网络的特点：隐藏层个数如何确定BP神经网络如何传递信息B…

人工智能 2023年6月23日
0058
数学建模（四）：分类

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月19日
0078
【python】18行代码带你采集国外网小姐姐绝美图片

前言嗨喽~大家好呀，这里是魔王呐 ! 我又来更新小姐姐网站，批量采集得办法拉~ 让我们一起来学习吧~ ; 开发环境: Python 3.8 Pycharm 模块使用: 第三方模块…

人工智能 2023年7月3日
0076
PyTorch提供了哪些常见的优化器和损失函数

问题背景 PyTorch是一个基于Python的科学计算包，主要用于深度学习任务。在深度学习中，优化器和损失函数是非常重要的组成部分。优化器用于更新模型的参数，使其能够更好地拟合训…

人工智能 2024年1月4日
0046
【opencv图像处理】–4. 低、高通滤波，卷积和各种算子

系列所有代码，复制粘贴即可运行。希望有能力的朋友还是拿C++运行一下。本节讨论图像的低通滤波（卷积，方盒，中值双边，高斯），高通滤波（Sobel,Scharr,Laplace,c…

人工智能 2023年6月19日
0096
Pytorch分类模型转onnx以及onnx模型推理

Pytorch分类模型转onnx以及onnx模型推理将MobileNetV2的pytorch模型转换为ONNX模型,并用onnxruntime进行测试_cumtchw-程序员秘密O…

人工智能 2023年7月22日
0060
经典分类算法——SVM算法

文章目录经典分类算法——SVM算法 * 1 SVM算法：背景 2 SVM算法思想 3. Hard-SVM算法 4. Soft-Margin SVM算法 5. Kernel SVM…

人工智能 2023年6月30日
0056
#Paper Reading#Contrastive Learning for Representation Degeneration Problem in Sequential Recommenda

论文题目：Contrastive Learning for Representation Degeneration Problem in Sequential Recommenda…

人工智能 2023年7月17日
0049
训练集、验证集、测试集的作用和区别

一、概述简单说，训练集就是用来训练模型用的，验证集为了验证模型的效果，测试集用来最终评测。所以基于这个，那训练数据的时候，就不要使用验证集和测试集的相关信息，包括统计均值方差特…

人工智能 2023年5月31日
0067
MXNet是否支持自动学习超参数调优（AutoML）

问题介绍本文将详细介绍MXNet是否支持自动学习超参数调优（AutoML）的功能。我们将讨论算法原理、公式推导、计算步骤、复杂Python代码示例以及代码细节解释等方面。算法原…

人工智能 2024年1月1日
0047
【域名检测】使用CNN实现DGA恶意域名检测（TensorFlow）【代码】

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月24日
0083
PyQt5(一) PyQt5安装及配置，从文件夹读取图片并显示，模拟生成素描图像

目录一、环境配置 1.1 安装PyQt5 1.2 安装Qt工具包 1.3 配置环境变量 1.4 测试PyQt5 1.5 配置PyCharm 二、QtDesigner 窗口简单介绍…

人工智能 2023年6月17日
0090

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

模型微调（fine-tuning）

大家都在看