迁移学习

2023年7月23日下午7:02 • 技术杂谈 • 阅读 68

古语有言：”它山之石可以攻玉”，迁移学习就是这么一种思想，将在其他训练集上训练好的神经网络迁移到目标任务上。自打迁移学习的思想提出后，在工业实践上，就很少有人会从头开始（随机初始化）训练网络。

相比于从零开始训练模型，迁移学习的优越性主要体现在一下几方面：

加速收敛。由于已经在一些数据集上进行训练，网络已经习得一些模式，再在新数据集上训练时，权重变化较小，经过少数几轮训练即可快速看到效果，甚至不需要训练，直接使用。
降低对数据标注以及数据量的要求。数据标注是一件费时费力的事情，大部分的深度学习任务其实都没有能力去获取足够标注数量的数据集。通过迁移学习，可以在较少量数据集上去的更加显著的效果。
降低对机器性能的要求和损耗。大部分机构都没有足够条件去使用大量GPU机器去训练，但网络上目前已经有许多大公司开源的预训练模型，这些预训练模型已经在一些通用的数据集上进行训练。

我们把提前训练好的模型称为预训练模型，将预训练模型运用到新的任务上，主要有一下几种方案：

将预训练模型当做特征提取器。

以计算机视觉为例，假设先通过ImageNet数据集训练好了一个卷积网络。注意，ImageNet数据集包含1000个分类，也就是说，这个训练好的卷积网络最后的全连接层输出为1000维向量，但是我们目标人为大概率不是一千个分类，所以，在进行迁移时，我们需要删除最后一个全连接层，而保留之前的所有的隐藏层并迁移到新的网络中。在新的网络中，迁移过来的隐藏层并不会进行反向传播训练，只作为特征提取器。在迁移过来的隐藏层后，可以添加新的、符合目标任务需求的全连接层，甚至可以接SVM等等。

微调（fine-tuning）。

微调是说，迁移过来的隐藏层也同样参与反向传播训练，更新权重。这里，我们可以更加个性化地设置对全部隐藏层进行训练，亦或者指定某部分层进行训练。

新数据集很小，与原始数据集类似。

由于数据集很小，进行微调并不是一个好方法，容易过拟合，切由于数据集相似度搞，最好的方案是删除神经网络的最后全连接层，添加一个新的全连接层，与新数据集中的类别数量相匹配，并随机化设置新的全连接层的权重，冻结预先训练过的网络中的所有权重，训练该网络以更新新连接层的权重。

新数据集很大，与原始数据集类似。

由于新的数据集足够大，出现过拟合情况可能性不大，所以删掉最后的全连接层，并替换成与新数据集中的类别数量相匹配的层级，随机地初始化新的完全连接层的权重，使用预先训练过的权重初始化迁移部分网络的权重，重新训练整个神经网络（包括迁移过来部分网络和新的全连接层）。

新数据集很小，但与原始数据集有很大不同。

由于数据集非常不同且数据集规模小，因此最好从网络顶部训练分类器，其中包含更多特定于数据集的特征。将全连接层，以及与全连接层毗邻的部分高层级特征提取网络删除，然后向剩下的预先训练过的层级添加新的全连接层，并与新数据集的类别数量相匹配，随机化设置新的全连接层的权重，冻结预先训练过的网络中的所有权重。

新数据集很大，与原始数据集有很大不同。

由于数据集非常大，重新训练也并无不可。但是，在实践中，使用预训练模型中的权重进行初始化通常仍然是很有帮助的。在这种情况下，我们将有足够的数据和信心来微调整个网络。此时，我们只需要删掉最后的完全连接层，并替换成与新数据集中的类别数量相匹配的层级，并使用随机初始化的权重重新训练网络（全连接部分）。

Original: https://www.cnblogs.com/chenhuabin/p/16589052.html
Author: 奥辰
Title: 迁移学习

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/711151/

转载文章受原作者版权保护。转载请注明原作者出处！

技术杂谈

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

ReactHooks的实现必须依赖Fiber么？

作者：zxg_神说要有光原文链接：https://juejin.cn/post/7087172219226292237 React 的 hooks 是在 fiber 之后出现的特…

技术杂谈 2023年7月24日
0067
云图说丨初识华为云微服务引擎CSE

摘要：微服务引擎（Cloud Service Engine，CSE），是用于微服务应用的云中间件，为用户提供注册发现、服务治理、配置管理等高性能和高韧性的企业级云服务能力本文分享…

技术杂谈 2023年5月31日
00106
cron(CronTrigger)表达式用法

CronTrigger CronTriggers往往比SimpleTrigger更有用，如果您需要基于日历的概念，而非SimpleTrigger完全指定的时间间隔，复发的发射工作的…

技术杂谈 2023年5月30日
0098
老杜带你学Ajax，轻松掌握ajax底层实现原理

课程导读原生的ajax虽然在实际开发中很少编写，但如果想将js高级框架底层学明白，那ajax的原理是必须要求精通的。本套ajax视频对ajax底层实现原理讲解非常透彻，对aja…

技术杂谈 2023年7月25日
0081
write tcp 127.0.0.1:9001->127.0.0.1:52862: write: broken pipe Reproduce the broken pipe error

Handle ‘broken pipe’ error in Go (Golang) https://gosamples.dev/broken-pipe/ T…

技术杂谈 2023年5月31日
0086
异常

spring框架中获取bean时 1.NoUniqueBeanDefinitionException：没有一个唯一的bean被发现异常原因：ioc中有多个类型匹配的bean 2…

技术杂谈 2023年7月11日
0088
华为Ensp拓扑，使用MSTP、OSPF、DHCP、VRRP、链路聚合、CHAP

OSPF+DHCP+VRRP+Eth-trunk+PPP(CHAP)+MSTP 实验目标： LSW1和LSW2核心交换机互为备份，配置链路聚合，设备冗余设计，LSW1和LSW2作为…

技术杂谈 2023年6月21日
0093
markdown常用到的语法

后加文字，几个#代表几级标题，最高为6 ，标准语法一般在#后跟个空格再写文字。三个或者三个以上的 – 或者 * 格式: ![A](B “C”) A:显示在下方的图片内…

技术杂谈 2023年7月11日
0080
tcpip详解-读书笔记

TCP/IP详解卷一第一版读书笔记第一章：应用层关心是应用程序的细节，而不是数据在网络中对的传输活动，下三层对应用程序一无所知，但他们要处理所有的通信细节。七层代理可以根…

技术杂谈 2023年7月11日
00116
三分钟图解事务隔离级别，看一遍就懂

前文说过，”锁” 是数据库系统区别于文件系统的一个关键特性，其对象是事务，用来锁定的是数据库中的对象，如表、页、行等。锁确实提高了并发性，但是却不可避免地…

技术杂谈 2023年7月25日
0077
HTTP中application/x-www-form-urlencoded字符说明

一、概述在学习ajax的时候，如果用post请求，需要设置如下代码。 ajax.setRequestHeader(“content-type”,&#8221…

技术杂谈 2023年5月30日
0088
【转】包含前后端的插件开发指南

原文：https://hackmd.io/@4wfKSSy9QDm32jvj5YsQvA/S1phNDNd5 Original: https://www.cnblogs.com/o…

技术杂谈 2023年5月30日
00107
改Bug的经验

如果修复某个Bug花了很长时间，这时候就要问问自己为什么，怎么做才吸取经验教训，在类似的问题上不再出问题，以及采用的方法，使用的工具是否还有改进的地方；当所有问题都解决之后，一定要…

技术杂谈 2023年7月25日
0082
Spring 源码学习笔记11——Spring事务

Spring事务是基于Spring Aop的&a…

技术杂谈 2023年7月25日
0083
网络安全（一）：信息收集之玩转nmap（理论篇）

更新时间 2022年09月06日16:20:10 完成nmap介绍，目标选择，主机发现部分 2022年10月28日21:19:20 完成最基本的内容，端口扫描，版本和系统探测，安全…

技术杂谈 2023年6月21日
00105
[报错]-NameError: name ‘NAN’ is not defined

部分数据输出为NaN，处理这部分异常数据使用 isnan()函数方法一：使用np.nan import numpy as np if z == np.nan: print(‘er…

技术杂谈 2023年7月10日
0069

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

迁移学习

大家都在看