增量学习简介（incremental learning）

2023年7月27日上午10:18 • 人工智能 • 阅读 98

文章目录

前言

个人认为增量学习的定义的边界并不明显，其与其他概念例如：持续学习(Continual Learning)、终身学习(Lifelong Learning)，在线学习（online learning)，迁移学习(transfer learning)都有交集。

所以我个人粗糙的定义就是：模型基于旧数据学好了参数，但是如今新数据产生了，如何更新模型？

最笨，也最无懈可击的办法就是，将旧数据和新数据混在一起，然后对模型进行继续训练。

现在的一个问题是：能不能不使用旧数据或者少使用旧数据呢？这就是增量学习，也因而有了两种增量学习的方法。前者不使用旧数据，后者少使用旧数据（选一部分作为旧数据的代表）。

重点关注以及解决的问题：

学习新知识。
不遗忘旧知识。

基于正则化的增量学习

模型经过新数据后会得到损失，我们希望在损失中再加一些项，希望其可以反应旧数据在当前模型上的表现。毕竟我们不能使用旧数据，所以这些项反应得准不准确谁都说不清，只要有道理即可。

所以其思想就是：不但在学习新的知识，而且一定程度上保护旧知识。

我们以多任务学习中的多类学习为例来介绍这种类型的增量学习，多任务学习比如你可以理解为之前学的都是猫的图片，现在给了狗的图片，也要学。我们的任务就是要学习一个图片分类器。你会纳闷我为什么要举这个例子，因为这是目前的热点，大家做的也是这个。你去一搜会发现，增量学习前面通常都会加一个词”类”，即增量针对的是类增量，也就是之前是狗，现在是猫。

那么这种增量学习我们怎么做到呢？

我们通常会这么做，前面那些几十层是用来提取图片特征的（猫狗都共享），后面那些一两层是任务特定的（猫，狗各自都有自己的层），有点像预训练模型。
这个时候我们有两种选择：

根据新数据微调，那么会改变共享参数，这个时候旧数据的表现可能会变得很差。
特征抽取，保持共享参数不变，根据新数据只训练新任务的那几个特定层。（也不好，因为之前的共享参数未必学得适用于所有任务，所以单靠后面几层难以学习一个很好的分类器）

Learning without Forgetting (ECCV 2016)提出的LwF算法是基于深度学习的增量学习的里程碑之作。这个其实有点像微调，但是思想上比微调更加丰富。

其算法如下：

理解：相当于引入了新数据在旧模型上的结果Y o Y_o Y o 作为旧模型的回忆，希望新数据训练完毕之后，这个Y o Y_o Y o 在新模型上也没有怎么变化，从而希望旧数据输入新模型得到的结果也没有怎么变化。

注意，上面的train下的参数有一个\hat你可以直接理解为在新数据训练后，参数在改变。

; 基于回放的增量学习

这类问题要考虑如下问题：

要保留旧任务的哪部分数据
以及如何利用旧数据与新数据一起训练模型。

iCaRL: Incremental Classifier and Representation Learning (CVPR 2017)是最经典的基于回放的增量学习模型，iCaRL假设越靠近旧数据均值的样本越有代表性。

GAN

大家都知道GAN网络可以用来在旧数据上进行训练，然后生成狗的图片，下次猫的数据来的时候，相当于让GAN生成狗的图片，然后和猫一起训练。

这个方法其实个人觉得也很局限性，因为其变相保存了旧数据，无非原来是狗图片，现在变成了生成狗图片的GAN参数。

但是，话说回来，其确实没有使用旧数据。

参考：https://blog.csdn.net/abcdefg90876/article/details/114109237。这篇更加详细，为其打call。

Original: https://blog.csdn.net/qq_43391414/article/details/121382413
Author: 音程
Title: 增量学习简介（incremental learning）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/718212/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

一道经典的Python数据分析笔试题

最近无意看到一份关于数据分析的Python笔试题，做起来还是很有意思的，特意自己动手做了一下，和大家分享一下，希望大家也可以跟着练习。题目如下：首先，模拟数据： importp…

人工智能 2023年6月11日
0085
1 softmax回归原理

矢量加法可以提升速度，经可能多使用矢量加法而非循环 a = torch.zero(1000) b= torch.zero(1000) start = time() d = a + …

人工智能 2023年6月18日
0089
ROS用python编写订阅者和发布者（使用存放在其他package的自定义msg文件）

本文记录一下用python编写使用自定义消息的ros订阅者和发布者时存在的一些问题。声明一下，本文的代码是从自己项目工程截取的，不适合直接使用，只适合作为参照模板 1、首先是…

人工智能 2023年6月2日
0088
sklearn实现12种回归模型

import numpy as np import pandas as pd data = pd.read_excel(r"data.xlsx") data =…

人工智能 2023年6月16日
0095
目标检测 Object Detection

文章目录 * – 目标检测任务： – 【NMS】 – 【RCNN：Regions with CNN features】 – 【fas…

人工智能 2023年7月10日
0085
Jetson 系列——基于yolov5和deepsort的多目标头部识别，跟踪，使用tensorrt和c++加速

项目简介：代码地址：github地址:https://github.com/RichardoMrMu/yolov5-deepsort-tensorrtgitee地址:https:…

人工智能 2023年7月5日
00100
猿创征文 | 盘点10个冷门Python库，原来Python还能实现这些功能？

目录 👉 1 PrettyErrors 👉 2 Rich 👉 3 Dear PyGui 👉 4 HummingBird 👉 5 HiPlot 👉 6 Norfair 👉 7 Geo…

人工智能 2023年5月30日
00113
手把手搭建经典神经网络系列（1）——AlexNet

一、AlexNet简介 AlexNet是Alex和Hinton参加 2012年imagenet比赛时提出的卷积网络框架，夺得了当年ImageNet LSVRC的冠军，且准确率远超…

人工智能 2023年6月17日
0084
python数据分析 – 卡方检验

卡方检验 1.卡方检验 2.独立性卡方检验与一致性卡方检验 * 2.1 独立性卡方检验 – 2.1.1 python独立性卡方检验 2.2 一致性卡方检验 3.正态分布…

人工智能 2023年7月14日
0096
【opencv x ffmpeg】一、Linux下安装与编译（Ubuntu18.04）

目录一、ffmpeg安装和编译二、opencv安装和编译 1、安装依赖 2、下载源代码 3、编译 4、环境配置 4.1 指定库路径 4.2 获取头文件路径三、配置成果一、f…

人工智能 2023年7月19日
0091
R数据分析：工具变量回归的做法和解释，实例解析

什么是工具变量，以及什么是孟德尔随机化，以及孟德尔随机化怎么实现都给大家写了（大家去翻翻之前的文章呀），因为孟德尔随机化的工具变量是基因变量，所以我们会用专门的R包去做，普通的工具…

人工智能 2023年6月17日
00109
基于macd、kdj、ma技术指标分析股票多空方向——应用开发4 分析技术指标一系列形态结果

接上一节，我们计算获取了技术指标的结果total_df，结果如下图我们需要显示股票最近10天的分析结果，对此我们只需要截取total_df前12天数据就可以了。 #获取前12天的…

人工智能 2023年7月8日
0074
autoware.auto编译与测试(含官方demo问题解决)

安装docker 本文参考菜鸟教程关于docker的安装，详见（https://www.runoob.com/docker/ubuntu-docker-install.html）。…

人工智能 2023年6月2日
0083
AI 一键去背景

本文介绍如何使用 rembg 库去除图片背景，并解决其使用过程中的一些问题。rembg 库：https://pypi.org/project/rembg/ 上一篇文章介绍了如何通过…

人工智能 2023年6月24日
0098
为什么回归直线过平均值点_看图说话之线性回归算法

一.从线性回归的故事说起相信大家都听过著名的博物学家，达尔文的大名，而今天这个故事的主人公就是他的表弟高尔顿。高尔顿是一名生理学家，在1995年的时候，他研究了1078堆父子的…

人工智能 2023年6月18日
00118
实用的GCC Makefile语法及参数详解

二话不说，先上一个Makefile的源码。基于下述的Makefile，可以直接执行命令: 编译： make or make -f Makefile all 清除： make cl…

人工智能 2023年7月19日
0065

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

增量学习简介（incremental learning）

文章目录

前言

基于正则化的增量学习

; 基于回放的增量学习

GAN

大家都在看