小样本目标检测综述 –刘浩宇，王向军 –阅读笔记

2023年6月17日上午8:15 • 人工智能 • 阅读 88

文章目录

*
– 1 基本背景
– 2 大样本与小样本的对比
– 3 在没有大量数据支持的情况下，小样本检测保证检测效果，有哪些解决方法？
–
+ 3.1 数据域：
+
* 3.1.1 转化原有数据集D t D_t D t r _r r a _a a i _i i n _n n
* 3.1.2 迁移其他数据集
+ 3.2 模型域
+
* 3.2.1 多任务训练网路
* 3.2.2 增量学习网络
* 3.2.3 迁移学习网络
+ 3.3 算法域

1 基本背景

首先什么是小样本学习？

小样本学习是指在 样本数据不足或质量较低的情况下进行的深度学习训练和预测的方法。

早期深度学习目标检测方法存在哪些问题？

依赖样本的数据的分布与数量，需要 足够多的已标注样本的来支持检测效果。但是这样会引入较高的制作成本。
早期应用大量标注样本回归候选框的位置，目标集与训练集数据分布不同会导致检测效果下降。
在军工业场景下， 大量的数据样本不易得。

2 大样本与小样本的对比

在有大量样本数据的情况下，模型训练误差是很小的。如果样本数量足够大，模型训练误差甚至可以趋于0
但当样本数量很小时，模型无法很好地拟合真实分布，往往会造成很大的模型训练误差。

; 3 在没有大量数据支持的情况下，小样本检测保证检测效果，有哪些解决方法？

数据域：通过先验知识来做数据增强，通过 数据量的增大解决模型不收敛的问题。
模型域：通过先验知识来 限制模型复杂度，降低假设空间的大小，使得模型收敛加快。
算法域：通过先验知识来提供一个 更快捷的搜索策略。

3.1 数据域：

本质上就是通过各种数据增强的方法， 增加样本容量，增加参数优化与迭代的次数；相当于提供了先验知识，帮助训练模型更接近训练能够达到的最佳模型。
由于被检测目标的真实分布是不可知的 p(x,y)， 绝对准确的先验知识是不可获得的。

; 3.1.1 转化原有数据集 D t D_t D t r _r r a _a a i _i i n _n n

我们在做pcb瑕疵检测的时候也发现：一开始使用deeppcb方法的时候，对于论文本身的复现效果较好，而对于我们自己真实的数据指标只有30%多，但是经过筛选并做数据增强之后（筛选主要是从缺陷的宽高比以及相对图像的大小进行筛选以尽量符合deeppcb本身数据集的属性），指标达到了74%左右，有明显提升，这或许正说明了deeppcb模型泛化性不好是由于预先设定的9种默认框是符合deeppcb本身数据集的缺陷分布状态的，也就是综述里说的，先验知识。如果我们想改善对我们数据集的性能，就需要去改变这个所谓的先验知识，修改默认的9种框的宽高比以及大小。在ppyoloe的测试中也有类似情况，对于个别图像出现的漏检现象，或许也正是训练集与目标检测集之间的分布不同导致的，实验发现，将漏检图像放入训练集，重新测试漏检大大降低。

我们之前做过的数据增强：属于转化原有数据集D _train_的图像增强，支持LabelIMg和LabelMe标注的文件，能实现LabelIMg标注后的图片的增强（包括 模糊，亮度，裁剪，旋转，平移，镜像等多种操作的随机组合）。在实验中也确实发现，图像增强可以提升一些训练效果，但作用有限。

&#x6E90;&#x7801;&#x5730;&#x5740;&#xFF1A;https://github.com/pureyangcry/tools

综述中提到的这种方案或许以后可以用到：
Zoph等提出了一种自动检索并采用可行的符合应用任务特点的图像增强方案AutoAugment，创建了一个数据增强策略的搜索空间，利用搜索算法选取适合特定数据集的数据增强策略，其尝试的数据增强策略共计22种，可以概括为：色彩变换，扭曲颜色通道而不影响包围框的位置，如对比度、亮度等、几何变换（几何尺度上扭曲图像，相应地改变包围框注释的位置和大小，如旋转、剪切、平移等）、包围框变换只扭曲包围框注释中包含的像素内容，如候选框旋转、候选框翻转等。其方案特别有益于数据集和小目标的检测。

&#x8BBA;&#x6587;&#x4F20;&#x9001;&#x95E8;&#xFF1A;https://arxiv.org/abs/1906.11172
&#x6E90;&#x7801;&#x4F20;&#x9001;&#x95E8;&#xFF1A;https://github.com/tensorflow/tpu/tree/master/models/official/detection

3.1.2 迁移其他数据集

另一种数据域的数据增强方式是迁移其他数据集，目前流行的一种方法是 引入对抗生成网络产生与训练集D train 分布相同的数据作为补充。
之前我们一直在使用监督训练的方法，下面这种Nguyen提出的半监督目标检测方法或许也可以尝试。
Nguyen 将未标记图像的训练作为一种潜在变量模型，提出了 一种基于期望最大化的未标记图像半监督目标检测方法，对目标检测的分类部分和定位部分进行了潜在标签估计，并对模型进行了优化。在COCO数据集上，半监督相较于监督学习有0.7%的指标提升。
Huang等借助GAN通过白天的数据生成了夜间的数据，看起来效果不错。

Nguyen半监督目标检测方法论文地址：Semi-supervised object detection with unlabeled data .
Huang论文地址： AugGAN:cross domain adaption with GAN-based data augmentation

3.2 模型域

目标检测所采用的模型决定了模型空间Ｐ的大小；模型域解决方案的基本原理是： 选取较大的模型空间Ｐ，再通过先验知识缩小空间。如下图：

我认为，我们对ppyoloe的网络结构的修改可以认为是模型域解决方案。原本ppyoloe的输入是一张3通道的图片，训练之后发现效果没有那么好，漏检现象比较明显，但在我们修改ppyoloe的输入为成对输入（test+temp），经过3层卷积进行浅层特征提取后做特征差，让模型 更关注于原图和模板图的差异，实验表明，达到了更好的效果；我觉得添加模板图的输入就是 给了模型一个先验知识，缩小了模型空间，使模型更容易贴近训练的最佳模型，也就更贴近真实模型。

; 3.2.1 多任务训练网路

多任务训练网络：比如Luo等通过一个预先训练的卷积神经网络CNN 从源域中的源任务学习来初始化CNN在目标域中的目标任务。在训练过程中，使用从多层CNN的表示中计算出的 对抗损失来迫使两个CNN项目样本进入一个任务不变空间。该方法在新领域的新类上显示了令人信服的结果，即使每个类只有几个标记的例子可用，也优于流行的微调方法。

论文地址：Label efficient learning of transferable representations across domains and tasks.

多任务之间进行共享参数是一个很好的思路，我认为在ppyoloe中也类似的提出了一个新颖的头部ET-head，并在T-head的基础上做了优化，平衡速度和精度，核心还是T-head。T-head目的是为了解决传统one-stage的分类与定位任务之间的不对齐问题，为了进一步克服分类和定位的偏差，在论文中提出了任务对齐学习(TAL)，它由 动态标签分配和任务对齐损失组成。动态标签分配意味着预测/损失感知。根据预测结果，为每个ground-truth分配动态数量的正锚。通过显式对齐两个任务，TAL可以同时获得最高的分类分数和最精确的包围框。这是我认为与综述中提到的深度卷积特征在不同任务中的共享可以一定程度上提高检测精度是一致的。

该图显示了TOOD（提出T-head）在无锚法中的效果，有了更精准的锚点，成功对齐了分类与定位任务，而不是第一张图片中红色锚点置信度高但是定位更接近披萨，绿色锚点定位准确为桌子但置信度低而被红色锚点NMS抑制。

; 3.2.2 增量学习网络

另一种模型域的解决方法是增量学习网络： 增量学习是指一个学习系统能不断地从新样本中学习新的知识，并能保存大部分已学习到的知识，其实现方式非常类似于人类自身的学习模式。

增量学习更像是一种理想状态，比如我们使用微调好的ppyoloe对之前筛选掉的原始数据进行测试有漏检现象，第一解决思路就是将所有原始数据重新按比例增强后重新训练，虽然可行，但费时费力。增量学习这种新思路如果可以避免灾难性遗忘的话，好像更加巧妙，而且在工业场景下会不断出现新的缺陷类型，增量学习的方式也更加合适。
一种用于增量学习的检测器 ONCE：Incremental few-shot object detection .

3.2.3 迁移学习网络

还有一种模型域解决方案是 迁移学习网络：当给定的已标注训练样本不足以完成训练时，可以将其他类似域的先验知识转移到当前应用中，以缓解目标域样本不足导致的效果较差的问题，域适应的方法通常用来提升目标域上的定位效果。

3.3 算法域

算法域解决方案的基本原理是：找到一种模型空间Ｐ中快速搜索最优模型的策略，这种策略可以利用先验知识来改变参数θ的搜索过程，使模型在有限次的迭代下 快速收敛，其具体原理下图所示：

元学习：区别于其他优化方式使模型更接近最优模型，元学习的优化策略 直接目标是真实模型，其目标是让机器”学会学习”。元学习拟合一系列相似任务的分布，利用元学习器将各个学习任务的参数合成，以此获得一个好的初始化参数。本质上是要寻找一个对于所有任务都较优的模型参数。

最后，由于本人知识储备有限，尽量花费大量时间阅读综述，仍觉理解不足，以上有理解错误之处，敬请指证；在本综述中提到的一些思路与方法，可以参考具体的文献。

Original: https://blog.csdn.net/wfl6666/article/details/126998891
Author: wfl6666
Title: 小样本目标检测综述 –刘浩宇，王向军 –阅读笔记

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/629310/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

每个Layer）的输入和输出是什么

问题：每个层（Layer）的输入和输出是什么？ 1. 介绍：在机器学习和深度学习中，神经网络模型由多个层组成，每个层都负责一些特定的计算任务。了解每个层的输入和输出对于理解神经网…

人工智能 2024年1月3日
0022
知识图谱应用实战案例100篇（一）-阿里巴巴超大规模知识图谱预训练实践：商品分类

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月1日
0062
web文字转语音

第一种：百度文字转语音开放API 1. 参数接口：http://tts.baidu.com/text2audio?lan=zh&ie=UTF-8&spd=2&am…

人工智能 2023年5月27日
0057
数据分析工具Pandas

学习目标：一，掌握数据结构分析，索引操作及高级索引二，掌握算术运算与数据对齐，数据排序三，掌握统计计算与描述，层次化索引四，掌握读写数据操作学习内容： 1.Pa…

人工智能 2023年7月6日
0075
【超详细】支持向量机（SVM）数学推导

目录一、硬间隔SVM（Hard Margin SVM) 二、对偶问题（Dual Problem) 1.将有约束问题转变为无约束问题 2.强对偶关系 3.计算拉格朗日函数的最小值 …

人工智能 2023年7月28日
0066
深度学习框架是否支持分布式和并行计算

问题介绍在深度学习中，分布式和并行计算是一种常见的需求。分布式计算可以加速模型的训练过程，并利用多台计算机进行并行计算，从而处理更大规模的数据。而并行计算则通过同时使用多个计算设…

人工智能 2024年1月1日
0033
目标检测算法——收藏|小目标检测的定义（一）

>>>深度学习Tricks，第一时间送达<<< 目录一、引言二、小目标检测定义（一）基于相对尺度定义（二）基于绝对尺度定义小目标检测一…

人工智能 2023年6月29日
0090
抢菜捡漏工具（PrintScreenCatchImg）

0.声明及版权信息 0.1.特别声明本仓库发布的 DingDongPrintScCatch项目中涉及的任何脚本，仅用于测试和学习研究，禁止用于商业用途，不能保证其合法性，准确性，…

人工智能 2023年6月20日
0078
lightGBM实战

文章目录 * – 一、使用LGBMClassifier对iris进行训练 – + 1.1 使用lgb.LGBMClassifier + * 1.1.2使用p…

人工智能 2023年6月19日
0066
Python可视化神器：pyecharts，轻松绘制 30+ 种超实用精美图表！

欢迎关注，专注 Python、数据分析、数据挖掘、好玩工具！如果要问：Python 中有那些可视化工具库？我想很多人都能想起来 matplotlib，这是一款初学者绕不开的库，…

人工智能 2023年7月3日
0068
无参考图像质量评价指标

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月18日
0056
白话机器学习-Encoder-Decoder框架

一背景大抵是去年底吧，收到了几个公众号读者的信息，希望能写几篇介绍下Attention以及Transformer相关的算法的文章，当时的我也是满口答应了，但是确实最后耽误到了现…

人工智能 2023年5月27日
0061
Yolov5 安装详细教程及目标检测和识别

文章内容：1.在 Anaconda 环境下，进行目标检测程序（Yolov5）的下载及安装，实…

人工智能 2023年6月17日
00110
R 线性模型检验异常观测值

一个全面的回归分析要覆盖对异常值的分析，包括离群点、高杠杆值点和强影响点。这些数据点需要更深入的研究，因为它们在一定程度上与其他观测点不同，可能对结果产生较大的负面影响。下面我…

人工智能 2023年6月18日
0079
深度学习语音分离|抽取必读论文、数据集、代码工具整理分享

语音分离（Speech Separation）这个问题来自于”鸡尾酒会问题”，采集的音频信号中除了主说话人之外，还有其他人说话声的干扰和噪音干扰。语音分离的…

人工智能 2023年5月27日
0058
AI 技术专家纷纷回归学术界，大厂刮起「科学家出走潮」？

整理 | 禾木木出品 | AI科技大本营（ID:rgznai100）又一大牛回归学术界！最近几年来，越来越多的海外华人科学家回归中国担任大梁，去年AI大牛朱松纯回到清华担任教…

人工智能 2023年6月17日
0063

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30