目标检测—SSD系列算法原理介绍

2023年7月9日上午9:11 • 人工智能 • 阅读 79

一、SSD系列算法原理介绍

1.1 SSD算法介绍:

➢Single Shot MultiBox Detector (one-stage方法)
●Wei Liu在ECCV 201 6提出
●直接回归目标类别和位置
●不同尺度的特征图上进行预测
●口端到端的训练
●图像的分辨率比较低，也能保证检测的精度

●主干网络: VGGNet
●多尺度Feature Map预测
●Default bounding boxes的类别分数、偏移量

➢主干网络介绍:
●VGG、 ResNet、 MobileNets等，各种卷积神经网
●将VGG最后两个FC改成卷积，并增加4个卷积层.

➢多尺度FeatureMap预测:
●不同层的feature map
●Prior box :类别概率和坐标(x,y,w,h)

1.3 算法细节介绍

●Prior Box Layer:
➢mn个cell
➢每个cell. 上生成固定scale和aspect ratio的box
●假设- 个feature Map有mxn个cell,每个cell对应k 个default box,每个default box预测c个类别score和4个offset
●(C+4) k * m*n个输出

●Prior Box Layer 步骤:

●Prior Box Layer特点:

➢shape数量越多，效果越好
➢Anchor

➢38384 + 19196 + 10106 + 556 + 334+114= 8732个prior box

●Prior Box Layer实现 :
➢每一个feature map cell 不是k个default box都取
➢prior box与GT box做匹配, IOU>阈值为正样本
➢训练:确保prior box的分类准确且尽可能回归到GT box

●样本构造:
➢正样本
从GT box出发给找到最匹配的prior box放入候选正样本集
从prior box集出发，寻找与GT box;满足lOU> 0.5的最大prior，box放入候选正样本集
➢负样本
难例挖掘
正负样本比: 1:3

●难例挖掘流程

●数据增强:
➢随机采样多个path,与物体之间最小的jaccard overlap为: 0.1，0.3, 0.5， 0.7与0.9
➢采样的patch比例是[0.3, 1.0], aspect ratio在0.5或2
➢GT box中心在采样patch中且面积大于0
➢Resize到固定大小
➢以0.5 的概率随机的水平翻转

●损失函数:
➢分类loss +回归loss
➢分类loss: Softmax Loss
➢回归loss: Smooth L1 Loss

SSD系列网络结构

基本思路:
让每一个prior box回归到GT box，这个过程的调控我们需要损失层的帮助，它会计算真实值和预测值之间的误差，从而指导学习的走向

●使用细节:
➢数据增强时，Crop采样大小
➢多任务网络的权重
➢正负样本比例
➢难例挖掘方式默认只取64个最高predictions loss来从中寻找负样本

SSD系列算法性能比较分析

在PASCAL VOC2007 数据集对比结果：

Table 1: PASCAL VOC2007 test detection results. Both Fast and Faster R-CNN

use input images whose minimum dimension is 600. The two SSD models have exactly the same settings except that they have different input sizes (300 X 300 vs.500 X 500).It is obvious that larger input size leads to better results.

在PASCAL VOC2012数据集上的对比结果：

在MS COCO数据集上的对比结果：

对SSD算法而言其整体的FPS 相对YOLO来说，有所降低，速度有所损失；相比与Fast R-CNN而言SSD算法有了一个性能上的提升，mAP值也有所提升。

●数据增强对于结果的提升非常明显
●使用更多的feature maps对结果提升更大
●使用更多的default boxes,结果也越好
●Atrous 使得SSD又好又快

如果输入图像的尺寸越大对应SSD算法性能也会有一个比较大的提升，而输入图像的尺寸增大也意味着处理速度地下降。

SSD系列算法效果

二、SSD系列算法优化及扩展

2.1 优化算法一——DSSD

●DSSD:
➢201 7年的CVPR，WeiLiu
➢SSD算法对小目标不够鲁棒的最主要的原因是浅层feature map的表征能力不够强。
加入上下文信息
更好的基础网络(ResNet) 和Deconvolution层， skip连接来给浅层feature map更好的表征能力

DSSD改进点:
➢主干网络：ResNet
➢Deconv

使用RestNet作为主干网络，针对后续的prior box的输入会分别使用反卷积来获取更多的特征表示，再进行回归后会得到更加鲁棒的特征。

DSSD VS SSD:

●DSOD总结:
➢2017年的ICCV201 7
➢DSOD可以从0开始训练数据，不需要预训练模型，而且效果可以和fine-tune的模型媲美
➢SSD+ DenseNet= DSOD
可以从零开始训练得到一个好的目标检测网络吗?

如果可以，设计这样的网络有没有什么原则可以遵守?

预训练模型优点:
开源模型多，可以直接将他们用于目标检测
可以快速得到最终的模型，需要的训练数据也相对较少

预训练模型缺点:
预训练模型大，参数太多，模型结构灵活性差,难以改变网络结构，计算量也大，限制其应用场合
分类和检测任务的损失函数和类别分布是不一-样的，优化空间存在差异
尽管微调可以减少不同目标类别分布的差异性,但是差异太大时，微调效果依然不理想

●DSOD设计原则:
➢基于候选区域提取的方法无法从零开始训练，不收敛,只有proposal-free方法可以从零开始训练并收敛(ROI Pooling)
➢DenseNet中更多的skip connections实现supervised signals传递.

➢增加dense blocks数量区别原先的固定数量
➢Stem Block优化(3个3x 3卷积层和1个2×2最大池化层)
➢6个尺度特征图进行目标检测，再融合(如何利用特征图)

DSOD网络结构：

2.2 优化算法二——FSSD

●FSSD设计原则:
➢借鉴了FPN的思想，重构了- -组pyramid feature map,使得算法的精度有了明显的提升,速度也没有太降
把网络中某些feature调整为同一-szie再contact,得到一-个像素层，以此层为base layer来生成pyramid feature map
Feature Fusion Module

FSSD网络结构:

SSD:

FSDD:

FSSD实验结果对比:

2.3 优化算法三——RSSD

●RSSD设计原则:
➢rainbow concatenation方式(pooling加deconvolution) 融合不同层的特征，在增加不同层之间feature map关系的同时也增加了不同层的feature map个数。
➢这种融合方式不仅解决了传统SSD算法存在的重复框问题，同时一定程度上解决了’small object的检测问题。

RSSD网络结构:

RSSD实验效果: Pooling、deconvolution

SSD系列算法应用场景

●人脸检测与识别任务
●ADAS场景目标检测与识别(车、行人、非机动车)
●通用物体检测与识别
●自然场景下文本检测与识别等等

Original: https://blog.csdn.net/qingxiao__123456789/article/details/125459505
Author: VernonJsn
Title: 目标检测—SSD系列算法原理介绍

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/680389/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Python数据分析之不只是拟合数据，还要获得洞察力，轻量级的 Python包可以让您深入了解回归问题

; 为什么需要洞察力？先说第一件事。为什么线性回归很重要？线性回归是一项基本技术，它深深植根于经过时间考验的统计学习和推理理论，并为现代数据科学管道中使用的所有基于回归的算法提供…

人工智能 2023年6月11日
00104
深度学习100例 | 第42天：音乐的识别与分类

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月25日
00104
预训练模型专题_Bart_论文学习笔记

Bart模型作为一种Seq2Seq结构的预训练模型，是由Facebook在ACL 2020上提出。Bart模型的论文为：《BART: Denoising Sequence-to-S…

人工智能 2023年5月31日
0096
二维码识别与定位-方法2-利用opencv扩展库aruco

二维码识别作为一种快捷准确的技术已经应用与生活中的购物支付、物体识别及工业AGV导航等领域，典型的二维码识别开源库有arcuo,alvar以及OpenCV中的二维码检测API如QR…

人工智能 2023年7月19日
0065
ubuntu下安装pytorch和TensorFlow

最近几天都在安装这两个环境，但由于是在服务器上安装，多少还是有些不方便。根据NVIDIA-smi，安装了cuda10.2，之后安装了对应的cudnn，安装对应的pytorch。 i…

人工智能 2023年5月24日
0089
树莓派远程连接工具SSH使用教程

树莓派远程连接工具SSH使用教程树莓派背景故事树莓派作为一款迷你小主机，大部分的使用场景都会用到远程调试，远程调试用到最多的方式一般就是VNC和SSH，SSH就是命令行型的远…

人工智能 2023年6月12日
0095
知识分享：数据分析的6大基本步骤

数据分析一直是一个老生常谈的话题。目前，很多企业都已将数据分析技术运用到了日常的商业活动中，但是有些企业还是在观望。今天，小编将从数据分析的最基本概念和数据分析的基本步骤两个方面…

人工智能 2023年7月18日
0083
房价预测之回归预测模型（线性、梯度下降、正则岭回归、lasso）

实验背景：基于波士顿房价数据掌握不同回归预测模型案例背景介绍：基于房子周边条件（衣食住行是否方便）、人文安全（教育程度、犯罪率等）、环境等因素来预测房价MEDV（单位千元） ; …

人工智能 2023年6月17日
0081
【机器学习】：决策树之CART回归树

在决策树算法当中，cart回归树是决策树的一种，它用来做回归的策略十分常见。可能还会在后续的GBDT模型当中所运用到，用来作为我们分裂节点的一个标准，我们来了解了解。备注：在进…

人工智能 2023年6月6日
0078
豆瓣电影评论情感分析（含代码+数据）

文章目录 * – + 目的 + 效果 + * – 云图 – 直方图 + 全代码+数据地址 + 核心代码片断 + * data_analysis….

人工智能 2023年7月15日
0060
自然语言处理NLP星空智能对话机器人系列：论文解读 How Good is Your Tokenizer? (你的词元分析器有多好？多语言模型的单语性能研究)

自然语言处理NLP星空智能对话机器人系列：论文解读 How Good is Your Tokenizer? On the Monolingual Performance of Mu…

人工智能 2023年5月30日
0094
关系抽取发展历程

关系抽取方法： 1、早期： 1.1 基于规则的方法：人工定义抽取抽取规则，与语料进行匹配，抽取关系。规则一般由领域专家构建，用来描述两个实体所在结构。1.2 基于本体的方法：（本体…

人工智能 2023年6月1日
0078
分类与回归（如何把分类问题转化为回归问题解决）

一、分类与回归的区我们都知道，有监督学习算法都在做一样事情，那就是预测。但是显然，针对不同的事件，我们有不同的预测的目标。其中，预测目标的形式（变量）有离散和连续两种类型。我们…

人工智能 2023年7月1日
0071
来不及细说，毕业三天靠Python兼职赚了两千

前言考了英语四六级，没办法用英语交流3分钟。考了普通话证书，却没有一个HR关心这个。不喜欢自己的专业，没有好好学。万万没想到，大学四年，学到最有用的东西是驾驶证。这扎心的现实，…

人工智能 2023年7月3日
0073
阅读笔记——FCOS：A Simple and Strong Anchor-free Object Detector

概述在目标检测领域，早期已经发展出非常多的 anchor based 检测方法，包括 FasterRCNN、RetinaNet、SSD、YOLO v3 等，但是这类 ancho…

人工智能 2023年7月12日
0050
GAN-生成对抗神经网络(Pytorch)-合集（1）GAN-DCGAN-CGAN

原生GAN （Generative Adversarial Nets）训练过程也是老三步了，再啰嗦一遍：使用真实图片训练辨别器，标签为真使用生成器生成的图片训练判别器，标签为假…

人工智能 2023年7月14日
0066

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31