YOLOFaceV2笔记

2023年10月9日下午9:42 • Python • 阅读 54

论文地址：2022-CVPR-YOLO-FaceV2: A Scale and Occlusion Aware Face Detector
论文代码：https://github.com/Krasjet-Yu/YOLO-FaceV2

Abstract

现有目标（人脸）检测算法已取得很大的进展，如BlazeFace、RetinaFace、RCNN系列、YOLO系列等；
这些算法可以被分为两大类： 两阶段的（RCNN系列）和 单阶段的（YOLO系列）；
本文基于单阶段的yolov5提出了一个实时的face detector：YOLO-FaceV2；
主要改进的部分有以下几方面：
（1）设计了一个被称为 RFE（receptive field enhancement module）的感受野增强模块来增强小脸的感受野；
（2）利用 NWD loss来弥补IoU对微小物体位置偏差的敏感性；
（3）针对人脸遮挡问题，提出了一种名为 SEAM的注意模块，并引入 排斥损失（Repulsion Loss）来解决；
（4）还利用权重函数 Slide来解决易样本和难样本之间的不平衡，并利用有效接受野的信息来设计锚。
5.最后通过实验证明yolofacev2性能好。

1 Introduction

通过仔细分析现有人脸检测算法遇到的困难和yolov5检测算法的缺陷，本文从 以下几方面进行改进：

多尺度融合：RFE；
注意力机制：SEAM；
难样例：Slide 权重函数；
锚点设计：设计多个锚框的比例；
*回归损失：NWD（Normalized Wasserstein Distance）与IoU以不同的权重进行结合；

本文的主要贡献如下：

为了检测多尺度的人脸，感受野和分辨率是关键因素。因此，在本文中设计了 RFE模块（receptive field enhancement module）以学习特征图的不同接受域，并进行增强特征金字塔表示；
本文中将人脸遮挡（face occlusions）分为两大类：不同人脸之间的遮挡与其他物体对人脸的遮挡。前者使用排斥损失 Repulsion Loss惩罚预测框转移到其他真实对象，要求每个预测框远离其他具有不同指定目标的预测框，以降低检测结果对NMS的敏感性。后者使用 SEAM注意力机制以增强面部特征学习能力。
为了解决难易样例间的不平衡问题，根据IoU以对不同的样例进行加权，主要使用的方式是 Slide权重函数；

3 YOLO-FaceV2

3.1 Network Architecture

YOLOFaceV2主要由3部分构成：backbone [ CSPDarknet53 ]、neck [ SPP、PAN ]、heads。（与yolov5、yolov5face基本一致。）

【
SPP：单独的P3、P4、P5模块；
PAN：P3、P4、P5等进行整合的操作；细节参考：（https://www.cnblogs.com/AIBigTruth/p/15100810.html）
】

; 3.2 Scale-Aware RFE Model

不同的接收域大小意味着捕获远程依赖的能力不同。
在RFE中主要使用的是dilated conv。并使用不同比列的膨胀卷积进行不同卷积操作，即：
使用4种不同比例的扩展卷积分支来捕获多尺度信息和不同的依赖范围，且这些分支间权值共享，唯一的不同就是接受域不同。
且此方式的好处是：

减少了模型参数，同时减少潜在的overfitting风险；
可以充分利用每个样例。（主要是因为可以进行不同尺寸的操作~）。

RFE模块主要由两部分构成：基于膨胀（扩张）卷积的多分支和 gathering&weighting layer。具体如下图：

其中多分支主要是通过设置不同比列的膨胀卷积来实现的；收集和加权层（gathering and weighting layer）用于从不同的分支收集信息，并对特征的每个分支进行加权。

4 Experiments

在本章，主要对所提出的方法进行了全面的消融，包括 注意模块、 多尺度融合金字塔结构和 损失函数设计的有效性。最后与其他SOTA人脸检测器的性能进行了比较。

4.1 Dataset

WiderFace：由超过400K张人脸的33203张图像构成。其包含训练（40%）、测试（50%）与验证（10%）三部分；根据困难程度，WidefFace又可被分为三部分：easy、medium和hard。

4.2 Training

与yolov5face一样同样使用yolov5作为baseline；
optimizer使用的是:SGD；初始学习率：1e-2；最终学习率1e-3；权重缩减：5e-3；前3轮进行warming-up，且仅在该情况下的动量参数为0.8，其他情况下动量参数为0.937；
IoU阈值为0.5；
硬件资源：1080ti，4核；
以batch size为16的情况下迭代100次进行微调。

4.3 Ablation Study

4.3.1 SEMA Block

SEAM块是注意网络。通过使用该块，以通过增强未遮挡人脸的响应来弥补被遮挡人脸的响应损失。[实验性能对应下表：Table2中第2行~]

(上表中序号为对应的行数)

; 4.3.2 Multi-scale feature fusion

（1）在PAN的基础上融合P2层特征，以使得融合得到的特征图中包含更多小目标信息；[实验性能参考上表：Table2中第3行~]
（2）为了弥补颈部层（neck layer）输出特征图接受域有限，导致大中型目标检测精度下降的不足，使用了RFE模块；[实验性能如上表：Table2中第4行]

4.3.3 Slide Loss

使用Slide Loss的主要目标是：使得模型更加关注hard样例；[对应实现性能如上表：Table2中第5行]

4.3.4 Anchor Design

锚的比例和大小与有效感受野密切相关。[…第6行]

4.3.5 NWD Loss

首先使用NWD Loss替换IoU作为回归损失，但是性能并未提高。
因此选择保留IoU Loss，通过调整IoU Loss和MWD Loss之间的比例关系来提高模型对小目标检测的鲁棒性。因为实验结果表明，对于大中型目标，测量的效果IoU优于NWD, NWD可以有效提高小目标的检测精度。具体实验结果如下表（Table3）：

; 4.3.6 Balance of RepGT and RepBpx

受行人遮挡问题的解决方案启发，作者在人脸检测中加入了排斥损失函数（Repulsion Loss），并分析了不同的人脸遮挡阈值，使该损失函数适用于人脸检测。[实验结果参考Table2中第8行。]

4.4 Comparisons with Existing Face Dectors

; 5 Conclusion

本文基于yolov5提出了yolofacev2，旨在解决人脸尺度变化（多尺度问题）、难易样本不平衡、面部遮挡等问题；
将P2层融合到特征金字塔中以提高小目标的分辨率，设计RFE模块以增强接受域，并使用NWD Loss来提高模型对小目标检测的鲁棒性；（多尺度问题）
引入Slide权值函数来缓解简单样例和难检测样例的不平衡；（数据不平衡）
使用SEMA模块和Repulsion Loss解决面部遮挡问题；（面部遮挡）
最终yolofacev2在widerface数据集上实现了接近或超过SOTA的性能。

模型训练

Original: https://blog.csdn.net/weixin_41807182/article/details/127519652
Author: 充实而又快乐
Title: YOLOFaceV2笔记

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/795032/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

DRF–序列化器类中的to_internal_value,to_representation方法,save,create,update方法

1.to_internal_value方法 def to_internal_value(self, data): 1.1 to_internal_value方法,是所有字段开始校验…

Python 2023年8月6日
0048
Django 之Auth模块

Auth 模块是Django中自带的用户认证模块。一个网站系统需要实现用户注册、用户登录、用户认证、注销、修改密码等功能，Django中内置了强大的认证系统-auth，默认使用 …

Python 2023年10月31日
0062
【Python从入门到精通】（三）Python的编码规范，标识符知多少？

您好，我是码农飞哥，感谢您阅读本文，欢迎一键三连哦。这是Pyhon系列文章的第三篇，本文主要介绍Python程序的编码规范。干货满满，建议搜集，需要经常查看。如果您有任何问题和需求…

Python 2023年5月25日
00112
N皇后问题——Python解决（超详细注释）

N皇后问题——Python解决（超详细注释） N皇后问题 * 1、问题 2、思路 – + 1）棋盘表示 2）不攻击检查 3）dfs搜索实现 3、代码总体实现 4、结果展…

Python 2023年8月1日
0052
Linux系统下pytorch官网conda命令安装pytorch的版本是cpu

目录环境说明问题描述问题1：The NVIDIA driver on your system is too old 问题二：用pytorch官网conda命令安装的pyto…

Python 2023年9月8日
0041
HW1-井字棋

ESC架构首先介绍ESC架构：ESC架构，即实体-组件-系统架构，遵循的原则是组合优于继承。在unity中，update函数在每一帧都会重新遍历，如果我们将所有组件模块都放在up…

Python 2023年9月25日
0029
Python数据分析常用包-pandas

读者需知：本文为个人实践过程中的总结记录，当中有未知变量名为当时实践时使用。以numpy为基础，基于matplotlib可以简单画图。数据处理能力强三大数据结构 Se…

Python 2023年8月21日
0037
Python Pytest自动化测试获取测试用例执行结果

Time will tell. Pytest 提供了很多钩子方法让我们对测试用例框架进行二次开发，可根据自己的需求进行改造。所以接下来就来学习下 pytest_runtest_ma…

Python 2023年9月10日
0047
《Python开发 – Python库》Dask安装与使用(轻量级并行计算库)

Dask手册 1 Dask简介 Dask是一个并行计算库，能在集群中进行分布式计算，能以一种更方便简洁的方式处理大数据量，与Spark这些大数据处理框架相比较，Dask更轻。Das…

Python 2023年8月18日
0080
FPGA 20个例程篇：19.OV7725摄像头实时采集送HDMI显示(四）

第七章实战项目提升，完善简历 19. OV7725 摄像头实时采集送HDMI显示（四）在介绍完OV7725初始化配置和视频采集模块后，就到了整个项目的核心部分即DDR3乒乓存储…

Python 2023年11月6日
0049
Python嘎嘎涨知识的7个小游戏，玩过的都爱不释手（附源码，直接运行就可）

前言今天星期七，是一个快乐的日子。上班族不用上班，学生不用学习。我也不想分享太多的知识去为难大家，就给大家七个小游戏吧，从周一玩到周日的那种，学会了记得来找我PK……

Python 2023年11月2日
0039
在VScode运行代码出现错误：【% matplotlib inline SyntaxError: invalid syntax】

———————————–志当高远且脚…

Python 2023年9月2日
0067
Tensorflow安装后出现的问题

在Tensorflow安装完成后，为了检查是否安装成功时出现以下问题 (tf_gpu) C:\Users\1789834715>pythonPython 3.9.7 (def…

Python 2023年10月26日
0042
用Python做五子棋小游戏,Pygame库

游戏大致介绍:两个玩家通过依次操作鼠标进行落子,其中谁先达成五子连线谁就获得最终胜利 import pygame,sys 老规矩先导入要用到的两个包,没有下载和导入pygame的包…

Python 2023年9月22日
0051
python数据分析——numpy，pandas，matplotlib

matliotilb:帮助画图 numpy：帮助我们处理数据型的数组 pandas：是在numpy的基础上除了帮我们处理数据型的数组，还能帮助我们处理字符串，列表，以及时间序列等等…

Python 2023年8月31日
0061
bandit agent下棋AI（python编写）通过强化学习RL 使用numpy

PS：首先声明是学校的作业= = 我喊它贝塔狗（原谅我不要脸），因为一直觉得阿法狗很厉害但离我很遥远，终于第一次在作业驱动下尝试写了一个能看的AI，有不错的胜率还是挺开心的正文 …

Python 2023年8月24日
0051

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31