论文阅读-多任务(2021)-YOLOP:用于自动驾驶目标检测与语义分割的实时多任务模型

2023年6月11日上午12:38 • 人工智能 • 阅读 75

YOLOP

论文：YOLOP: You Only Look Once for Panoptic Driving Perception
地址：https://paperswithcode.com/paper/yolop-you-only-look-once-for-panoptic-driving

; 论文阅读

YOLOP同时处理三项视觉感知任务+实时速度运行(Jetson TX2-23FPS)+保持较高精度

关于方法详情，如下图所示，全景驾驶场景感知网络YOLOP包括一个共享的编码器和三个特定的解码器处理不同任务，解码器之间没有复杂的共享机制，保证网络的端到端高效训练。

论文阅读-多任务(2021)-YOLOP:用于自动驾驶目标检测与语义分割的实时多任务模型

对于编码器，包含一个主干和一个neck，其中主干网络用于提取输入图像的特征，通常是选用图像分类网络，但是论文受YOLOv4的启发选用了CSPDarknet来作为主干，该主干有效解决了优化过程的梯度冗余问题，支持特征的高效传播和服用，满足模型对于实时的要求。

对于Neck，起作用在于融合主干网络生成的特征，YOLOP的neck由空间金字塔池化模块SPP和特征金字塔网络FPN组成。SPP生成并融合不同尺度的特征，FPN则融合不同语义层级的特征，使得生成的特征包含多尺度和多个语义层级的信息。

对于解码器，有三个，分别是交通目标检测头、可通行区域分割头和车道线分割头，后两者使用结构相同的分割头。

对于检测头，和YOLOv4相同，采用基于anchor的多尺度检测策略。首先使用通路聚合网络PAN（自底而上的特征金字塔网络）。FPN自顶而下传递语义特征，PAN自底而上传递位置特征，论文将二者结合以便产生更好的特征融合效果，之后直接在PAN种使用融合有多尺度信息的特征图进行检测。然后每个多尺度特征图的grid都会标记三个不同比例的先验框，然后检测头对位置偏移量、框尺寸以及类别标签进行预测。

对于分割头，论文奖FPN的输出（W / 8 , H / 8 , 256 W/8,H/8,256 W /8 ,H /8 ,2 5 6）直接灌给分割头，经过三次三次上采样后输出预测结果( W , H , 2 ) (W,H,2)(W ,H ,2 )，因为SPP模块已经在共享的neck种一个用，这里不需要额外的SPP模块。

训练目标

对于损失函数，检测头的损失函数：

L d e t = α 1 L c l a s s + α 2 L o b j + α 3 L b o x L_{det}=\alpha_1 L_{class}+\alpha_2 L_{obj}+\alpha_3 L_{box}L d e t =α1 L c l a s s +α2 L o b j +α3 L b o x

其中前两者都是focal loss，使得网络更多关注难样本，第三个是L C I o U L_{CIoU}L C I o U ，该损失考虑了Pred和GT之间的距离、重叠率、anchor尺寸和比例.

分割头的损失有两个即可通行区域分割头损失L d a − s e g L_{da-seg}L d a −s e g 和车道线分割损失L l l − s e g L_{ll-seg}L l l −s e g ，二者都包含一个交叉熵损失L c e L_{ce}L c e 用于最小化Pred和GT之间的像素分类误差，道路损失还额外包含一个IoU损失L I o U = T N T N + F P + F N L_{IoU}=\frac{TN}{TN+FP+FN}L I o U =T N +F P +F N T N 。

最终模型的损失是一个带权复合损失:

L a l l = γ 1 L d e t + γ 2 L d a s e g + γ 3 L l l − s e g L_{all}=\gamma_1 L_{det}+\gamma_2 L_{da_seg}+\gamma_3 L_{ll-seg}L a l l =γ1 L d e t +γ2 L d a s e g +γ3 L l l −s e g

训练的时候，先冻结模型其他部分权重，只训练编码器和检测头，然后冻结主干和检测头训练两个分割头，最终整个网络联合训练。

欢迎扫描二维码关注微信公众号深度学习与数学，每天获取免费的大数据、AI等相关的学习资源、经典和最新的深度学习相关的论文研读，算法和其他互联网技能的学习，概率论、线性代数等高等数学知识的回顾。

Original: https://blog.csdn.net/kevin_zhao_zl/article/details/124067014
Author: 不会算命的赵半仙
Title: 论文阅读-多任务(2021)-YOLOP:用于自动驾驶目标检测与语义分割的实时多任务模型

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/598284/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

数据库概论之MySQL表的增删改查 – 进阶版本1

MySQL表的增删改查 – 进阶2 3、新增(plus) * 3.1 语法 3.2 实例 3.3 注意事项 4、查询(plus) * 4.1 聚合查询 – …

人工智能 2023年7月30日
0076
数据分析-Pandas基础

关于数据分析数据分析，宽泛地理解就是对海量数据进行处理、分析等操作，从数据中得到价值。选择这个方向，你可以往数据分析师、数据挖掘、数据产品经理等方向发展。 Pandas 1.Pa…

人工智能 2023年7月14日
0065
源码解析–hugegraph基于raft实现分布式一致性

随着社交、电商、金融、零售、物联网等行业的快速发展，现实社会织起了了一张庞大而复杂的关系网，亟需一种支持海量复杂数据关系运算的数据库即图数据库。本系列文章是学习知识图谱以及图数据库…

人工智能 2023年6月10日
0087
Mask RCNN详解

1.Mask RCNN网络结构 Mask R-CNN是对Faster R-CNN的直观扩展，网络的主干有RPN转换为主干网络为ResNet的特征金字塔网络(FPN)，同时添加了一…

人工智能 2023年7月9日
00105
OpenCV学习笔记14-计算机视觉中的背景减除介绍及代码实现

参考文章：https://blog.csdn.net/tengfei461807914/article/details/81588808 https://zhuanlan.zhih…

人工智能 2023年7月5日
0081
Pandas（数据分析处理库）—讲解

本内容来自《跟&#…

人工智能 2023年6月19日
0077
如何使用Keras构建一个全连接神经网络

介绍本文将详细解决如何使用Keras构建一个全连接神经网络的问题。全连接神经网络是一种最基本的神经网络模型，其每个神经元与上一层的所有神经元相连。我们将首先介绍全连接神经网络的算…

人工智能 2024年1月4日
0034
Opencv霍夫变换圆检测实战之检测硬币（C++）

HoughCircles 函数可以利用霍夫变换算法检测出灰度图中的圆。不需要源图像是二值的，只用将原图转化为灰度图即可。 void HoughCircles(InputArray …

人工智能 2023年7月19日
0085
FPN网络详解

1 特征金字塔特征金字塔(Feature Pyramid Networks， FPN)的基本思想是通过构造一系列不同尺度的图像或特征图进行模型训练和测试，目的是提升检测算法对…

人工智能 2023年7月30日
0057
python数据分析与可视化

数据分析初始阶&#…

人工智能 2023年7月4日
0067
Deepsort 多目标跟踪–行人/车辆ReID训练

项目中提供了行人ReID模型权重，放在 yolov5-deepsort\deep_sort\deep_sort\deep\checkpoint下名为 ckpt.t7的权重文件,是基…

人工智能 2023年7月28日
00120
【OpenCV 例程200篇】203. 伪彩色图像处理

OpenCV 例程200篇总目录201. 图像的颜色空间转换202. 查表快速替换（cv.LUT）203. 伪彩色图像处理204. 图像的色彩风格滤镜205. 调节色彩平衡/饱和…

人工智能 2023年6月19日
0089
深度学习模型加速方法

1、从网络结构上进行优化2、从计算量上进行优化3、硬件上优化 1、使用1 _1卷积核代替全连接层可以减小参数2、使用多个小卷积核代替一个大卷积核，可以达到相同的感受野，同时减小计算…

人工智能 2023年6月16日
0069
嵌入式属于人工智能吗？

嵌入式是以应用为中心，以计算机技术为基础，具备存储、通讯、显示能力，并且软硬件可裁剪、可靠性、成本、体积、功耗有严格要求的专用计算机系统.嵌入式系统是一种软件和硬相结合的专用的计算…

人工智能 2023年7月19日
0067
NLP模型笔记2022-25：neo4j+py2neo构建增值税电子普通发票知识图谱

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月1日
0090
Dataloader的使用

本文主要使用CIFAR10数据集来讲解Dataloader的使用方法，并写入tensorboard中，可以更好的去查看。在pytorch中如何读取数据主要有两个类，分别是Data…

人工智能 2023年7月21日
0090

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

论文阅读-多任务(2021)-YOLOP:用于自动驾驶目标检测与语义分割的实时多任务模型

YOLOP

; 论文阅读

训练目标

大家都在看