【YOLO3D】:端到端3D点云输入的实时检测

2023年5月28日下午6:35 • 人工智能 • 阅读 80

YOLO3D:端到端3D点云输入的实时检测

前言
算法分析
*
模型输入
网络结构
回归损失
–
数据集处理
–
- 训练
- 结果

前言

YOLO3D将YOLO应用于3D点云的目标检测，与Complex-YOLO（Complex-YOLO的解读从这进入）类似，不同的是将yolo v2的损失函数扩展到包括偏航角、笛卡尔坐标下的三维box以及直接回归box的高度。

论文： https://arxiv.org/abs/1808.02350

算法分析

模型输入

论文中将3D点云投影为鸟瞰图网格，创建两个网格映射如图。

第一个包含最大高度，其中每个网格单元（像素）值表示与该单元关联的最高点的高度。第二个网格图表示点的密度，密度的计算参考MV3D(论文解读从此进入)。

; 网络结构

论文的结构参考YOLO-v2架构，做了一些修改。

修改了一个最大池化层，将下采样从 32 改为 16，有了一个更大的网格，这有助于检测行人和骑自行车的人等小物体。
从模型中删除了skip connection，因为它会导致结果不太准确。

回归损失

3D box 回归

论文在原始YOLO v2中添加了两个回归项以生成 3D 边界框：中心的 z 坐标和框的高度。z 坐标的回归以类似于 x 和 y的回归的方式，通过 sigmoid 激活函数进行坐标。

值得注意的是，虽然 x 和 y 通过在每个网格单元中预测 0 到 1 之间的值进行回归，定位该点位于该单元内的位置，但 z 的值仅映射到位于一个垂直网格单元内，如下图所示 . 选择将 z 值仅映射到一个网格而将 x 和 y 映射到多个网格单元的原因是 z 维度中值的可变性远小于 x 和 y 的可变性（大多数对象具有非常相似的框高程）。
【YOLO3D】:端到端3D点云输入的实时检测

; 偏航角回归

论文中定义边界框的方向范围从 -π 到 π。将该范围归一化为 -1 到 1，并调整我们的模型以通过单个回归数直接预测边界框的方向。在损失函数中，计算地面实况和我们预测的角度之间的均方误差：

边界框损失函数

3D box的损失是2Dbox原始 YOLO 损失的扩展。偏航项的损失按照上述计算。高度的损失是中宽度和长度损失的延伸。类似地，z 坐标的损失是 x 和 y 坐标损失的扩展。

λ c o o r λcoor λc o o r ：分配给坐标损失的权重，
λ c o n f λconf λc o n f ：分配给预测置信度损失的权重，
λ y a w λyaw λy a w：分配给方向角损失的权重，
λ c l a s s e s λclasses λc l a s s e s ：分配给损失的权重类概率，
L i j o b j L^{obj}{ ij}L i j o b j ：一个变量，它根据第 i 个和第 j 个位置中是否存在真实值框取 0 和 1 的值。如果有一个盒子，则为 1，否则为 0，
L i j n o o b j L^{noobj}{ ij}L i j n o o b j ：与前一个变量相反。如果没有物体，则取值为 0，否则取值为 1，
x i , y i , z i x_i , y_i , z_i x i ,y i ,z i ：地面实况坐标，
x i ^ , y i ^ , z i ^ \hat{x_i}, \hat{y_i}, \hat{z_i}x i ^,y i ^,z i ^ ：地面实况和预测方向角，
φ i , φ i ^ φ_i, \hat{φ_i}φi ,φi ^ ：地面实况和预测方向角 …等，
C i , C i ^ C_i, \hat{C_i}C i ,C i ^ : 真实情况和预测置信度，
w i , l i , h i w_i , l_i , h_i w i ,l i ,h i : 真实情况宽度、高度和盒子的长度，
w i , l i , h i w^i, l^i, h^i w i ,l i ,h i : 预测宽度、高度和长度框
p i ( c ) 、 p i ^ ( c ) p_i( c)、\hat{p_i}( c)p i (c )、p i ^(c ) 真实情况和预测的类别概率。

; 数据集处理

论文使用了 KITTI 基准数据集。点云以每像素 0.1m 的分辨率在 2D 空间中投影为鸟瞰网格图，与MV3D使用相同的分辨率。

网格图表示的 LiDAR 空间范围为向右 30.4 米，向左 30.4 米，向前 60.8 米。在上述分辨率为 0.1 的情况下使用此范围会导致每个通道的输入形状为 608×608。

LiDAR 空间中的高度剪裁在 +2m 和 -2m 之间，并缩放到 0 到 255 以表示为最大高度通道中的像素值。

训练

该网络以端到端的方式进行训练。使用了动量为 0.9、权重衰减为 0.0005 的随机梯度下降。将网络训练了 150 个 epoch，批量大小为 4。
对于前几个 epoch，将学习率从 0.00001 慢慢提高到 0.0001。如果以高学习率开始，我们的模型通常会因梯度不稳定而发散。再继续用 0.0001 训练 90 次，然后用 0.0005 训练 30 个时期，最后用 0.00005 训练最后 20 次。

结果

参考：
论文阅读《YOLO3D: End-to-end real-time 3D Oriented Object Bounding Box Detection from LiDAR Point Cloud》

YOLO3D端到端的3d物体检测论文笔记

YOLO3D 论文翻译及笔记

Original: https://blog.csdn.net/qingliange/article/details/122912653
Author: 城市黎明的烟火
Title: 【YOLO3D】:端到端3D点云输入的实时检测

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/533054/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

零基础的嵌入式机器学习：Edge Impulse使用教程之训练模型浅析(2)——回归(预测)模型

前言没有机器学习基础但是想利用嵌入式AI？Edge Impulse绝对是不二之选！算法自动提供，代码一键生成，移植简单方便，简直是小白的福音！如果你打算涉及嵌入式机器学习，那…

人工智能 2023年6月17日
00136
Apollo规划决策算法仿真调试(1): 使用Vscode断点调试apollo的方法

前言 Apollo (阿波罗)是一个开放的、完整的、安全的平台，将帮助汽车行业及自动驾驶领域的合作伙伴结合车辆和硬件系统，快速搭建一套属于自己的自动驾驶系统。Apollo 自动驾驶…

人工智能 2023年6月10日
00102
信息抽取（五）实体命名识别之嵌套实体识别哪家强，我做了一个简单的对比实验

实体矩阵构建框架 GlobalPointer class GlobalPointer(Module): """全局指针模块将序列的每个(start,…

人工智能 2023年5月31日
00100
Opencv根据USB摄像头PIDVID号，获取对应摄像头索引

1.引言电脑插多个USB摄像头时，当插拔或者开机之后，Opencv对应的摄像头索引会发生改变，导致Opencv打开摄像头会开错，比如笔记本自带一个摄像头，插上一个USB摄像头时，…

人工智能 2023年5月26日
00102
激光雷达（LiDAR）| 第一节：点云处理库与软件介绍

本节将介绍基于激光雷达点云处理的相关库和软件点云数据激光雷达（LIght Detection And Ranging，LiDAR）是一种集激光，全球定位系统(GPS)和惯性导航…

人工智能 2023年7月27日
0081
深度学习图像处理入门

学习路线— 1、图像分类 2、目标检测 3、图像分割进tensorflow官网用tensorflow.google.cn 1.1卷积神经网络基础全连接层：BP算法…

人工智能 2023年6月22日
00107
不用再找了，这就是全网最全的异常检测方法总结

大家好，今天正好趁着周末，收集整理全网最常使用的异常检测方法（附资料来源和代码），喜欢记得收藏、点赞、关注。注：技术交流文末获取一、基于分布的方法 1. 3sigma 基于正…

人工智能 2023年6月24日
0081
pandas的Series和DataFrame

文章目录 pandas的核心类 Series(数据系列)带标签的数组 * 一、创建Series对象二、Series索引和切片三、Series的基本用法 – 1.处理…

人工智能 2023年7月8日
0052
pytorch 笔记： nn.Transformer

1 Transformer torch.nn.Transformer( d_model=512, nhead=8, num_encoder_layers=6, num_decode…

人工智能 2023年7月22日
0063
一文速学-Pandas处理DataFrame稀疏数据及维度不匹配数据详解

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月5日
0062
YOLOV5-断点训练/继续训练

YOLOV5-断点训练/继续训练情况：1.训练过程中中断了，继续训练2.训练完了，但是未收敛，在这个基础上，还想用这个权重、学习率等参数继续训练多一些批次 1. 训练过程中中断了…

人工智能 2023年6月23日
0088
PHP在语音通知的应用场景

语音通知接口应用场景语音通知的强提醒模式，可以第一时间通知用户，满足多种场景下的应用需求。 [En] The strong reminder mode of voice noti…

人工智能 2023年5月25日
00107
[深入浅出pandas]ch5高级操作

对DataFrame其中一列进行逻辑计算，会产生一个对应的由布尔值组成的Series in: df.Q1>36 out: 0 True 1 False 2 True 3 Tr…

人工智能 2023年7月8日
0066
R语言数据类型转换：基本数据类型的转换、将一种数据类型转化为另外一种数据类型

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月16日
0072
Python使用Numpy实现Kmeans算法

目录 Kmeans聚类算法介绍： 1.聚类概念： 2.Kmeans算法：定义：大概步骤： Kmeans距离测定方式： 3.如何确定最佳的k值(类别数)：手肘法： python…

人工智能 2023年6月2日
00102
【目标检测】YOLO系列——YOLOv1详解

本篇是关于目标检测算法YOLOv1的学习笔记。网上的博客大多是摘抄翻译论文中的重点内容加上自己的理解，或者是梳理论文的大致思路，在没看过原文的情况下可能总会有些看不懂的地方。所以强…

人工智能 2023年6月17日
00142

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31