KITTI数据集3d目标检测的评价的含义

2023年6月17日上午7:15 • 人工智能 • 阅读 103

kitti数据集评价的含义

kitti数据集的相关介绍
kitti数据集3d目标检测的评价
KITTI 3D AP Metric 的更新
参考文献

kitti数据集的相关介绍

论文:are we ready for autonomous driving the kitti vision benchmark suite
kitti数据集下载及解析，参考博客:KITTI数据集下载及解析和KITTI数据集下载（百度云）（这两个博客真的良心，感谢作者！！！）

kitti数据集3d目标检测的评价

kitti数据集可以针对很多下游任务。本文只针对3d目标检测的评价数值进行解释。

上图是基于mmdetection3d其中一个模型跑出来的kitti验证结果，训练的是3个类别，分别是行人、骑行者和汽车。对于这三个类其实含义一样，以下就以car的数值为例进行解释。
KITTI数据集3d目标检测的评价的含义

可以看到，对于car的评价结果分成两部分，其实就是两个table。首先解释第一个table：
第一行 Car AP@0.70, 0.70, 0.70，
Car就是类别（有点废话），AP=average precision（平均准确率），后面三个0.70都是指IOU threshold（目标检测中用于评价预测输出包围框与真实框的重叠情况，设置阈值，从而判断预测结果是否为positive）。

&#x9700;&#x8981;&#x6CE8;&#x610F;&#x7B2C;&#x4E00;&#x4E2A;0.70&#x662F;bbox&#x5BF9;&#x5E94;&#x7684;IOU&#xFF0C;&#x7B2C;&#x4E8C;&#x4E2A;0.70&#x662F;bev&#x5BF9;&#x5E94;&#x7684;IOU&#xFF0C;&#x7B2C;&#x4E09;&#x4E2A;0.70&#x662F;3d&#x5BF9;&#x5E94;&#x7684;IOU&#x3002;&#xFF08;2022.06.15&#x4FEE;&#x6539;&#xFF0C;&#x4E4B;&#x524D;&#x6CA1;&#x6709;&#x63CF;&#x8FF0;&#x6E05;&#x695A;&#xFF0C;&#x5E26;&#x6765;&#x8BEF;&#x5BFC;&#xFF0C;&#x4E0D;&#x597D;&#x610F;&#x601D;&#xFF09;

第二、三、四行的bbox、bev和3d是对应的三种评价情况。bbox就是2d下的检测。bev=bird-view detection，即鸟瞰图下的检测。3d就是指3d下的检测。（这三种情况应该很好理解）
所以，

&#x7B2C;&#x4E00;&#x884C;&#x7684;&#x4E09;&#x4E2A;0.70&#x5206;&#x522B;&#x5C31;&#x662F;&#x5BF9;&#x5E94;&#x8FD9;&#x4E09;&#x79CD;&#x60C5;&#x51B5;&#x7684;IOU threshold

，例如在bev下，只有当预测输出与真实框的IOU大于0.70，才认为该输出是正确的。
对于二、三、四、五行，每一行都有三个数值，分别对应的是 easy、moderate和hard下的评估结果。对于数据集是如何划分难度的，可以参考原论文are we ready for autonomous driving the kitti vision benchmark suite。顾名思义，难度越来越大，所以数值也越来越小，很合理。
第五行的 aos=average orientation similarity，平均朝向相似度，用于评价预测输出的朝向与真实框的朝向的相似程度，通俗来说就是朝向预测得是否准确，当然越高越好。

第一个表格讲完，到第二个表格。其实第二个表格的解释和第一个表格一模一样，唯一区别就是三个IOU改为了0.70,0.50,0.50。
即对于bbox，IOU阈值没有改变，那既然IOU没有改变，那么结果当然是一模一样的，所以 可以看到两个表格的第二行的数值是完全一样的。
对于第三和第四行，IOU阈值降低了 （从0.70, 0.70降低到了0.50, 0.50），通俗含义就是要求降低了，所以评估的AP结果当然提高了， 所以第二个表格在第三和第四行的结果比第一个表格要高。
最后一行，AOS，对于该指标，它的计算条件在一二个表格里都是相同的。

; KITTI 3D AP Metric 的更新

在论文：Disentangling Monocular 3D Object Detection 中对KITTI 3D的评价指标进行了回顾，以及提出了修改：由原来的AP(实际为A P ∣ R 11 ) AP|{R{11}})A P ∣R 11 )修改为了A P ∣ R 40 AP|{R{40}}A P ∣R 40 。而且KITTI官方也认可了该指标。详情请看下图以及官网信息。

下面先简单回顾A P ∣ R 11 AP|{R{11}}A P ∣R 11 ，该标准的全称或许可以（因为我也不太清楚全称应该是什么，所以这里写或许，见谅）称为 11-point Interpolated Average Precision，表示11点插值平均精度，其公式为

A P ∣ R = 1 ∣ R ∣ ∑ r ∈ R ρ i n t e r p ( r ) AP|{R}=\frac{1}{|R|}\sum{r\in R}\rho_{interp}(r)A P ∣R =∣R ∣1 ∑r ∈R ρin t er p (r ), 插值函数 ρ i n t e r p ( r ) = max ⁡ r ′ : r ′ ≥ r ρ ( r ′ ) \rho_{interp}(r)=\max_{r’:r’\geq r}\rho(r’)ρin t er p (r )=max r ′:r ′≥r ρ(r ′)，
在KITTI 3D中 R 11 = { 0 , 0.1 , 0.2 , ⋯ , 1 } R_{11}={0, 0.1, 0.2, \cdots, 1}R 11 ={0 ,0.1 ,0.2 ,⋯,1 }，是等间距的recall level。

但是，从插值函数的形式，它并不是取每个 r r r 时实际的观察值的平均值，而是取其中的最大值。r r r 从0开始取，则如果只有单个预测，且是正确匹配的，则此时对应的 ρ i n t e r p ( 0 ) = 1 \rho_{interp}(0)=1 ρin t er p (0 )=1 。如果每个 r r r 都能够提供单一的且正确匹配的预测，那么整个数据集的 A P ∣ R 11 = 1 11 ≈ 0.0909 AP|{R{11}}=\frac{1}{11}\approx0.0909 A P ∣R 11 =11 1 ≈0.0909，在论文Disentangling Monocular 3D Object Detection 中的实验结果（见论文的Table 4）中，这个精度已经超过了很多方法，显然这无法正确地评估算法的质量。

因此，该论文中提出：不对41个点进行下采样，直接利用40个点进行AP的计算，即将 R 11 R_{11}R 11 简单修改为 R 40 = { 1 40 , 2 40 , 3 40 , ⋯ , 1 } R_{40}={\frac{1}{40},\frac{2}{40},\frac{3}{40}, \cdots, 1}R 40 ={40 1 ,40 2 ,40 3 ,⋯,1 }。基本都是采用后者进行AP的计算了。

两者的代码如下：

; 参考文献

What is the resuls meaning?

Original: https://blog.csdn.net/qq_39025922/article/details/124166492
Author: 想读书行不行
Title: KITTI数据集3d目标检测的评价的含义

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/629130/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Glove模型训练自己的中文数据集词向量详细步骤

首先，下载Glove项目资源： https://github.com/stanfordnlp/GloVe 注意1：后续训练命令仅在服务器命令行界面有效，在本机命令行、anacon…

人工智能 2023年5月23日
00190
Pytorch 分布式训练 DistributedDataParallel （实操篇）

首先介绍一下分布式的基础概念： group：指进程组，默认为一组 backwend：指进程使用的通讯后端，Pytorch支持mpi、gloo、nccl、若是使用N卡推荐使用nccl…

人工智能 2023年7月23日
0091
从DETR backbone 的NestedTensor 到DataLoader, Sampler,collate_fn，再到DETR transformer

在DETR中backbone中，resnet50 的构建继承了backbonebase的类，backbonebase的前向过程如下，这里引入了NestedTensor类。 # 前向…

人工智能 2023年7月21日
00117
CartPole 强化学习详解1 – DQN

工作中常会接触到强化学习的内容，自己以gym环境中的Cartpole为例动手实现一下，记录点实现细节。环境：python = 3.6.13； pytorch = 1.10.2 目录…

人工智能 2023年7月21日
0092
论文阅读笔记-人脸关键点检测-PFLD：A Practical Facial Landmark Detector

原文链接：https://arxiv.org/abs/1902.10859v1代码：https://github.com/polarisZhao/PFLD-pytorch 论文通读…

人工智能 2023年6月22日
0093
最新MySql安装教学，非常详细

目录一、下载MySQL 1. 选择想要安装的版本，点击Download下载二、安装MySq 1. 选择设置类型 2. 选择安装的产品和功能 3.选完以后，点击右下方的&#822…

人工智能 2023年7月30日
0067
【OpenCV 例程200篇】36. 直角坐标与极坐标转换（cv2.polarToCart）

『youcans 的 OpenCV 例程200篇 – 总目录』【youcans 的 OpenCV 例程200篇】36. 直角坐标与极坐标的转换函数 cv2.cart…

人工智能 2023年5月28日
0095
pyqt使用graphicsView显示图片

文章目录 * – 源码 – + untitled.py + main.py – 缩放图形界面使用Qt Designer绘制，如下菜单项添加一…

人工智能 2023年5月26日
0096
今天分享的案例是关于某电商店铺的年终销售业绩

从情境中学习数据分析，体会数据分析逻辑。今天分享的案例是关于某电商店铺的年终销售业绩的分析哦~ 在2011年的圣诞节前两周，老板希望回顾一下过去一年的销售业绩，数据来自该店铺的实际…

人工智能 2023年7月16日
0079
视频如何转化为gif动图？一招教你学会视频转gif

平时大家在刷剧的时候如果看到一些比较搞笑、精彩的片段，这些片段其实都是可以做成表情包的，那么视频如何转化为gif动图呢？今天来给大家推荐一款GIF编辑工具，支持在线视频转gif，使…

人工智能 2023年6月29日
00103
python 数据分析之logistic（逻辑）回归

链接: link. 本节理论部分参考链接 python 数据分析之logistic（逻辑）回归 1 环境准备 2 读取数据集 3 sigmoid函数和误差函数设计 4 梯度下降方法…

人工智能 2023年6月16日
00104
图像校正-仿射图像的畸变校正

仿射变换仿射变换的变换矩阵为：可以简写为：对偶于圆点（circular point）的圆锥曲线为：如果直线 l 和 m 在原平面上垂直，那么有：对于仿射变换的平面，可以推导出如…

人工智能 2023年6月18日
0086
深度学习笔记—-三维卷积及其应用（3DCNN,PointNet,3D U-Net）

目录 1.什么是三维卷积 1.1 三维卷积简介 1.2 三维卷积的工作原理 2，三维卷积核多通道卷积的区别 2.1 多通道卷积 2.2 三维卷积和多通道卷积之间的区别 2.3 总结…

人工智能 2023年6月16日
00117
AI学习——线性回归和梯度下降

在AI的学习过程中主要有理论课的知识讲解和实验课的实验过程，这里主要就分享我写的实验报告吧 1.实验问题：对线性回归和梯度下降算法的应用。线性回归：是一种常用的机器学习模型，主要…

人工智能 2023年6月17日
00161
Pytorch模型训练&保存/加载（搭建完整流程）

文章目录前言模型训练完整步骤模型保存与加载 GPU训练 “借鸡生蛋” 模型使用本博文优先在掘金社区发布！前言我们这边还是以CIARF10这个模型…

人工智能 2023年6月15日
0097
Windows10系统下swin-transformer目标检测环境搭建

Swin-Transformer-Object-Detection环境搭建前言 * 1.环境准备 2.虚拟环境创建 3.安装pytorch 4.安装mmcv 5.安装mmdet …

人工智能 2023年7月23日
00106

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

KITTI数据集3d目标检测的评价的含义

kitti数据集评价的含义

大家都在看