立体匹配（视差估计）评价指标（MiddleBurry、KITTI 2012、KITTI 2015、Scene Flow、ETH3D)

2023年6月17日上午5:30 • 人工智能 • 阅读 71

评估区域：

dics(Depth Discontinuity Region)：视差不连续区域
all(All Region)：全部区域
non-occ（Non-Occlusion Region）：非遮挡区域

评估指标：

bad δ D \delta_{D}δD ：1 N ∑ ( x , y ) ∈ N { ∣ d e s t ( x , y ) − d g t ( x , y ) ∣ > δ D } \frac{1}{N} \sum_{(x, y)\in N}{|d_{est}(x, y)-d_{gt}(x, y)|>\delta_{D}}N 1 ∑(x ,y )∈N {∣d e s t (x ,y )−d g t (x ,y )∣>δD } ：估计值与真实值相差大于δ D \delta_{D}δD 的像素的比例，δ D \delta_{D}δD 可以取0.5、1.0、2.0、4.0
avgerr：1 N ∑ ( x , y ) ∈ N ∣ d e s t ( x , y ) − d g t ( x , y ) ∣ \frac{1}{N}\sum_{(x,y)\in N}|d_{est}(x,y)-d_{gt}(x,y)|N 1 ∑(x ,y )∈N ∣d e s t (x ,y )−d g t (x ,y )∣ ：平均绝对误差
rms：1 N ∑ ( x , y ) ∈ N ∣ d e s t ( x , y ) − d g t ( x , y ) ∣ 2 \sqrt{\frac{1}{N} \sum_{(x, y)\in N}\left|d_{est}(x, y)-d_{gt}(x, y)\right|^{2}}N 1 ∑(x ,y )∈N ∣d e s t (x ,y )−d g t (x ,y )∣2 ：均方误差

KITTI 2012 是真实驾驶场景的数据集，其包含194个训练图像对和195个测试图像对，图像分辨率为1226×370。该数据集提供了使用激光雷达获得的稀疏真实视差值。

评估区域：

all(All Region)：全部区域
non-occ（Non-Occlusion Region）：非遮挡区域

评估指标：

若视差∣ d e s t − d g t ∣ < δ D |d_{est}-d_{gt}|，则视为正确估计，阈值δ D \delta_{D}δD 可为2，3，4，5像素

Out-Noc:δ D \delta_{D}δD ：1 N n o c ∑ ( x , y ) ∈ N n o c { ∣ d e s t ( x , y ) − d g t ( x , y ) ∣ > δ D } \frac{1}{N_{noc}} \sum_{(x, y)\in N_{noc}}{|d_{est}(x, y)-d_{gt}(x, y)|>\delta_{D}}N n o c 1 ∑(x ,y )∈N n o c {∣d e s t (x ,y )−d g t (x ,y )∣>δD } ：非遮挡区域错误预测像素的比例
Out-All:δ D \delta_{D}δD ：1 N a l l ∑ ( x , y ) ∈ N a l l { ∣ d e s t ( x , y ) − d g t ( x , y ) ∣ > δ D } \frac{1}{N_{all}} \sum_{(x, y)\in N_{all}}{|d_{est}(x, y)-d_{gt}(x, y)|>\delta_{D}}N a l l 1 ∑(x ,y )∈N a l l {∣d e s t (x ,y )−d g t (x ,y )∣>δD }：全部区域错误预测像素的比例
Avg-Noc:1 N n o c ∑ ( x , y ) ∈ N n o c ∣ d e s t ( x , y ) − d g t ( x , y ) ∣ \frac{1}{N_{noc}}\sum_{(x,y)\in N_{noc}}|d_{est}(x,y)-d_{gt}(x,y)|N n o c 1 ∑(x ,y )∈N n o c ∣d e s t (x ,y )−d g t (x ,y )∣ ：非遮挡区域的端点误差（EPE-Noc）
Avg-All:1 N a l l ∑ ( x , y ) ∈ N a l l ∣ d e s t ( x , y ) − d g t ( x , y ) ∣ \frac{1}{N_{all}}\sum_{(x,y)\in N_{all}}|d_{est}(x,y)-d_{gt}(x,y)|N a l l 1 ∑(x ,y )∈N a l l ∣d e s t (x ,y )−d g t (x ,y )∣ ：全部区域的端点误差（EPE）

KITTI 2015是真实驾驶场景的数据集。KITTI 2015包含200个训练图像对和200个测试图像对，图像分辨率为1242×375，该数据集提供了使用激光雷达获得的稀疏地面真实视差值。

评估图像：

D1：评估第一帧图像
D2：评估第二帧图像

评估区域：

bg(Background Regions)：背景区域
fg(Foreground Regions)：前景区域
all(All Region)：全部区域

评估指标：

若视差或流端点误差∣ d e s t − d g t ∣ < 3 |d_{est}-d_{gt}|px或∣ d e s t ( x , y ) − d g t ( x , y ) ∣ d g t < 5 % \frac{{|d_{est}(x,y)-d_{gt}(x,y)|}}{d_{gt}}则视为正确估计

D1-bg：对于第一帧图像，背景区域（background regions）预测错误的像素的比例
D1-fg：对于第一帧图像，前景区域（foreground regions）预测错误的像素的比例
D1-all：对于第一帧图像，所有区域（all regions）预测错误的像素的比例
D2-bg：对于第二帧图像，背景区域（background regions）预测错误的像素的比例
D2-fg：对于第二帧图像，前景区域（foreground regions）预测错误的像素的比例
D2-all：对于第二帧图像，所有区域（all regions）预测错误的像素的比例

Scene Flow是利用软件渲染生成的虚拟立体数据集，包含35454个训练图像对和4370个测试图像对，分辨率为960×540，该数据集提供稠密的视差图真实值。

EPE：1 N ∑ ( x , y ) ∈ N ∣ d e s t ( x , y ) − d g t ( x , y ) ∣ \frac{1}{N}\sum_{(x,y)\in N}|d_{est}(x,y)-d_{gt}(x,y)|N 1 ∑(x ,y )∈N ∣d e s t (x ,y )−d g t (x ,y )∣ ：全部区域的端点误差（EPE）
1px：1 N a l l ∑ ( x , y ) ∈ N a l l { ∣ d e s t ( x , y ) − d g t ( x , y ) ∣ > 1 } \frac{1}{N_{all}} \sum_{(x, y)\in N_{all}}{|d_{est}(x, y)-d_{gt}(x, y)|>1}N a l l 1 ∑(x ,y )∈N a l l {∣d e s t (x ,y )−d g t (x ,y )∣>1 }：预测误差大于1px的像素的比例
2px：1 N a l l ∑ ( x , y ) ∈ N a l l { ∣ d e s t ( x , y ) − d g t ( x , y ) ∣ > 2 } \frac{1}{N_{all}} \sum_{(x, y)\in N_{all}}{|d_{est}(x, y)-d_{gt}(x, y)|>2}N a l l 1 ∑(x ,y )∈N a l l {∣d e s t (x ,y )−d g t (x ,y )∣>2 }：预测误差大于2px的像素的比例
3px：1 N a l l ∑ ( x , y ) ∈ N a l l { ∣ d e s t ( x , y ) − d g t ( x , y ) ∣ > 3 } \frac{1}{N_{all}} \sum_{(x, y)\in N_{all}}{|d_{est}(x, y)-d_{gt}(x, y)|>3}N a l l 1 ∑(x ,y )∈N a l l {∣d e s t (x ,y )−d g t (x ,y )∣>3 }：预测误差大于3px的像素的比例
D1：对于第一帧图像，预测正确的像素的比例

ETH3D是室内和室外场景中的灰度立体数据集。其包含27个训练图像对与20个测试图像对，该数据集带有稀疏的视差真实值。视差范围在0-64之间。
评估指标：

bad δ D \delta_{D}δD ：1 N ∑ ( x , y ) ∈ N { ∣ d e s t ( x , y ) − d g t ( x , y ) ∣ > δ D } \frac{1}{N} \sum_{(x, y)\in N}{|d_{est}(x, y)-d_{gt}(x, y)|>\delta_{D}}N 1 ∑(x ,y )∈N {∣d e s t (x ,y )−d g t (x ,y )∣>δD } ：估计值与真实值相差大于δ D \delta_{D}δD 的像素的比例，δ D \delta_{D}δD 可以取1.0、2.0

Original: https://blog.csdn.net/weixin_40957452/article/details/124489843
Author: CV科研随想录
Title: 立体匹配（视差估计）评价指标（MiddleBurry、KITTI 2012、KITTI 2015、Scene Flow、ETH3D)

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/628860/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

《计算机组成原理/CSAPP》网课总结（一）

现在是2022年4月17日晚10点，本月计划的网课《csapp讲解》视频课看到了第八章”异常”第三讲,视频讲的很好但更新很慢，暂时没有最新的讲解，所以先做一…

人工智能 2023年6月4日
0083
[DeepLearning] Softmax的原理及其实现Pytorch

[DeepLearning] Softmax的原理及其实现Pytorch 文章目录 [DeepLearning] Softmax的原理及其实现Pytorch * 1.softmax…

人工智能 2023年7月22日
0053
《动手学深度学习》第三章——（4）softmax回归的简洁实现_学习思考与习题答案

文章目录 * – 重新审视Softmax的实现 – 优化算法 – 训练 – 练习作者github 源码地址 # softmax回归…

人工智能 2023年6月17日
0068
snap软件中哨兵2A数据预处理及六种常用植被指数的计算

目录 1.使用snap软件对哨兵二号数据进行预处理。 2.使用envi处理哨兵二号数据，进行波段组合。 3.学习不同植被指数的计算公式，进行六种植被指数（归一化植被指数ndvi、增…

人工智能 2023年6月17日
00398
红外图像和热成像图像

一、简单介绍红外摄像头和红外热成像是两个完全不一样的东西。两种相机的核心区别主要在于传感器捕捉的光波长不同。普通相机加装滤光片可得到红外图像，原因在于普通相机的光学传感器本身覆…

人工智能 2023年6月17日
0061
TensorFlow2安装教程

1.安装Anaconda3 清华镜像源： Index of /anaconda/archive/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirr…

人工智能 2023年6月24日
0075
NeRF：神经辐射场论文原理讲解

一、新视角合成 NeRF是开创了一种全新的视角合成方法。新视角合成任务指的是给定源图像（Source Image）及对应的源姿态(Source Pose)以及目标姿态(Target…

人工智能 2023年7月21日
0063
关联规则挖掘（Apriori算法和FP-Growth算法）

一、关联规则概述1.关联规则分析用于在一个数据集中找出各种数据项之间的关联关系，广泛用于购物篮数据、个性化推荐、预警、时尚穿搭、生物信息学、医疗诊断、网页挖掘和科学数据分析中2.关…

人工智能 2023年6月16日
0084
NTU_RGB+D数据集介绍及骨架数据可视化

目录 1–NTU_RGB+D数据集 1-1–NTU_RGB+D数据集下载 1-2–NTU_RGB+D数据集介绍 2–骨架数据可视化代…

人工智能 2023年6月17日
00121
pygame.error: Unable to open file ‘audio/gege.wav‘ 报错

pygame.mixer.Sound() 加载音频 pygame.error: Unable to open file ‘audio/gege.wav’报错报错的根本原因是音频的…

人工智能 2023年5月27日
0089
pandas简明教程

之前我们学了Numpy,他可以提供各种高效的操作，但是面对一些灵活的任务，numpy仍然有限制。所以在其基础上我们又发展了pandas。尤其是他的dataframe,series为…

人工智能 2023年7月8日
0064
Opencv图像基本操作——读取、显示、截取图像、属性、颜色通道、边界填充、图像融合

引言我们都会有一个疑惑：计算机眼中的图像长什么样子呢？首先拿来一张图片分割成无数个小格，每一个小格叫做像素点，计算机中的图像是由像素点构成的像素矩阵，像素点构成它的每一个值都是…

人工智能 2023年7月20日
0087
基于聚类的图像分割-Python

点击上方” 小白学视觉“，选择加” 星标“或” 置顶“ 重磅干货，第一时间送达了解图像分割当我们在做一个…

人工智能 2023年5月31日
0088
DOTA数据集应用于Yolo-v4(-Tiny)系列2——使用Pytorch框架的Yolov4(-Tiny)训练与推测

文章目录前言一、Pytorch框架源码二、调整数据集存放位置 * 2.1 调整./dota_data 2.2 补充说明三、使用Yolov4训练与推断 * 3.1 调整yol…

人工智能 2023年7月22日
0062
从DETR backbone 的NestedTensor 到DataLoader, Sampler,collate_fn，再到DETR transformer

在DETR中backbone中，resnet50 的构建继承了backbonebase的类，backbonebase的前向过程如下，这里引入了NestedTensor类。 # 前向…

人工智能 2023年6月17日
00103
[笔记]机器学习之机器学习理论及案例分析《二》聚类

#21天学习挑战赛—机器学习# 活动地址：CSDN21天学习挑战赛文章目录前言聚类 * 聚类定义什么是簇聚类分类离群点聚类算法实例 * K-Means算法(k-均值算…

人工智能 2023年6月3日
00101

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

立体匹配（视差估计）评价指标（MiddleBurry、KITTI 2012、KITTI 2015、Scene Flow、ETH3D)

大家都在看