评估区域:
- dics(Depth Discontinuity Region):视差不连续区域
- all(All Region):全部区域
- non-occ(Non-Occlusion Region):非遮挡区域
评估指标:
- bad δ D \delta_{D}δD :1 N ∑ ( x , y ) ∈ N { ∣ d e s t ( x , y ) − d g t ( x , y ) ∣ > δ D } \frac{1}{N} \sum_{(x, y)\in N}{|d_{est}(x, y)-d_{gt}(x, y)|>\delta_{D}}N 1 ∑(x ,y )∈N {∣d e s t (x ,y )−d g t (x ,y )∣>δD } :估计值与真实值相差大于δ D \delta_{D}δD 的像素的比例,δ D \delta_{D}δD 可以取0.5、1.0、2.0、4.0
- avgerr:1 N ∑ ( x , y ) ∈ N ∣ d e s t ( x , y ) − d g t ( x , y ) ∣ \frac{1}{N}\sum_{(x,y)\in N}|d_{est}(x,y)-d_{gt}(x,y)|N 1 ∑(x ,y )∈N ∣d e s t (x ,y )−d g t (x ,y )∣ :平均绝对误差
- rms:1 N ∑ ( x , y ) ∈ N ∣ d e s t ( x , y ) − d g t ( x , y ) ∣ 2 \sqrt{\frac{1}{N} \sum_{(x, y)\in N}\left|d_{est}(x, y)-d_{gt}(x, y)\right|^{2}}N 1 ∑(x ,y )∈N ∣d e s t (x ,y )−d g t (x ,y )∣2 :均方误差
KITTI 2012 是真实驾驶场景的数据集,其包含194个训练图像对和195个测试图像对,图像分辨率为1226×370。该数据集提供了使用激光雷达获得的稀疏真实视差值。
评估区域:
- all(All Region):全部区域
- non-occ(Non-Occlusion Region):非遮挡区域
评估指标:
若视差∣ d e s t − d g t ∣ < δ D |d_{est}-d_{gt}|,则视为正确估计,阈值δ D \delta_{D}δD 可为2,3,4,5像素
- Out-Noc:δ D \delta_{D}δD :1 N n o c ∑ ( x , y ) ∈ N n o c { ∣ d e s t ( x , y ) − d g t ( x , y ) ∣ > δ D } \frac{1}{N_{noc}} \sum_{(x, y)\in N_{noc}}{|d_{est}(x, y)-d_{gt}(x, y)|>\delta_{D}}N n o c 1 ∑(x ,y )∈N n o c {∣d e s t (x ,y )−d g t (x ,y )∣>δD } :非遮挡区域错误预测像素的比例
- Out-All:δ D \delta_{D}δD :1 N a l l ∑ ( x , y ) ∈ N a l l { ∣ d e s t ( x , y ) − d g t ( x , y ) ∣ > δ D } \frac{1}{N_{all}} \sum_{(x, y)\in N_{all}}{|d_{est}(x, y)-d_{gt}(x, y)|>\delta_{D}}N a l l 1 ∑(x ,y )∈N a l l {∣d e s t (x ,y )−d g t (x ,y )∣>δD }:全部区域错误预测像素的比例
- Avg-Noc:1 N n o c ∑ ( x , y ) ∈ N n o c ∣ d e s t ( x , y ) − d g t ( x , y ) ∣ \frac{1}{N_{noc}}\sum_{(x,y)\in N_{noc}}|d_{est}(x,y)-d_{gt}(x,y)|N n o c 1 ∑(x ,y )∈N n o c ∣d e s t (x ,y )−d g t (x ,y )∣ :非遮挡区域的端点误差(EPE-Noc)
- Avg-All:1 N a l l ∑ ( x , y ) ∈ N a l l ∣ d e s t ( x , y ) − d g t ( x , y ) ∣ \frac{1}{N_{all}}\sum_{(x,y)\in N_{all}}|d_{est}(x,y)-d_{gt}(x,y)|N a l l 1 ∑(x ,y )∈N a l l ∣d e s t (x ,y )−d g t (x ,y )∣ :全部区域的端点误差(EPE)
KITTI 2015是真实驾驶场景的数据集。KITTI 2015包含200个训练图像对和200个测试图像对,图像分辨率为1242×375,该数据集提供了使用激光雷达获得的稀疏地面真实视差值。
评估图像:
- D1:评估第一帧图像
- D2:评估第二帧图像
评估区域:
- bg(Background Regions):背景区域
- fg(Foreground Regions):前景区域
- all(All Region):全部区域
评估指标:
若视差或流端点误差∣ d e s t − d g t ∣ < 3 |d_{est}-d_{gt}|px或∣ d e s t ( x , y ) − d g t ( x , y ) ∣ d g t < 5 % \frac{{|d_{est}(x,y)-d_{gt}(x,y)|}}{d_{gt}}则视为正确估计
- D1-bg:对于第一帧图像,背景区域(background regions)预测错误的像素的比例
- D1-fg:对于第一帧图像,前景区域(foreground regions)预测错误的像素的比例
- D1-all:对于第一帧图像,所有区域(all regions)预测错误的像素的比例
- D2-bg:对于第二帧图像,背景区域(background regions)预测错误的像素的比例
- D2-fg:对于第二帧图像,前景区域(foreground regions)预测错误的像素的比例
- D2-all:对于第二帧图像,所有区域(all regions)预测错误的像素的比例
Scene Flow是利用软件渲染生成的虚拟立体数据集,包含35454个训练图像对和4370个测试图像对,分辨率为960×540,该数据集提供稠密的视差图真实值。
若视差或流端点误差∣ d e s t − d g t ∣ < 3 |d_{est}-d_{gt}|px或∣ d e s t ( x , y ) − d g t ( x , y ) ∣ d g t < 5 % \frac{{|d_{est}(x,y)-d_{gt}(x,y)|}}{d_{gt}} 则视为正确估计
- EPE:1 N ∑ ( x , y ) ∈ N ∣ d e s t ( x , y ) − d g t ( x , y ) ∣ \frac{1}{N}\sum_{(x,y)\in N}|d_{est}(x,y)-d_{gt}(x,y)|N 1 ∑(x ,y )∈N ∣d e s t (x ,y )−d g t (x ,y )∣ :全部区域的端点误差(EPE)
-
1px:1 N a l l ∑ ( x , y ) ∈ N a l l { ∣ d e s t ( x , y ) − d g t ( x , y ) ∣ > 1 } \frac{1}{N_{all}} \sum_{(x, y)\in N_{all}}{|d_{est}(x, y)-d_{gt}(x, y)|>1}N a l l 1 ∑(x ,y )∈N a l l {∣d e s t (x ,y )−d g t (x ,y )∣>1 }:预测误差大于1px的像素的比例
-
2px:1 N a l l ∑ ( x , y ) ∈ N a l l { ∣ d e s t ( x , y ) − d g t ( x , y ) ∣ > 2 } \frac{1}{N_{all}} \sum_{(x, y)\in N_{all}}{|d_{est}(x, y)-d_{gt}(x, y)|>2}N a l l 1 ∑(x ,y )∈N a l l {∣d e s t (x ,y )−d g t (x ,y )∣>2 }:预测误差大于2px的像素的比例
-
3px:1 N a l l ∑ ( x , y ) ∈ N a l l { ∣ d e s t ( x , y ) − d g t ( x , y ) ∣ > 3 } \frac{1}{N_{all}} \sum_{(x, y)\in N_{all}}{|d_{est}(x, y)-d_{gt}(x, y)|>3}N a l l 1 ∑(x ,y )∈N a l l {∣d e s t (x ,y )−d g t (x ,y )∣>3 }:预测误差大于3px的像素的比例
- D1:对于第一帧图像,预测正确的像素的比例
ETH3D是室内和室外场景中的灰度立体数据集。其包含27个训练图像对与20个测试图像对,该数据集带有稀疏的视差真实值。视差范围在0-64之间。
评估指标:
- bad δ D \delta_{D}δD :1 N ∑ ( x , y ) ∈ N { ∣ d e s t ( x , y ) − d g t ( x , y ) ∣ > δ D } \frac{1}{N} \sum_{(x, y)\in N}{|d_{est}(x, y)-d_{gt}(x, y)|>\delta_{D}}N 1 ∑(x ,y )∈N {∣d e s t (x ,y )−d g t (x ,y )∣>δD } :估计值与真实值相差大于δ D \delta_{D}δD 的像素的比例,δ D \delta_{D}δD 可以取1.0、2.0
Original: https://blog.csdn.net/weixin_40957452/article/details/124489843
Author: CV科研随想录
Title: 立体匹配(视差估计)评价指标(MiddleBurry、KITTI 2012、KITTI 2015、Scene Flow、ETH3D)
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/628860/
转载文章受原作者版权保护。转载请注明原作者出处!