MiddleBury与SceneFlow 数据集相机参数与pfm文件解析

2023年5月28日下午8:59 • 人工智能 • 阅读 61

MiddleBury相机参数（calib.txt）

cam0=[1758.23 0 953.34; 0 1758.23 552.29; 0 0 1]
cam1=[1758.23 0 953.34; 0 1758.23 552.29; 0 0 1]
doffs=0
baseline=111.53
width=1920
height=1080
ndisp=290
isint=0
vmin=75
vmax=262

cam0,1: 相机内参：[f 0 cx; 0 f cy; 0 0 1]
f: 焦距
cx, cy: 主点坐标
doffs: 主点在各自图像坐标系的x坐标差：doffs = cx1 – cx0 (here always == 0)
baseline: 基线长度（单位：mm）
width, height:图像尺寸
ndisp: 视差范围d ∈ [ 0 ， 1 ， . . . ， n d i s p − 1 ] d \in[ 0，1， … ，ndisp-1]d ∈[0 ，1 ，…，n d i s p −1 ]
vmin, vmax: 在视差边界，用于颜色可视化（立体视觉算法永不上这个值）;

SceneFlow相机参数

相机内参：

大多数的场景模拟焦距为35mm的相机成像，这些视图下的相机内参为：
[ f x 0.0 c x 0.0 f y c y 0.0 0.0 1.0 ] = [ 1050.0 0.0 479.5 0.0 1050.0 269.5 0.0 0.0 1.0 ] \begin{bmatrix} f_x & 0.0 & c_x\ 0.0 & f_y & c_y\ 0.0 & 0.0 &1.0 \end{bmatrix}=\begin{bmatrix} 1050.0 & 0.0 & 479.5\ 0.0 & 1050.0 & 269.5\ 0.0 & 0.0 &1.0 \end{bmatrix}⎣⎡f x 0 .0 0 .0 0 .0 f y 0 .0 c x c y 1 .0 ⎦⎤=⎣⎡1 0 5 0 .0 0 .0 0 .0 0 .0 1 0 5 0 .0 0 .0 4 7 9 .5 2 6 9 .5 1 .0 ⎦⎤

某些场景下模拟焦距为15.0mm的相机城乡，这些场景下的相机内参为：
[ f x 0.0 c x 0.0 f y c y 0.0 0.0 1.0 ] = [ 450.0 0.0 479.5 0.0 450.0 269.5 0.0 0.0 1.0 ] \begin{bmatrix} f_x & 0.0 & c_x\ 0.0 & f_y & c_y\ 0.0 & 0.0 &1.0 \end{bmatrix}=\begin{bmatrix} 450.0 & 0.0 & 479.5\ 0.0 & 450.0 & 269.5\ 0.0 & 0.0 &1.0 \end{bmatrix}⎣⎡f x 0 .0 0 .0 0 .0 f y 0 .0 c x c y 1 .0 ⎦⎤=⎣⎡4 5 0 .0 0 .0 0 .0 0 .0 4 5 0 .0 0 .0 4 7 9 .5 2 6 9 .5 1 .0 ⎦⎤

相机外参(camera_data.txt)：

Frame 1\n
L 0.000180073388037 -4.3711384734e-08 -0.999999880791 47.8838249108 -0.999999880791 -6.77291538409e-08 -0.000180141098099 39.5000647903 -2.96019105055e-15 1.0 -1.11432655103e-07 1.0 0.0 0.0 0.0 1.0\n
R 0.000180073388037 -4.3711384734e-08 -0.999999880791 47.8840049842 -0.999999880791 -6.77291538409e-08 -0.000180141098099 38.5000649095 -2.96019105055e-15 1.0 -1.11432655103e-07 1.0 0.0 0.0 0.0 1.0\n
\n
Frame 2\n
…

4*4的矩阵，按行展开

MiddleBury(SceneFlow)视差图pfm文件

pfm文件由两部分组成：

PFM header（文件头区域）

PF
1080 1920
-0.003922
元数据

Identifier Line：”Pf” ：单通道灰度图像，”PF” ：3通道RGB图像
Dimensions Line：图像尺寸
Scale Factor / Endianness： scale

数据集文件读取

from pathlib import Path
import numpy as np
import csv
import re
import cv2

def read_calib(calib_file_path):
    with open(calib_file_path, 'r') as calib_file:
        calib = {}
        csv_reader = csv.reader(calib_file, delimiter='=')
        for attr, value in csv_reader:
            calib.setdefault(attr, value)
    return calib

def read_pfm(pfm_file_path):
    with open(pfm_file_path, 'rb') as pfm_file:
        header = pfm_file.readline().decode().rstrip()
        channels = 3 if header == 'PF' else 1
        dim_match = re.match(r'^(\d+)\s(\d+)\s$', pfm_file.readline().decode('utf-8'))
        if dim_match:
            width, height = map(int, dim_match.groups())
        else:
            raise Exception("Malformed PFM header.")

        scale = float(pfm_file.readline().decode().rstrip())
        if scale < 0:
            endian = '
            scale = -scale
        else:
            endian = '>'

        dispariy = np.fromfile(pfm_file, endian + 'f')

    img = np.reshape(dispariy, newshape=(height, width, channels))
    img = np.flipud(img).astype('uint8')
    show(img, "disparity")
    return dispariy, [(height, width, channels), scale]

def create_depth_map(pfm_file_path, calib=None):
    dispariy, [shape, scale] = read_pfm(pfm_file_path)

    if calib is None:
        raise Exception("Loss calibration information.")
    else:
        fx = float(calib['cam0'].split(' ')[0].lstrip('['))
        base_line = float(calib['baseline'])
        doffs = float(calib['doffs'])

        depth_map = fx * base_line / (dispariy / scale + doffs)
        depth_map = np.reshape(depth_map, newshape=shape)
        depth_map = np.flipud(depth_map).astype('uint8')
        return depth_map

def show(img, win_name='image'):
    if img is None:
        raise Exception("Can't display an empty image.")
    else:
        cv2.namedWindow(win_name, cv2.WINDOW_NORMAL)
        cv2.imshow(win_name, img)
        cv2.waitKey()
        cv2.destroyWindow(win_name)

def main():
    pfm_file_dir = Path(r'./middlebury2021/data/ladder1')
    calib_file_path = pfm_file_dir.joinpath('calib.txt')
    disp_left = pfm_file_dir.joinpath('disp0.pfm')

    calib = read_calib(calib_file_path)

    depth_map_left = create_depth_map(disp_left, calib)
    show(depth_map_left, "depth_map")

if __name__ == '__main__':
    main()

Original: https://blog.csdn.net/weixin_40957452/article/details/124376988
Author: CV科研随想录
Title: MiddleBury与SceneFlow 数据集相机参数与pfm文件解析

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/533557/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

CNN卷积神经网络简单示例(PyTorch)

CNN卷积神经网络示例PyTorch 导入Python库和相关模块转换为图像格式将数据格式numpy转换为tensor，并打包成batch 构建CNN网络定义损失函数训练网…

人工智能 2023年7月22日
00115
Swin Transformer Object Detection 目标检测、问题汇总

文章目录 * – + 一、环境问题 + * – 1. unsupported Microsoft Visual Stadio version –…

人工智能 2023年6月24日
0071
知识图谱论文阅读（八）【转】推荐系统遇上深度学习(二十六)–知识图谱与推荐系统结合之DKN模型原理及实现

学习的博客：推荐系统遇上深度学习(二十六)–知识图谱与推荐系统结合之DKN模型原理及实现知识图谱特征学习的模型分类汇总知识图谱嵌入(KGE)：方法和应用的综述论文： Know…

人工智能 2023年6月10日
00107
OpenCV OCR实战文档扫描与文字检测

本文讲述使用OpenCV- python以及easyocr库实现文档扫描与文字检测的思路和具体实现过程。目录知识准备项目概述实现过程代码讲解 1.读入图片并进行预处理（灰…

人工智能 2023年6月19日
0075
【机器学习】李宏毅——自监督式学习

1、BERT简介首先需要介绍什么是自监督学习。我们知道监督学习是有明确的样本和对应的标签，将样本丢进去模型训练并且将训练结果将标签进行比较来修正模型，如下图：而自监督学习就是 …

人工智能 2023年6月16日
0079
Python爬虫入门教程！手把手教会你爬取网页数据

其实在当今社会，网络上充斥着大量有用的数据，我们只需要耐心的观察，再加上一些技术手段，就可以获取到大量的有价值数据。这里的”技术手段”就是网络爬虫。今天就给…

人工智能 2023年7月5日
0071
基于粒子群优化算法的最优潮流（IEEE30节点（Matlab代码实现）

💥💥💞💞 欢迎来到本博客❤️❤️💥💥 🏆博主优势： 🌞🌞🌞博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。 ⛳️ 座右铭：行百里者，半于九十。目录💥1 概述📚2 运行结果🎉3 参…

人工智能 2023年6月29日
00105
pandas算加权平均值_pandas和groupby：如何计算agg中的加权平均值

有可能，但真的很复杂： np.random.seed(234) df= pd.DataFrame(np.random.randint(5,8,(1000,4)), columns=…

人工智能 2023年7月8日
0097
SpringBoot使用配置中心Apollo启动很慢两分钟解决

背景 SpringBoot引用Apollo（阿波罗）分布式配置管理中心后，Docker中服务启动速度变慢，刚开始启动只需要20s，加入配置后启动需要两分钟。每次部署服务都需要多浪费…

人工智能 2023年6月26日
0086
使用python操作文件和文件夹

文件操作的作用：把一些内容（数据)存储起来，可以让程序下一次执行的时候直接使用，而不必重新制作一份，省时省力。文件操作步骤： 1.打开文件 2.读写操作 3.关闭文件（释放内…

人工智能 2023年6月30日
00138
SAS多元线性回归分析与残差分析(画残差图，残差的正太概率图含变量交叉项，写残差向量，计算回归系数的置信区间，检验自变量系数是否相等，利用R²，MSE，CP,PRESS准则和逐步回归法选择最优方程)

例题：某科学基金会的管理人员希望估计从事数学研究工作的中等或较高水平的数学家的年工资额Y与他们的研究成果（论文、著作等）的质量指标X1，从事研究工作的时间X2以及能成功获得资助的…

人工智能 2023年6月16日
00109
NLP-预训练模型-2020：BigBird【使用了稀疏注意力机制（随机、滑动窗口、全局），将复杂度从O(n2·d)降到线性O(n)】【能够处理序列的长度比BERT多8倍；512–＞4096】

; 一、前言 Transformer 是目前 NLP 研究领域中特别重要的模型，也衍生出了很多基于 Transformer 的方法，例如 BERT、GPT，在很多 NLP 任务中有…

人工智能 2023年5月30日
0071
基于 docker 搭建 grafana+prometheus 监控资源之mysql+docker+alertmanager配置（二）（超详细版）

先去看第一篇（基础部署篇），看完后，才能接上本篇。基于 docker 搭建 grafana+prometheus 监控资源之mysql+docker+alertmanager配…

人工智能 2023年7月30日
0082
Matlab中image函数用法

目录语法说明示例显示矩阵数据的图像控制图像位置显示三维真彩色数组的图像创建后修改图像读取并显示 JPEG 图像文件向三维视图中的坐标区添加图像图像的高级与低级版…

人工智能 2023年6月20日
00253
机器学习之回归问题

目录前言一、回归定义二、回归建模步骤 1.模型假设-线性模型（Linear Model）（1）一元线性模型（2）多元线性模型 2.模型评估-损失函数（Loss Funti…

人工智能 2023年6月16日
0079
Python绘制时序图，ACF和PACF图

在时序分析众多模型中，最为基础也是最为重要的有AR§模型，MA(q)模型，以及两者的结合ARMA(p,q)模型，同时考虑ARMA模型的平稳性，若有一个或多个根落于单位圆上，则此时的…

人工智能 2023年6月24日
0067

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

MiddleBury与SceneFlow 数据集相机参数与pfm文件解析

相机内参：

相机外参(camera_data.txt)：

PFM header（文件头区域）

大家都在看