场景流数据集-KITTI和flyingthing3D

Kitti-scene flow:真实数据,200张训练场景,200张测试场景(各4张图)。具体的数据格式较为熟悉不赘述,可见readme.txt。

flyingthings3D——合成数据集:每个场景提供第6th至第15th个立体图像对。0006.png->0015.png

数据格式:1.所有相机数据为立体图像,相机内参为:virtual focal length--35.00mm,内参矩阵如下--

where (fx,fy) are focal lengths and (cx,cy) denotes the principal point.

相机外参存储为4X4矩阵T,见txt文件,按行存储。

Camera-to-world 4x4 matrix for the left view of the stereo pair in row-major order, i.e. (T00 T01 T02 T03) encodes the uppermost row from left to right.

利用矩阵T,可以将相机坐标系下的列向量p_cam转化为世界坐标系下的空间位置p_world = T*p_cam

2.图像原点位于左上顶点,即flow=(x,y)=(10,10)指向右下方。

3.disparity-单通道的pfm,左右视角下的视差值均存储为正数。disparity_change为单通道的pfm,optical flow为三通道的pfm,第0和1通道分别存储水平和垂直方向的光流分量,第2层均为0.

4.和时间有关的变化量,如光流,视差变化和运动边界,数据集提供前向和反向两种结果。

5.分为train和test两部分,train的数量是test的5倍。这两部分仅在用于渲染的资源中有所不同:纹理和三维模型类别完全不相交。每个部分又分为A B C三个子集,三个子集使用相同的rendering asset pools,但是物体和相机运动路径的参数不同。因此,三个子集的运动特性不同。

(对于光流的0015.pfm,没有提供对应的0016.png;对于0006.pfm,没有提供对应的0005.png,因此,若用于监督训练,可忽略这两个gt文件。)

你可能感兴趣的:(图像方向)