针孔照相机模型 (有时称为射影照相机模型)是计算机视觉中广泛使用的照相机模型。对于大多数应用来说,针孔照相机模型简单,并且具有足够多精确度。这个名字来源于一种类似暗箱机的照相机。该照相机从一个小孔采集射到暗箱内部的光线。针孔相机模型就是把相机简化成小孔成像,在这种模型下,物体的空间坐标和图像坐标之间是线性的关系,因此对相机参数的求解就归结到求解线性方程组上。而相机标定就是确定相机的内部参数和外部参数。
摄像机标定简单来说是从世界坐标系转换为相机坐标系,再由相机坐标系转换为图像坐标系的过程,也就是求最终的投影矩阵 P P P的过程。如图:
相机坐标系 | 图像坐标系 |
---|
对上图的解读:
C C C 点表示camera center
,即相机的中心点,也是相机坐标系的中心点;
Z Z Z轴表示principal axis
,即相机的主轴;
p p p点所在的平面表示image plane
,即相机的像平面,也就是图片坐标系所在的二维平面;
p p p点表示principal point
,即主点,主轴与像平面相交的点
C C C点到 p p p点的距离,也就是右边图中的 f f f表示focal length
,即相机的焦距;
像平面上的 x x x 和 y y y坐标轴与相机坐标系上的 X X X和 Y Y Y坐标轴互相平行;
相机坐标系是以 X X X、 Y Y Y 、 Z Z Z三个轴组成的且原点在 C C C点,度量值为米(m);
像平面坐标系是以 x x x、 y y y两个轴组成且原点在 p p p点,度量值为米(m);
图像坐标系一般指图片相对坐标系,在这里可以认为和像平面坐标系在一个平面上,不过原点是在图片的角上,而且度量值为像素的个数(pixel)。
将三维世界中的点转化为像平面坐标系中的点,就需要进行相机坐标系到像平面坐标系的转换,我们可以得到转换公式:
可表示为矩阵计算:
或者:
最后,我们便可以得到相机内参(Intrinsic parameters
) K K K:
摄像机校准一般采用小孔成像模型,理想的小孔模型是线性模型,但是由于存在镜头畸变等原因,线性模型通常要加上一些内部参数,变成非线性模型。
相机的成像过程实质上是坐标系的转换。首先空间中的点由 “世界坐标系” 转换到 “像机坐标系”,然后再将其投影到成像平面 ( 图像物理坐标系 ) ,最后再将成像平面上的数据转换到 图像像素坐标系。但是由于透镜制造精度以及组装工艺的偏差会引入畸变,导致原始图像的失真。镜头的畸变分为径向畸变和切向畸变两类:
图像径向畸变
:沿着透镜半径方向分布的畸变,产生原因是光线在原理透镜中心的地方比靠近中心的地方更加弯曲,这种畸变在普通廉价的镜头中表现更加明显,径向畸变主要包括桶形畸变和枕形畸变两种。
原图 | 桶形 | 枕形 |
---|
图像切向畸变
:由于透镜本身与相机传感器平面(成像平面)或图像平面不平行而产生的,这种情况多是由于透镜被粘贴到镜头模组上的安装偏差导致。
径向畸变矫正公式:
切向畸变矫正公式:
解读:
1. x d i s x_{dis} xdis和 y d i s y_{dis} ydis表示有畸变的坐标;
2. x c o r r x_{corr} xcorr和 y c o r r y_{corr} ycorr表示修复后的坐标;
3. k 1 k_1 k1、 k 2 k_2 k2、 k 3 k_3 k3表示径向畸变参数;
4. p 1 p_1 p1、 p 2 p_2 p2表示切向畸变参数;
由以上可得五个畸变参数:
一般情况下,世界坐标系和相机坐标系不重合,这时,世界坐标系中的某一点 P P P要投影到像面上时,先要将该点的坐标转换到相机坐标系下。刚体从世界坐标系转换到相机坐标系的过程,可以通过旋转和平移来得到。因此相机的外部参数就包括了旋转、平移矩阵。
解读:
[ R ∣ t ] [R|t] [R∣t]代表外参矩阵:
R R R表示相机的旋转矩阵;
t t t表示相机的位移矩阵;
相机在世界中的旋转包括三个方向,分别对应着 X X X、 Y Y Y、 Z Z Z三个方向:
yaw |
pitch |
roll |
---|
重中之重——两类参数
1.相机内部参数/内方位元素: 焦距、像主点坐标、畸变参数;
2.相机外部参数/外方位元素: 旋转、平移。
通过空间中已知坐标的(特征)点 ( X i X_i Xi, Y i Y_i Yi, Z i Z_i Zi) ,以及它们在图像中的对应坐标 ( u i u_i ui, v i v_i vi),直接估算 11 个待求解的内部和外部参数:
优缺点分析:
优点:
1.所有的相机参数集中在一个矩阵中,便于求解;
2.通过矩阵可以直接描述世界坐标中的三维点,到二维图像平面中点的映射关系。
缺点:
1.无法得知具体的内参数和外参数 ⟶ Q R QR QR分解;
2.求解出的11个未知量,比待标定参数(9-10个)更多。带来了参数不独立/相关的问题。
当我们用概率的视角去看最小二乘问题时:
特征点投影方程:
给定{( u i u_i ui, v i v_i vi)},标定参数矩阵 M M M的概率为:
给定{( u i u_i ui, v i v_i vi)},标定参数矩阵 M M M的似然函数为:
可以利用最小二乘求解 (但不一定要用线性最小二乘)。
通过世界坐标集( X i X_i Xi, Y i Y_i Yi, Z i Z_i Zi) ,以及它们在图像平面上的投影坐标集 ( u i u_i ui, v i v_i vi),计算相机投影矩阵 M M M中的11个未知参数。
相机模型:
线性方法:
非线性方法:
标定工具需要有极高的精度,包括不同平面的角度、特征点的物理距离等。因此制作标定工具十分困难。
“张正友标定”指张正友教授1998年提出的单平面棋盘格的摄像机标定方法。文中提出的方法介于传统标定法和自标定法之间,但克服了传统标定法需要的高精度标定物的缺点,而仅需使用一个打印出来的棋盘格就可以。同时也相对于自标定而言,提高了精度,便于操作。
基本操作
1.打印一张棋盘格A4纸张(黑白间距已知),并贴在一个平板上;
2.针对棋盘格拍摄若干张图片(一般10-20张);
3.在图片中检测特征点(Harris特征);
4.利用解析解估算方法计算出5个内部参数,以及6个外部参数;
5.根据极大似然估计策略,设计优化目标并实现参数的refinement。
import cv2
import numpy as np
import glob
# 找棋盘格角点
# 阈值
criteria = (cv2.TERM_CRITERIA_EPS + cv2.TERM_CRITERIA_MAX_ITER, 30, 0.001)
# 棋盘格模板规格
# w = 6 # 内角点个数,内角点是和其他格子连着的点
# h = 4
w = 28
h = 20
# 世界坐标系中的棋盘格点,例如(0,0,0), (1,0,0), (2,0,0) ....,(8,5,0),去掉Z坐标,记为二维矩阵
objp = np.zeros((w * h, 3), np.float32)
objp[:, :2] = np.mgrid[0:w, 0:h].T.reshape(-1, 2)
# 储存棋盘格角点的世界坐标和图像坐标对
objpoints = [] # 在世界坐标系中的三维点
imgpoints = [] # 在图像平面的二维点
images = glob.glob('picture/*.jpg')
for fname in images:
img = cv2.imread(fname)
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 找到棋盘格角点
# 棋盘图像(8位灰度或彩色图像) 棋盘尺寸 存放角点的位置
ret, corners = cv2.findChessboardCorners(gray, (w, h), None)
# 如果找到足够点对,将其存储起来
if ret == True:
# 角点精确检测
# 输入图像 角点初始坐标 搜索窗口为2*winsize+1 死区 求角点的迭代终止条件
cv2.cornerSubPix(gray, corners, (11, 11), (-1, -1), criteria)
objpoints.append(objp)
imgpoints.append(corners)
# 将角点在图像上显示
cv2.drawChessboardCorners(img, (w, h), corners, ret)
cv2.imshow('findCorners', img)
cv2.waitKey(1000)
cv2.destroyAllWindows()
# 标定、去畸变
# 输入:世界坐标系里的位置 像素坐标 图像的像素尺寸大小 3*3矩阵,相机内参数矩阵 畸变矩阵
# 输出:标定结果 相机的内参数矩阵 畸变系数 旋转矩阵 平移向量
ret, mtx, dist, rvecs, tvecs = cv2.calibrateCamera(objpoints, imgpoints, gray.shape[::-1], None, None)
# mtx:内参数矩阵
# dist:畸变系数
# rvecs:旋转向量 (外参数)
# tvecs :平移向量 (外参数)
print(("ret:"), ret)
print(("mtx:\n"), mtx) # 内参数矩阵
print(("dist:\n"), dist) # 畸变系数 distortion cofficients = (k_1,k_2,p_1,p_2,k_3)
print(("rvecs:\n"), rvecs) # 旋转向量 # 外参数
print(("tvecs:\n"), tvecs) # 平移向量 # 外参数
# 去畸变
img2 = cv2.imread('picture/5_d.jpg')
h, w = img2.shape[:2]
# 我们已经得到了相机内参和畸变系数,在将图像去畸变之前,
# 我们还可以使用cv.getOptimalNewCameraMatrix()优化内参数和畸变系数,
# 通过设定自由自由比例因子alpha。当alpha设为0的时候,
# 将会返回一个剪裁过的将去畸变后不想要的像素去掉的内参数和畸变系数;
# 当alpha设为1的时候,将会返回一个包含额外黑色像素点的内参数和畸变系数,并返回一个ROI用于将其剪裁掉
newcameramtx, roi = cv2.getOptimalNewCameraMatrix(mtx, dist, (w, h), 0, (w, h)) # 自由比例参数
dst = cv2.undistort(img2, mtx, dist, None, newcameramtx)
# 根据前面ROI区域裁剪图片
x, y, w, h = roi
dst = dst[y:y + h, x:x + w]
cv2.imwrite('calibresult.jpg', dst)
# 反投影误差
# 通过反投影误差,我们可以来评估结果的好坏。越接近0,说明结果越理想。
# 通过之前计算的内参数矩阵、畸变系数、旋转矩阵和平移向量,使用cv2.projectPoints()计算三维点到二维图像的投影,
# 然后计算反投影得到的点与图像上检测到的点的误差,最后计算一个对于所有标定图像的平均误差,这个值就是反投影误差。
total_error = 0
for i in range(len(objpoints)):
imgpoints2, _ = cv2.projectPoints(objpoints[i], rvecs[i], tvecs[i], mtx, dist)
error = cv2.norm(imgpoints[i], imgpoints2, cv2.NORM_L2) / len(imgpoints2)
total_error += error
print(("total error: "), total_error / len(objpoints))
矫正前 | 矫正后 |
---|
从畸变矫正前后的图片对比情况,发现有比较大的区别,说明相机镜头存在比较大的畸变。