写在前面
前面几节内容环境搭建,绘制三角形,以及使用索引绘制,让我们对现代OpenGL中绘图做了简单了解。要继续后面的部分,需要熟悉OpenGL中涉及的数学知识。因此本节开始介绍OpenGL中的基本数学。
介绍这部分内容的主旨在于对OpenGL涉及的数学有个整体把握,重点把握一些概念在OpenGL中的应用。内容尽量以例子形式说明,仅在必要时会给出数学证明。一个主题往往涉及过多内容,对于文中省略的部分,请参考相应的教材。
通过本节可以了解到
向量是研究2D、3D数学的标准工具。向量V是一个既有大小又有方向的量(联系位移和速度的概念)。在数学上,常用一条有方向的线段来表示向量。例如下图n维空间的向量 v=AB→=(v1,v2,...,vn) 如下图所示,向量起点为A,终点为B:
理解向量把握:
1.向量的大小就是向量的长度(模)。向量的长度非负。
2.向量的方向描述了向量的指向。
3.向量是没有位置的,与点是不同的。
4.向量与标量不同,变量是只有大小而没有方向的量,例如位移是向量,而距离是标量。
向量的长度即模,定义为:
|v|=v21+v22+⋯+v2n−−−−−−−−−−−−−−√
即 |v|=∑ni=1v2i−−−−−−−√
模等于0的向量成为0向量,模等于1的向量叫做单位向量。注意零向量的方向是任意的。
由一个向量v求与它同方向的单位向量过程称为标准化(normalization),这个单位向量成为标准化向量(normalized vector)。计算过程为:
vnorm=v|v|,v≠0
两个向量 a 和 b ,当将b的起点放在a的终点,连接a的起点和b的终点的向量成为向量 a , b 之和,记为: c=a+b ,如下图所示(图片来自:mathinsight):
物理上力学求和经常使用平行四边形法则,表达的是向量加法运算的结合律,即: a+b=b+a ,如下图所示(图片来自:mathinsight):
与一个向量 a 大小相同,方向相反的向量,称为向量 a 的负向量,两者相加得到零向量,即:
a+(−a)=0
两个非零向量的夹角规定为不超过 π 的角度 θ ,即
0≤θ≤π
如下图所示:
注意这个夹角的范围。当 θ=π2 称两个向量a与b垂直,当 θ=0或者π 时,称向量a与b平行。
向量点积,也称为向量的数量积,点积的结果是一个标量,其定义为:
A.B=|A||B|cosθ(1)
其中 θ 表示向量A和B之间的夹角。
向量点积的几何意义
要理解点积的几何意义,首先了解概念向量在轴上的投影(scalar projection ),这个投影计算得到一个标量。向量A在B上的投影定义为:
AB=|A|cosθ(2)
如下图所示(来自wiki dot product):
则1式可以写为:
A.B=|A|BA=|B|AB(3)
在空间几何中,例如n空间中,向量的坐标表示为:
A=(a1,b2,⋯,cn) , B=(b1,b2,⋯,bn) ,
则两个向量的点积可以表示为:
向量点积的应用
向量点积的一个重要应用在于,可以快速求出两个向量的夹角余弦。
由公式1可知,两个向量的夹角余弦计算公式为:
cosθ=a.b|a||b|(5)
当a和b都是单位向量时,两单位向量的夹角余弦值为:
cosθ=a.b(6)
公式6能快速计算出两个单位向量的夹角余弦,在计算光照时经常使用。
另外当一个向量为单位向量时:
|a|2=a⋅a(7)
这个公式也是经常使用的。
两个向量a和b的叉积,结果是一个向量 c=a×b ,c的方向垂直于a和b,它需要根据右手规则来确定(下文讲解);c的大小等于
|c|=|a||b|sinθ(8)
叉积如下图所示(来自wiki):
注意c的方向需要根据右手规则来确定。所谓右手规则是指,将向量a与b放在同一个起点时,当右手的四个手指从a所指方向转到b所指方向握拳时,大拇指的指向即为 a×b 的方向。如下图所示(来自cross product):
尤其要注意 a×b≠b×a 事实上,
a×b=−b×a(9)
在利用以坐标形式表示向量a和b时,在3D空间中,叉积的结果用矩阵表示为(矩阵下文介绍):
一个向量a在另一向量b上的投影向量,包括与b平行的部分 a1 和与b垂直的部分 a2 。 a1 即是之前提到的scalar projection,不过这里 a1 是一个向量。具体过程如下图所示:
右图可知与b平行分量 a1 可计算为:
投影向量的应用
投影向量的计算过程,是一个向量分解的过程,这种向量分解的思路在后面推导其他内容时很有帮助,例如求解后面的物体旋转矩阵时会派上用场。
矩阵从形式上就是一个数字表,以行和列的形式呈现,简单的矩阵如下图所示:
⎡⎣⎢147258369⎤⎦⎥
矩阵的行数m和列数n可以不相同,m行n列矩阵记为矩阵 Am×n 。当行数和列数相等时,m= n ,矩阵A也称为n阶方阵。例如下图给出了3x4矩阵 A3×4 的抽象表示:
对于1xn的矩阵,我们称之为行向量,nx1的矩阵称为列向量。一般可以用列向量表示空间中的向量(以行向量表示也可以),例如上面的向量 a=(ax,by,cz) 可以用列向量表示为:
a=⎡⎣⎢axayaz⎤⎦⎥
注意 OpenGL编程中习惯用列向量表示点或者向量。矩阵在内存中以列优先存储,但是具体传递参数时,一般函数提供了是否转置的布尔参数来调整存储格式。例如void glUniformMatrix4fv函数提供了布尔变量 GLboolean transpose 来表示是否转置矩阵。
mxn矩阵,如果所有元素都为0,则成为零矩阵。
对于一个n阶方阵,如果主对角线元素全为1,其余元素都为0则称为n阶单位阵。对于一个矩阵 Am×n ,存在单位阵满足: ImA=AIn=A .
任意矩阵 Am×n 与对应的零矩阵 Bn×p 相乘得到零矩阵。
转置操作即是将矩阵的行和列互换,即原矩阵 A 的第一行变为转置矩阵 AT 的第一列,原矩阵 A 的第二行变为转置矩阵 AT 的第二列,其他部分依次类推。
例如矩阵
两个矩阵A和B要能执行加减法,必须是行和列数目相等的,计算过程,即对应的元素相加( Aij+Bij )或者相减( Aij−Bij ),如下图所示:
用一个数k乘以矩阵A,结果为矩阵A中每个元素乘以数k。例如:
两个矩阵 Am×n 和 Bn×p 要执行乘法操作,需要满足: 左边矩阵的列数和右边矩阵的行数相等,并且结果矩阵为 Cm×p 。
计算过程如下图所示(来自:mathworld):
其中 Cij=∑nk=1aikbkj ,即C中第i行第j列的元素,即为矩阵A的第i行和第j的对应元素相乘后的和。例如
注意矩阵乘法不满足交换律 一般而言矩阵乘积 AB≠BA (当然存在特殊情况下满足),因此在OpenGL中应用变换矩阵时注意变换应用的顺序。变换的例子后面会介绍。
给定两个矩阵相乘,过程如下图所示(来自:mathsisfun):
熟悉了矩阵相乘后,则上述向量的点积公式可以重新表示为:
a=(a1,b2,⋯,cn) , b=(b1,b2,⋯,bn) ,
则两个向量的点积可以表示为:
矩阵和向量相乘是矩阵和矩阵相乘的特例,给定矩阵A和列向量v,相乘过程如下所示(来自mathinsight):
行列式是n阶方阵的数字构成的数的行列集合,例如2阶方阵A表示为:
A=[acbd]
其行列式det(A)表示为:
对于n阶方阵A,如果存在一个n阶方阵B使得:
AB=BA=I(14)
成立,则称B是A的逆矩阵,这时就说矩阵A是可逆矩阵,或者说矩阵A时非奇异矩阵(Nonsingular matrix)。单位矩阵 I 是主对角线上元素为1,其余元素都为0的n阶方阵。例如3x3的单位矩阵为:
I3x3=⎡⎣⎢100010001⎤⎦⎥
注意 只有n阶方阵才有逆矩阵的概念,对于一般的矩阵 Am×n(m≠n) 不存在这样的矩阵B满足14式。
n阶方阵A可逆的充要条件是A的行列式 |A|≠0 .
逆矩阵的应用意义
在3D图形处理中,用一个变换矩阵乘以向量,代表了对原始图形进行了某种变换,例如缩小,旋转等,逆矩阵表示这个操作的逆操作,也就是能够撤销这一操作。例如对一个向量v用矩阵M相乘,然后再用 M−1 相乘,则能得到原来的向量v:
M−1(Mv)=(M−1M)v=Iv=v
注意转换矩阵应用顺序 当用矩阵A,B,C转换向量v时,如果v用行向量记法,则矩阵按转换顺序从左往右列出,表达为 vABC ;如果v采用列向量记法,则转换矩阵应该放在左边,并且转换从右往左发生,对应的转换记为 CBAv 。
对于方阵M,当且仅当M与其转置矩阵 MT 的乘积等于单位矩阵时,称其为正交矩阵。即:
M正交⇔MMT=I⇔MT=M−1(15)
正交矩阵的一大优势在于,计算逆矩阵时,只需要对原矩阵转置即可,从而减少了计算量。在3D图形处理中的旋转和镜像变换都是正交的。
对于n阶方阵A,它是正交矩阵的重要条件是A的行向量为一个相互正交的单位向量组,即 A=⎡⎣⎢⎢⎢⎢β1β2⋮βn⎤⎦⎥⎥⎥⎥ 为正交矩阵的充要条件是:
An×n正交⇔βiβTj={1,0,i=ji≠j(16)
注意这里 βi 表示的是行向量。上述条件可以叙述为:
这个重要条件可以利用 MMT=I 加以证明。利用这个充要条件可以作为快速判断一个矩阵 M 是否是正交矩阵的方法。对于矩阵的列也可以得到类似的条件。同时也可以得到,如果 M 是正交矩阵,则 MT 也是正交矩阵。
例如下面的矩阵 Rx(θ) 表示物体绕x轴的旋转 θ 角度。
Rx(θ)=⎡⎣⎢⎢⎢10000cosθsinθ00−sinθcosθ00001⎤⎦⎥⎥⎥
可以验证矩阵的行向量都满足上面的条件16,则 Rx(θ) 为正交矩阵。
也可以通过旋转矩阵本身的特性证明。对于旋转而言,绕x轴旋转 θ 角度的逆操作等于绕x轴旋转 −θ 角度,因此有:
Rx(θ)−1=Rx(−θ)(*)
应用: cos(−θ)=cosθ 和 sin(−θ)=−sinθ 得到:
Rx(−θ)=⎡⎣⎢⎢⎢10000cosθ−sinθ00sinθcosθ00001⎤⎦⎥⎥⎥
可以发现:
Rx(−θ)=Rx(θ)T(**)
由*和**式子得到:
Rx(θ)−1=Rx(θ)T(***)
由式15和***式得到 Rx(θ) 为正交矩阵。
GLM是一个C++编写的,基于OpenGL着色器语言规范编写只是用头文件的图形开发数学库。这个库中提供了我们需要的很多数学操作,例如包含本节提到的向量和矩阵。例如下面的代码是用了向量的标准化、叉积等操作求取了一个三角形的法向量:
#include // glm::vec3
#include // glm::cross, glm::normalize
void computeNormal(triangle & Triangle)
{
glm::vec3 const & a = Triangle.Position[0];
glm::vec3 const & b = Triangle.Position[1];
glm::vec3 const & c = Triangle.Position[2];
Triangle.Normal = glm::normalize(glm::cross(c - a, b - a));
}
例如与4x4矩阵对应类为 glm::mat4,其他更多的操作可以查看其参考文档,具体使用方法在后面应用时再做介绍。下一节介绍理解坐标、线性变换、仿射变换以及坐标转换所需的数学基础。
1.《3D数学基础:图形与游戏开发》清华大学出版社
2.《线性代数》武汉大学数学与统计学院 高等教育出版社 齐民友主编
3. 《交互式计算机图形学-基于OpenGL着色器的自动向下方法》电子工业出版社 Edward Angle等著