业界常说的两本书:
红宝书: 《OpenGL编程指南》
蓝宝书:《OpenGL超级宝典》
(Open Graphics Library)是一个夸编辑语言、跨平台的编程图形程序接口。他将计算机的资源抽象成为一个OpenGL的对象,对这些资源的操作抽象为一个个的OpenGL的指令。
主要针对的是在PC 端解决图像渲染
(OpenGL for Embedded Systems)是OpenGL 三维图形API 的子集。针对手机、PDA 和游戏主机等嵌入式设备而设计,去除了许多不必要和性能较低的API 接口。
针对的是移动端解决图像渲染
是由很多API 组成的,DirectX 并不是一个单纯的图形API。最重要的是DirectX 是属于Windows 上一个多媒体处理框架。并不支持Windows以外的平台,所以不是跨平台框架,按照性质分类,可以分为四大部分。分别是:
Apple 为游戏开发者推出的新的平台技术 Metal,该技术能够为3D 图像提高10倍的渲染性能。Metal 是Apple 为了了解3D 渲染而推出的框架。
图形API 目的是解决一些问题:
- 比如在游戏开发中,对于游戏场景/游戏人物的渲染
- 比如在音视频开发中,对于视频解码后的数据渲染
- 比如在地图引擎,对于地图上的数据渲染
- 比如在动画中,实现动画的绘制
- 比如在视频处理中,对于视频加上滤镜效果
OpenGL、OpenGL ES 、 Metal 在任何项目中解决问题的本质就是利用GPU 芯片来高效渲染图形图像。图形API 是iOS开发者唯一接近GPU 的方式。
状态机是理论上的一种极其。状态机描述了一个对象在其生命周期内所经历的各种状态,状态间转变,发生转变的原因,条件及转变中执行的活动。或者说,状态机是一种行为,说明对象在其生命周期中相应事件所经历的状态序列以及对那些状态事件的相应。
OpenGL 状态机。类推到OpenGL中来,可以这么理解:
OpenGL 可以记录自己的状态(如OpenGL 函数的时候,实际上可以看成OpenGL 在接收我们的输入),如我们调用GLColor3f,则OpenGL接收到这个输入后会修改自己的“当前颜色”这个状态;
OpenGL 可以进入停止状态,不在接收输入。在程序退出前,OpenGL 总会先停止工作的。
小结:
- 记忆功能,保存当前状态
- 接收输入,修改当前状态,或根据当前状态进行输出
- 当进入特殊状态(停机状态)时,不再接收输入,停止工作
在应用程序调用任何OpenGL 的指令之前,首先需要创建一个OpenGL 的上下文。这个上下文是一个非常庞大的状态机,保存了OpenGL 中的各种状态,这也是OpenGL 指令执行的基础。
OpenGL 的函数不管在哪个语言中,都是类似C 语言一样的面向过程的函数。本质上都是对OpenGL 上下文这个庞大状态机中的某个状态或者对象进行操作(这个对象要设置为当前对象)。可以将OpenGL 的相关调用封装成为一个面向对象的图形API。
由于 OpenGL 上下文是一个巨大的状态机,切换上下文往往会产生较大的开销,但是不同的绘制模块,可能需要使用功能完全独立的状态管理。因此,可以在应用管理程序中分别创建多个不同的上下文,在不同线程中使用不同给的上下文,上下文之间共享纹理,缓冲区等资源。这样的方案,会比反复切换上下文,或者大量修改渲染状态,更加合理高效。
小结:
- OpenGL:指令执行的基础,是一个非常庞大的状态机
- OpenGL 上下文切换开销大。虽然可能使用多个上下午,但上下文之间会共享纹理,缓冲区等资源。
- OpenGL 的函数虽然是面向过程的,但可以把相关的调用封装为面向过程的图形API。
将图形 / 图像数据转换成2D空间图像操作叫做渲染(Rendering)。
顶点数据就是图像的轮廓。OpenGL 中的图像都是由图元组成。在OpenGL ES中,有3种类型的图元:点、线、三角形。
在调用绘制方法的时候,直接由内存传入顶点数据,也就是说这个部分数据之前是存储在内存当中的,被称为顶点数组(VertexArray)。
而性能更高的做法是,提前分配一块显存,将顶点数据预先传入到显存当中。这部分的显存,就被称为顶点缓冲区(VertexBuffer)。
顶点值得是我们在绘制一个图形时,他的顶点位置数据。而这个数据可以直接存储在数组中或者将其缓存在GPU 内存中
小结:
- 3种(只有这3种)类型的图元:点、线、三角形。
- 顶点数组(VertexArray)在内存中。
- 顶点缓冲区(VertexBuffer)在缓存中。
在OpenGL 下渲染图形,就会经历一个一个的节点。而这样的操作可以理解为管线。就像一个流水线,任务按照先后顺序依次执行。管线是一个抽象的概念,之所以称之为管线是因为显卡在处理数据的时候是按照一个固定的顺序来的,而且严格按照这个顺序。就像水从一根管子的一端流到另一端,这个顺序是不能打破的。
核心要点:
任务严格按照顺序依次执行。
在早期的OpenGL 版本,封装了多种着色器程序块,内置了一个段包含了光照、坐标变换、裁剪等诸多功能的固定shader 程序来完成。来帮助开发者来完成图形的渲染,开发者只需要传入相应的参数,就能快速完成图形的渲染。类似于iOS开发会封装很多API,而我们只需要调用,就可以实现功能,不需要关注底层实现原理。
但是由于OpenGL 的使用场景非常丰富,固定管线或存储着色器无法完成每一个业务,这就将相关部分开发成可编辑
小结:
- 早期的OpenGL 版本封装的辅助快速开发的着色器程序块。
- 由于提供的功能有限,后期编程了可编辑的形式。
将固定渲染管线架构变成可编程渲染管线。
OpenGL 在实际调用绘制函数之前,还需要指定一个由shader 编程成的着色器程序。
常见的着色器主要有:
- 顶点着色器(VertexShader)
- 片段着色器(FragmentShader)或叫 像素着色器(PixelShader)
- 几何着色器(GeometryShader)
- 曲面细分着色器(TessellationShader)
片段着色器和像素着色器只是在OpenGL 和 DX 中的不同叫法而已。可惜的是,直到OpenGL ES 3.0,OpenGL ES 依然只支持 顶点着色器 和 片段着色器 这两个最基础的着色器。
OpenGL 在处理 shader 时,和其他编译器一样。通过编译、连接等步骤,生成了着色器程序(GLProgram),着色器程序同时包含了顶点着色器 和 片段着色器 的运算逻辑。在OpenGL 进行绘制的时候,首先由顶点着色器对传入的顶点数据进行运算。在通过图元装配,将顶点转换为图元。然后进行光栅化,将图元这种矢量图形,转换为栅格化数据。最后,将栅格化数据传入片段着色器中进行运算。片段着色器会对栅格化数据中的每一个像素进行运算,并决定像素的颜色。
小结:
- 将固定渲染管线架构变为了可编程渲染管线
- 常见的着色器主要有顶点着色器,片段着色器/像素着色器,几何着色,曲面细分着色。
- OpenGL ES只支持 顶点着色器 和 片段着色器
- OpenGL 通过编译、连接等步骤,将生成着色器程序。
- 在OpenGL 进行绘制的时候,由顶点着色器对传入的顶点数据进行运算。通过图元装配,将顶点转换为图元。之后进行光栅化,将图元这种适量图形,转换为栅格化数据。最后栅格化数据传入片段着色器中进行运算,片段着色器会对栅格化数据中每一个像素进行运算,并决定像素的颜色。
一般用来处理图形每个顶点变换(旋转/平移/投影等)
顶点着色器是OpenGL 中用于计算顶点属性的程序。顶点着色器是逐顶点运算的程序,也就是说每个顶点数据都会执行一次顶点着色器。当然这是并行的,并且顶点着色器运算过程中无法访问其他顶点的数据。
一般来说典型的需要计算的顶点属相主要包括顶点坐标变换、逐顶点光照运算等等。顶点坐标由自身坐标系统转换为归一化坐标系的运算,就是在这里发生的。
小结:
- 一般用来处理图形每个顶点变换(旋转/平移/投影等)
- 并行计算,且运算过程中无法访问其他顶点的数据。
一般用来处理图形汇总每个像素点颜色计算和填充
片段着色器是OpenGL 中用于计算片段(像素)颜色的程序。片段着色器是逐像素运算的程序,也就是说每个像素都会执行一次片段着色器,当然也是并行的。
小结:
- 一般用来处理图形汇总每个像素点颜色计算和填充
- 并行计算,且运算过程中无法访问其他顶点的数据
补充:
jpg png 这些都是压缩图片
图片显示 -> 位图
例如,120 * 120 的图片 = 14400 个像素点, 每个像素点都有R B G alpha 透明度 各是8位 总共 4 个字节 = 14400 * 4
GLSL 着色语言是用在OpenGL 中着色编程的语言,是在图形卡的GPU 上执行的。代替了固定的渲染管线的一部分,使渲染管线中不同层次具有可编译性。比如:视图转换、投影转换等。
GLSL 的着色器代码分为2个部分Vertex Shader(顶点着色器) 和 Fragment(片元着色器)
光栅化就是把顶点数据转换为片元的过程。具有将图转化为一个个栅格组成的图像的作用,特点是每个元素对应帧缓冲区中的一个像素。
光栅化其实是将几何图元变为二维图像的过程。该过程包含了两部分的工作。第一部分工作:决定窗口坐标中的哪些整形栅格区域被基本图元占用;第二部分:分配一个颜色值和一个深度值到各个区域。光栅化过程产生的是片元
把物体的数学描述以及物体相关的颜色信息转换为屏幕上用于对应位置的像素及用于填充像素的颜色,这个过程称为光栅化。这是一个将模拟信号转化为离散信号的过程。
小结:
- 光栅化就是把顶点数据转换为片元的过程。
- 该过程包含了两部分的工作:
- 决定窗口坐标中的哪些整形栅格区域被基本图元占用;
- 分配一个颜色值和一个深度值到各个区域。
光栅化有两个过程
- 确定图形在像素范围
- 颜色附着上
纹理可以理解为图片。在渲染图形时需要在顶点围成的区域中填充图片,使得场景更加逼真。而这里使用的图片,就是常说的纹理。只是在OpenGL,我们更加习惯叫纹理,而不是图片。
在测试阶段之后,如果像素依然没有被剔除,那么像素的颜色将会和帧缓存区中颜色附着上的颜色进行混合,混合的算法可以通过OpenGL 的函数进行指定。但是OpenGL 提供的混合算法有限。如果需要更加复杂的混合算法,一般可以通过像素着色器进行实现,当然性能会比原生的混合算法差一些
例如图形想发生平移、缩放、旋转等变换,就需要使用变换矩阵。
用于将3D 坐标转换为二维屏幕坐标,实际线条也将在二维坐标下进行绘制。
渲染缓冲区一般映射的是系统的资源比如窗口。如果将图像直接渲染到窗口对应的渲染缓冲区,则可以将图像显示到屏幕上。
值得注意的是,如果每个窗口只有一个缓冲区,那么在绘制过程中屏幕进行了刷新,窗口可能显示出不完整的图像。
为了解决这个问题,常规的OpenGL 程序至少都会有两个缓冲区。显示在屏幕上的称为屏幕缓冲区,没有显示的称为离屏缓冲区。在一个缓冲区渲染完成之后,通过将屏幕缓冲区和离屏缓冲区交换,实现图像在屏幕上显示。
由于显示器的刷新一般是逐行进行的,因此为了防止交换缓冲区的时候屏幕上下区域的图像分属于两个不同的帧,交换一般会等待显示器刷新完成的信号,在显示器两次刷新的间隔中进行交换,这个信号就被称为垂直同步信号,这个技术被称为垂直同步。
使用了双缓冲区和垂直同步技术之后,由于总是要等待缓冲区交换之后再进行下一帧的渲染,使得帧率无法完全达到硬件允许的最高水平。为了解决这个问题,引入了三缓冲区技术。在等待垂直同步时,来回交替渲染两个离屏的缓冲区,而垂直同步发生时,屏幕缓冲区和最近渲染完成的离屏缓冲区交换,实现充分利用硬件性能的目的。
小结:
- 如果每个窗口只有一个缓冲区,若在绘制过程中屏幕进行了刷新,窗口可能显示出不完整的图像。为了解决这个问题,常规的OpenGL 程序至少都会有两个缓冲区。
- 垂直同步:由于显示器的刷新一般是逐行进行的,为了防止交换缓冲区的时候屏幕上下区域的图像分属于两个不同的帧,交换一般会等待显示器刷新完成的信号,在显示器两次刷线的时间中进行交换,这个信号就被称为垂直信号,这个技术被称为垂直同步。
- 三缓冲区技术:使用了双缓冲区和垂直同步技术之后,由于总是要等待缓冲区交换之后再进行下一帧的渲染,使得帧率无法完全达到硬件允许的最高水平。为了解决这个问题,引入了三缓冲区技术。在等待垂直同步时,来回交替渲染两个离屏的缓冲区,而垂直同步发生时,屏幕缓冲区和最近渲染完成的离屏缓冲区交换,实现充分利用硬件性能的目的