一、渲染管线

在OpenGL中,任何事物都处于3D空间中，而屏幕和窗口却都是2D像素数组，这就导致了OpenGL大部分工作都是关于把3D坐标转变为适配你屏幕的2D像素，3D坐标转为2D坐标的处理过程是由OpenGL的图形渲染管线（指的是一堆原始图形数据途经一个输送管道，期间经过各种变化处理最终出现在屏幕的过程）管理的。

图形渲染管线(3D坐标 => 2D坐标)
主要可划分为以下两个部分

第一部分把你的3D坐标转换为2D坐标

第二部分是把2D坐标转变为实际的有颜色的像素

二、图形渲染管线处理流程

图形渲染管线接受一组3D坐标，然后把它们转变为你屏幕上的有色2D像素输出。图形渲染管线可以被划分为几个阶段，每个阶段将会把前一个阶段的输出作为输入。所有这些阶段都是高度专门化的（它们都有一个特定的函数），并且很容易并行执行。正是由于它们具有并行执行的特性，当今大多数显卡都有成千上万的小处理核心，它们在GPU上为每一个（渲染管线）阶段运行各自的小程序，从而在图形渲染管线中快速处理你的数据。这些小程序叫做着色器(Shader)。

下图是图形渲染管线的每个阶段的抽象展示。要注意蓝色部分代表的是我们可以注入自定义的着色器的部分。

管线处理

首先，我们以数组的形式传递3个3D坐标作为图形渲染管线的输入，用来表示一个三角形，这个数组叫做顶点数据(Vertex Data)；顶点数据是一系列顶点的集合。一个顶点(Vertex)是一个3D坐标的数据的集合。而顶点数据是用顶点属性(Vertex Attribute)表示的，它可以包含任何我们想用的数据。

为了让OpenGL知道我们的坐标和颜色值构成的到底是什么，OpenGL需要你去指定这些数据所表示的渲染类型。我们是希望把这些数据渲染成一系列的点？一系列的三角形？还是仅仅是一个长长的线？做出的这些提示叫做图元(Primitive)，任何一个绘制指令的调用都将把图元传递给OpenGL。这是其中的几个：GL_POINTS、GL_TRIANGLES、GL_LINE_STRIP。

图形渲染管线的第一个部分是顶点着色器(Vertex Shader)，它把一个单独的顶点作为输入。顶点着色器主要的目的是把3D坐标转为另一种3D坐标（后面会解释），同时顶点着色器允许我们对顶点属性进行一些基本处理。

图元装配(Primitive Assembly)阶段将顶点着色器输出的所有顶点作为输入（如果是GL_POINTS，那么就是一个顶点），并所有的点装配成指定图元的形状；本节例子中是一个三角形。

图元装配阶段的输出会传递给几何着色器(Geometry Shader)。几何着色器把图元形式的一系列顶点的集合作为输入，它可以通过产生新顶点构造出新的（或是其它的）图元来生成其他形状。例子中，它生成了另一个三角形。

几何着色器的输出会被传入光栅化阶段(Rasterization Stage)，这里它会把图元映射为最终屏幕上相应的像素，生成供片段着色器(Fragment Shader)使用的片段(Fragment)。在片段着色器运行之前会执行裁切(Clipping)。裁切会丢弃超出你的视图以外的所有像素，用来提升执行效率。

OpenGL中的一个片段是OpenGL渲染一个像素所需的所有数据。

片段着色器的主要目的是计算一个像素的最终颜色，这也是所有OpenGL高级效果产生的地方。通常，片段着色器包含3D场景的数据（比如光照、阴影、光的颜色等等），这些数据可以被用来计算最终像素的颜色。

在所有对应颜色值确定以后，最终的对象将会被传到最后一个阶段，我们叫做Alpha测试和混合(Blending)阶段。这个阶段检测片段的对应的深度（和模板(Stencil)）值，用它们来判断这个像素是其它物体的前面还是后面，决定是否应该丢弃。这个阶段也会检查alpha值（alpha值定义了一个物体的透明度）并对物体进行混合(Blend)。所以，即使在片段着色器中计算出来了一个像素输出的颜色，在渲染多个三角形的时候最后的像素颜色也可能完全不同。

可以看到，图形渲染管线非常复杂，它包含很多可配置的部分。然而，对于大多数场合，我们只需要配置顶点和片段着色器就行了。几何着色器是可选的，通常使用它默认的着色器就行了。

在现代OpenGL中，我们必须定义至少一个顶点着色器和一个片段着色器（因为GPU中没有默认的顶点/片段着色器）。

OpenGL 首先接收用户提供的几何数据(顶点和几何图元)，并且将它输入到一系列着色器阶段中进行处理，包括:顶点着色、细分着色(它本身包含两个着色器)，以及最后的几何着色，然后它将被送入光栅化单元(rasterizer)。光栅化单元负责对所有剪切区域(clipping region)内的图元生成片元数据，然后对每个生成的片元都执行一个片元着色器。

着色器在OpenGL应用程序里扮演了最主要的角色
你可以控制使用不同的着色器来实现自己所需的功能
只有顶点着色器和片元着色器是必须的，细分和几何着色器是可选的步骤

顶点数据

顶点数组（VertexArray）

顶点指的是我们在绘制一个图形时，它的顶点位置数据，而这个数据可以直接存储在数组中或者将其缓存到GPU内存中

顶点数组指定每个顶点的属性，是保存应用程序地址空间的缓冲区。他们作为顶点缓冲对象的基础，提供指定顶点属性数据的一个高效、灵活的手段

顶点缓冲区（VertexBuffer）
顶点数组指定的顶点数据保存在客户内存中。在进行glDrawArrays或者glDrawElements等绘图调用时，这些数据必须同客户内存复制到图形内存。

没必要每次绘图时都复制顶点数据，而是在图形内存中缓存这些数据，这样可以显著改善渲染性能，也可以降低内存带宽和电力消耗需求。这就是顶点缓冲区对象发挥作用的地方

顶点数组对象：Vertex Array Object，VAO 保存缓存以及顶点属性状态信息。
顶点缓冲对象：Vertex Buffer Object，VBO 用于分配内存，保存顶点数据给图形卡使用的一种缓存对象。
索引缓冲对象：Element Buffer Object，EBO或Index Buffer Object，IBO 保存顶点索引的一种缓存对象。

在定义好顶点数据以后，需要在内存中存储这些顶点，我们通过顶点缓冲对象(Vertex Buffer Objects, VBO)管理这个内存，它会在GPU内存（通常被称为显存）中储存大量顶点。使用这些缓冲对象的好处是我们可以一次性的发送一大批数据到显卡上，而不是每个顶点发送一次。从CPU把数据发送到显卡相对较慢，所以只要可能我们都要尝试尽量一次性发送尽可能多的数据。当数据发送至显卡的内存中后，顶点着色器几乎能立即访问顶点，这是个非常快的过程。

缓冲区保存在GPU内存中，可以在CPU不介入的情况下，完成数据操作。

下面是一个生成顶点缓冲区的例子

void initVertexBufferObjects(vertex_t *vertexBuffer,GLushort *indices,
GLuint numVertices,GLuint numIndices,GLuint *vboIds) {
/* 获取vboIds中两个未用的缓冲区对象名称。
然后vboIds返回的未使用的缓冲区对象名称用于创建一个数组缓冲区对象和一个元素数组缓冲区对象。
数组缓冲区对象用于保存一个或多个图元的顶点属性数据。
*/
  glGenBuffers(2, vboIds);
  glBindBuffer(GL_ARRAY_BUFFER, vboIds[0]);

  glBufferData(GL_ARRAY_BUFFER, numVertices *sizeof(vertex_t),vertexBuffer, GL_STATIC_DRAW);

  glBindBuffer(GL_ELEMENT_ARRAY_BUFFER, vboIds[1]);

  glBufferData(GL_ELEMENT_ARRAY_BUFFER, numIndices *sizeof(GLushort),indices, GL_STATIC_DRAW);
}

glGenBuffers(GLsizei n, GLuint * buffers)：分配n个缓冲区对象名称，并在buffers中返回它们。

glBindBuffer用于指定当前缓冲区对象。第一次通过调用
glBindBuffer绑定缓冲区对象名称时，缓冲区对象可以默认状态分配；如果分配成功，则分配的对象绑定微目标的当前缓冲区对象。
glBufferData 用于创建和初始化顶点数组或元素数组。

顶点数据是由GPU来处理的（顶点数据->GPU内存）

顶点缓冲区(不在内存！-> 显卡显存中)

顶点着色器（VertexShader）

顶点着色器对顶点实现了一种通用的可编程方法，它一般用来处理图形每个顶点变换（旋转/平移/投影等）
顶点着色器是OpenGL中用于计算顶点属性的程序。每个顶点都会执行依次顶点着色器，执行顺序是按照存储在顶点数组的顺序依次处理(一般是逆时针)。

顶点着色器的输入数据由下面组成：
*Attributes：使用顶点数组封装每个顶点的数据，一般用于每个顶点都各不相同的变量，如顶点位置、颜色等。
*Uniforms：顶点着色器使用的常量数据，不能被着色器修改，一般用于对同一组顶点组成的单个3D物体中所有顶点都相同的变量，如当前光源的位置。
*Samplers：这个是可选的，一种特殊的uniforms，表示顶点着色器使用的纹理。
*Shader program：顶点着色器的源码或可执行文件，描述了将对顶点执行的操作。

顶点着色器的输出数据是varying（易变）变量，在图元光栅化阶段，这些varying值为每个生成的片元进行计算，并将结果作为片元着色器的输入数据。从分配给每个顶点的原始varying值来为每个片元生成一个varying值的机制叫做插值。

顶点着色器数据的输入和输出

光栅化（Rasterization）

光栅化（Rasterization）是把顶点数据转换为片元的过程，具有将图转化为一个个栅格组成的图象的作用，特点是每个元素对应帧缓冲区中的一像素。
光栅化其实是一种将几何图元变为二维图像的过程。该过程包含了两部分的工作。
第一部分工作：决定窗口坐标中的哪些整型栅格区域被基本图元占用；
第二部分工作：分配一个颜色值和一个深度值到各个区域。光栅化过程产生的是片元。
把物体的数学描述以及与物体相关的颜色信息转换为屏幕上用于对应位置的像素及用于填充像素的颜色，这个过程称为光栅化，这是一个将模拟信号转化为离散信号的过程。

简而言之，光栅化阶段绘制对应的图元(点、线、三角形)，将图元转化为一组二维数组的过程，然后传递给片元着色器处理。这些二维数组代表屏幕上绘制的像素

光栅化

片元着色器（FragmentShader）

片元着色器主要是对光栅化处理后生成的片元逐个进行处理（并行）。接收顶点着色器输出的值，需要传入的数据，以及它经过变换矩阵后输出值存储位置。

着色器程序——描述片元所执行的片元着色器程序源代码

输入变量——光栅器对顶点着色器插值后的输出值

统一变量——片元(或顶点)着色器使用的不变的数据

采样器——代表片元着色器所用纹理的一种特殊的统一变量类型

片元着色器输入和输出关系

混合（Blending）

Blend 混合是将源色和目标色以某种方式混合生成特效的技术。混合常用来绘制透明或半透明的物体。
在混合中起关键作用的α值实际上是将源色和目标色按给定比率进行混合，以达到不同程度的透明。α值为0则完全透明，α值为1则完全不透明。混合操作只能在RGBA模式下进行，颜色索引模式下无法指定α值。物体的绘制顺序会影响到OpenGL的混合处理。

glEnable( GL_BLEND );   // 启用混合
glDisable( GL_BLEND );  // 禁用关闭混合

// 获得混合的信息
glGet( GL_BLEND_SRC );
glGet( GL_BLEND_DST );
glIsEnable( GL_BLEND );

关于混合可以参考这篇文章

拓展阅读：

iOS 渲染原理解析

OpenGL-渲染流程