拒绝马赛克,简单谈谈抗锯齿
在我们玩各种游戏的时候,打开图像设定,都会看到各种各样的抗锯齿选项,相信大家也曾像我一样,完全搞不懂这些选项是什么东西,所以在这里我就以个人对抗锯齿技术的理解,以文字说明配合图解的方式,给大家简单介绍一下抗锯齿技术相关的知识,希望能够让大家了解抗锯齿技术,每一种抗锯齿技术之间有什么区别。话不多少,接下来进入正题,本文主要以下面这几方面进行说明和讲解:
1、什么是锯齿
2、为什么会有锯齿
3、主流抗锯齿技术有哪些
1、什么是锯齿?
锯齿是英文Aliasing的常见翻译,但是实际上Aliasing是指更为广义的图像渲染失真,锯齿只是渲染失真的一个主要表现。这里我找了一张早年FC游戏超级玛丽的画面作为例子,大家可以看到砖块的四周都是十分平整的,但是像云朵,背景里的草丛和山峰这种斜边比较多的图案,就会明显地看到边缘颜色过渡会出现突变,这种颜色不连续出现跳变的表现,一般就称为锯齿。
2、为什么会有锯齿?
我们知道现实世界的颜色信息是连续的,所以看起来十分舒服,不会出现颜色突变的情况;但是我们的电脑画面却是由一个个垂直或水平排列的像素点组成的,当输出画面信息的时候,也是输出离散的一个个点的颜色信息,每一个点只能显示一种颜色,那么必然会出现部分的损失。正是因为这些颜色信息的损失,所以在我们的画面才会出现锯齿。
简单举个例子,假设现在画面只有四个像素点,要显示如上图左上角一样的弧形,我们现在把每一个像素点占比多的颜色作为这个像素点的颜色输出,得到的结果就如右图一样,除了左下以外,其他像素点都是出现了颜色信息的损失,这时候就产生了锯齿。
3、主流抗锯齿技术有哪些?
超级采样抗锯齿(Super Sampling Anti-Aliasing, SSAA)
超级采样抗锯齿是最早推出的一种抗锯齿方式,简单粗暴,具体的做法就是先把图像映射到缓存并把它放大,再用超级采样把放大后的图像像素进行采样,一般选取2个或4个邻近像素,把这些采样混合起来后,生成的最终像素,令每个像素拥有邻近像素的特征,像素与像素之间的过渡色彩,就变得近似,令图形的边缘色彩过渡趋于平滑。再把最终像素还原回原来大小的图像,并保存到帧缓存也就是显存中,替代原图像存储起来,最后输出到显示器,显示出一帧画面。这样就等于把一幅模糊的大图,通过细腻化后再缩小成清晰的小图。
这样的做法固然是能获得更好的画面效果,但是对显卡资源耗费巨大,直接提升分辨率方法看似简单,但是实际上有大量的不需要抗锯齿的部分也被纳入了计算范围,浪费了显卡的资源。
多重采样抗锯齿(Multi-Sampling Anti-Aliasing, MSAA)
因为SSAA浪费资源严重,所以很快各个厂商就推出了优化版的抗锯齿技术,只对多边形的边缘部分进行多重采样处理,这种方法就被成为多重采样抗锯齿。这种方法能大幅度地降低了显卡的计算压力,同时也能获得比较出色的画面表现,所以在推出之后受到了广泛的欢迎。
但是多重采样也存在问题,在遇到半透明的物体的时候,采样会变得十分困难,诸如铁丝网、草丛等等,边缘不明确或者十分复杂,这时候MSAA的缺点就显现出来了。
透明动态多重采样抗锯齿(Transparency Adaptive Multisampling Anti-Aliasing, TMAA)
针对一些半透明的物体采样问题,很快又推出了透明动态多重采样抗锯齿这种技术,有效地解决了之前的MSAA在处理半透明或边缘复杂的物体时缺乏Alpha混色能力的问题。TMAA通过控制纹理的Alpha值,对细小边角使用Alpha混色,从而在画面的细节部分更完美,使得在半透明物体的抗锯齿表现上有了提升。
覆盖采样抗锯齿(Coverage Sampling Anti-Aliasing, CSAA)
在MSAA和TMAA被广泛使用的时候,NVIDIA又推出了新的技术覆盖采样抗锯齿。CSAA主要是通过引入新的概念覆盖采样,优化了采样的性能,减少了对显卡显存和带宽的需求。
举例来说,如果使用 16x MSAA,需要在周围取得 16 个采样点的色彩值,然后保存这些数值进行计算。而 16x CSAA,则全部在被采样的像素点中心取得色彩值,然后对比并去掉同样的数据。一般来说,16x CSAA 后只需要保存 4 份色彩值即可。换句话来说,4x MSAA 耗费的资源和 16x CSAA 是相同的,但是,16x CSAA的画面效果相比 4x MSAA 更好。
快速近似抗锯齿(Fast approximate anti-aliasing,FXAA)
接下来要讲的这个技术则是和前面的有着很大区别,前面的方法都是由显卡对采样过程进行处理,对显卡的性能都有一定的需求,而FXAA则是在发生在渲染的后期工作阶段,这样负担几乎全都在渲染后端那里,显卡资源可以得到很大的节约。
FXAA先是对边缘像素的探测,之后是区分RGB和明暗信息,将对比最为明显的像素取出,进行后处理,完成之后将纹理重新覆盖,从而实现抗锯齿效果。不过需要注意的是,形态抗锯齿在景深特效和动态模糊下没有用处。
从FXAA推出就可以看到行业的趋势,只有小孩子才做选择,大人当然是我全都要,将抗锯齿放到渲染后端之后,就可以同时兼顾画质以及速度,这也是抗锯齿技术的终极目标。
时间性抗锯齿(Temporal Anti-Aliasing,TXAA)
TXAA是NVIDIA开发的抗锯齿技术,主要目的是为了减少移动中物体的锯齿,和FXAA相同也是一项在渲染后期进行的处理;应用的方法,主要是把多次采样的过程分布到每一帧中去,也就是每一帧都利用前面几帧保存下来的数据;假设现在我们每次都利用前三帧的数据,那么我们现在就需要对一个像素的四个部分进行轮流采样,然后每一次生成新的帧的时候都将前三次的采样结果和这一次的采样结果进行加权平均,最后得出新的帧的结果,这样就达到了减少移动中物体的锯齿的目的了。
TXAA的效果,相较于其他的抗锯齿技术会更加柔和,能够产生像电影一样的模糊帧,更加符合人眼的观看习惯;但是同时也有缺点,由于取了前面帧的采样结果,所以就有可能会产生视觉残留,形成拖影;
如何过滤掉一些不需要的采样结果,也是各个厂商持续努力的一个方向,现在比较成熟的方法是虚幻4推出的Neighborhood Clamping算法,在确定像素颜色的时候,先取当前像素以及周围的一些像素的颜色,计算得到一个合理的颜色范围,如果历史样本的帧颜色不在这个范围的话,就将它尽量拉到范围内,再去和当前像素做一个加权平均,获得最终结果。
除了Neighborhood Clamping算法,还有NVIDIA提出的Gaussian模型等等,大致原理也是差不多,这里就不赘述了。
多帧采样除锯齿(Multi-Frame Anti-Aliasing,MFAA)
MFAA是近年推出的一个抗锯齿方法,通过改变相邻帧的取样位置,以MFAA 2x的性能来达到近似MSAA 4x的表现效果,如下图显示,第n-1帧对像素的左下和右上进行采样,然后在第n帧对左上和右下进行采样,这样交替采样显示之后,就能达到近似每一帧都采样4个点的表现效果。
MFAA的方法听起来比较简单,那为什么到最近maxwell架构的显卡才推出呢,主要的原因就是之前的显卡采样方法都是只读取预先存在ROM里面的数据,不能适用多种多样的场景中,需要显卡出厂的时候就定制好;而在maxwell上NVIDIA推出了可编程采样位置,它被储存在RAM中,让驱动程序和应用可以将定制的采样位置写入RAM中,让采样变得更加灵活,同时也为以后更多的抗锯齿方式打好了基础。
深度学习超级采样(Deep Learning Super Sampling,DLSS)
DLSS是伴随着NVIDIA 20代显卡一同推出的一项新技术,和之前的抗锯齿方法差距十分的大,可以说是另辟蹊径,结合了另一个领域的知识,对原有的抗锯齿方法做出了改进。
DLSS主要是分为两个阶段,与其他深度学习模型一样,首先是对模型进行训练,然后再是对数据进行处理;训练阶段,需要用大量的显卡原始输出图像以及对应超级计算机处理过的超清图像对模型进行训练,让模型能够通过输入的低分辨率图像,生成对应的高分辨率图像,这个阶段需要庞大的算力,这部分都由NVIDIA总部的超级计算机进行处理,训练完之后再推送到各个用户;处理阶段则由各个用户显卡进行,只需要采样生成一张低分辨率的图像,输入到该模型之中就能生成对应的高分辨率图像,本地只需要能够达到处理每秒60帧低分辨率图像的性能,就能获得超级计算机抗锯齿的表现。
20代显卡新加入的Tensor Core单元,对深度学习进行了特别优化,在计算的时候不会占用画面资源,并且可以减少性能的损耗。在之前的显卡中,如果由处理图像的单元来进行处理,则会占用画面输出资源,得不偿失;这也是为什么选择在20代显卡推出之际同时推出DLSS这项抗锯齿技术。
总结一下,现在常见的抗锯齿技术主要可以分为以下几种:
1、通过更高的采样率,采集更多的像素点,然后再进行缩小,减少锯齿。
2、通过混合像素的色彩值或者模糊化,来让过渡部分的像素更加平滑,造成视觉欺骗,减少锯齿感。
3、通过深度学习,输入低分辨率的图像,经由算法计算,得到高分辨率的图像。
抗锯齿技术发展已久,随着其他技术的发展而推陈出新,可以看到所有的技术都是朝着一个方向去努力的,那就是更少的资源消耗,更好的画面效果。其中NVIDIA的深度学习,可以说开启了一个新的研究方向,而AMD则表示暂时不会使用深度学习,相信他们在不久以后也会推出新的可以与之匹敌的技术,会让抗锯齿技术有更多更好的发展方向。