很多人说,主机设备的每一个世代都在让现实世界的我们向虚幻迈出一大步,从最早期的横版通关魂斗罗,到现代令人惊艳的最终生还者2,幻想和现实之间的边界正在慢慢模糊。在这光影之间,游戏电影、CG电影正不知不觉中渐渐增加,特效,动作捕捉不仅在电影中广泛应用,也带动游戏人物愈加真实。技术的发展让我们迷失在虚幻和现实之间。
40年,第九世代,索尼的PS5发布会带我们走向了新的世代开端。
这一切的一切,都源自于计算机史上的两个标志性事件:
70年前,在MIT的实验室里,Jay Forrester博士按下了第一台图形计算机的电源,它有个赫赫有名的名字“旋风一号”(Whirlwind);
50年前,在尤他州立大学的计算科学课上,Edwin Catmull博士用贝塞尔曲线算法为这节课提交了一个大作业,完全通过计算模拟出的人手,这被后人称为世界上最早的CG动画。
自此,计算机的虚幻世界向我们打开了大门,在天才艺术工作者的带领下,无数人蜂拥而入,寻找新的精神慰藉。在那里,人们移山填海、无所不能,只要想得到的就可以被展现在眼前,这也是计算图形学的开端。
能够与我们交互的计算机画面,产生的本质原理是通过计算生成拟真图像。而实际上,虽然目前虚幻世界的自由度很高,但计算生成动画也有自身的限制。通常和其它计算机应用一样,始终有两种上限——硬件的计算能力和软件的拟真能力,两者相辅相成。PS5的发布,其实就代表着索尼同时提升了硬件能力和相应的软件拟真能力,这样让我们越来越确信一个新的虚幻的世界,正在朝我们慢慢走来。
人类最早通过眼睛认识世界。在人类五官里,视觉是信息采集最丰富的器官。我们观察周边事物,首先需要依靠眼睛来观察事物的外表形象,至于语言、符号、文字,都是在此后千万年才逐渐形成新的知识抽象。
视觉对人类如此重要,以至于当婴儿出生数月,就可以辨认出母亲,但是试图学习做出1+1=2的数学题,就往往是好几年以后的事情了。电脑却正相反,一台笔记本可以轻松在1秒之内完成上亿次运算,却无法主动思索,甚至如果不加干涉,它也不能识别任何视频数据。从这点来看,人脑擅长形象思维,电脑擅长逻辑。
这也代表着,在计算机发展初期,两者泾渭分明。计算展现图形,远远要比问计算机1+1=2要难上无数倍。甚至我们还可以说,如何让计算机生成、显示、处理图像,也落后于计算机体系本身好多年。
如果我们回顾硬件生成图像和计算机图形的发展历史,1986是无论如何都绕不过去的一个年头。在1986年,工业光魔的计算机图形学部门computer graphics division被正式卖给乔布斯,并改名为皮克斯。
此后数年,这一由当时最顶尖的计算机图形学探索者所组成的部门,正式找到了盈利方向。后续谁想不到呢?数十年后,收购的500万美元变成了76亿美元的产业,皮克斯拯救了濒临破产的迪士尼,甚至带动了一个计算机科学中重要分支的蓬勃发展和商业落地。
在皮克斯之前,早期的计算机动画制作灵感主要来自于传统的动画片:多幅图像之间被通过“关键帧”相连,这样生成动画的方式多种多样。但是,“关键帧”为主的画面并不灵活。这也是皮克斯和迪士尼等公司的区别之一,计算图形学,本质是试图通过一些物理模型,来通过建模、计算实时生成图像,尽量少用或不使用已有人类绘制的素材。
但是这样做很难。
在90世纪这个一切都还十分简陋的年代,即使是在当时最顶尖的计算设备里,硬件和算法也都存在不同程度的相互妥协。模型限制了生成图像的表面、光照、阴影、毛发等等细节程度,硬件限制了相应模型生成的计算时间,也给了创作者更少的试错空间。
不过回头来看,这些相互妥协却也代表着一种特立独行,早期皮克斯独特的风格—--简单平滑的几何图形甚至形成了一种独特的时代潮流和文化符号。就像当我们想起工业时代的英国,就能想象到维多利亚风格的蒸汽朋克建筑一样。
这样的妥协也充斥在当年游戏业内,为了充分利用卡带里有限的储存空间和早期游戏机的性能,游戏设计师不得不对素材进行极致的重复利用。这种风格被后人命名为“像素风”,甚至现在还存在相当多的怀旧游戏采取此类设计风格,勾起玩家的回忆。
简单的几何图案和像素风形成了早期计算机图形学相关产业的独特标签,而在这几年虚拟的蓬勃发展,也伴随着显示技术的重大代际飞跃。
上个世纪80年代左右,自从阴极射线管图形显示器诞生以来,图像显示器终端蓬勃发展。因为对于阴极射线管的荧光屏幕来说,由于屏幕荧光质的余晖时间很短,射线管发射的电子束必须重复不断的刷新图形,才能保证屏幕上的画面稳定,因此它被称为随机扫描式刷新器。
这种随机扫描要求电子束在屏幕上连续绘制直线或者曲线,而且只能绘制线框图,制造成本复杂而且造价很高。此外,随机扫描刷新器中必备模数转换器,用来将离散的数字输入转变成连续的模拟量输出。
这个问题对于计算图形学科学家和广大用户都很难接受。因此大约在数年之后,光栅式显示器一出现市场就被其迅速占领。不同于随机扫描,光栅扫描的电子束会做规则的逐行扫描,渲染每个像素点中可见光的颜色和光亮度。更重要的是,光栅扫描还可以针对成熟的彩色电视技术,用三个电子束同步逐行扫描,每一个电子束采用一种颜色,分别渲染之后形成彩色图像。
图像终端从随机扫描到光栅扫描是发展历程中的一次质的飞跃,也促进了计算机图形学的繁荣和普及。但是在追逐虚拟世界真实化的道路上,计算机科学家们的脚步并未停止。
这就是拿着N卡的老黄一直提到的光线追踪。什么是光线追踪是一个很难回答的问题,不过我们通常都认为,光线追踪区别于现有的光栅渲染(请注意,这不是前边提到的光栅扫描)。在光栅渲染中,我们会把物体拆解为若干三角形,这些三角形通过几何变换映射到屏幕的某些区域,再把这些三角面覆盖的区域变成一个一个像素,这个过程,被称为软件渲染中的光栅化。
光栅化的问题是,对于计算出的光照而言很难达到完美的效果。近年来出现了各种全局光照渲染算法,比如环境光遮蔽,漫反射等等,五花八门。与光栅化渲染不同的是,光线追踪把一个场景的渲染任务拆分成从摄像机出发的各个光线,通过这些光线和物体的焦点,来计算光源信息,这样就很容易得到比较好的渲染结果。
但是相应的问题是,如何在有限的算力下做到效果还不错的实时光线追踪?PS5或者更下一代游戏主机或许能够给我们带来答案。
让我们把视角从光线追踪放回到虚拟和现实的边界。
1998年的地球信息系统年会上,美国副总统戈尔提出了一个异想天开的计划,他希望以地球坐标为依据,全方位采集和应用地球表层的各种综合信息。
他设想若干年后,一位小学生可以来到当地的一家博物馆,戴上带有立体视觉的头盔显示镜,遥望漂浮在浩瀚星空中的数字地球。通过数据手套指引,地球呈现出海洋、大陆、国家、城市、街道和建筑……他可以驻足观望,通过语音系统了解当地的风土人情、名胜古迹、资源分布,并且可以走进实地尽情欣赏里面的收藏。
从现在我们的视角来看,戈尔的愿望无疑是宏大且难以实现的。因为这里需要采集处理的数据量,即使在十年后的“大数据”时代,也足以被称为“爆炸”级。但是在当时,人们震惊与此的原因在于,计算机图形学的软硬件发展让我们看到了实现这一愿景的可能。事实上,在数据量不那么大的前提下,我们已经能够完美实现这样的结果,可以说戈尔的愿望已经成为现实。
不过,戈尔或许想不到的是,数十年后,NASA提出了另一个更加宏大的虚拟世界创造计划,再次引起了工业界和科研界的巨大关注,这种技术被称为是“数字孪生”。数字孪生据说起源于NASA的阿波罗计划,通过建设虚拟世界中的对应模型,管理者可以实时看到对应物理实体或者流程运作的动态反馈,这样管理者可以更加简单直观地根据获得信息采取实时反馈,例如可能调整良品率低的产品处理流程。
或许,我们可以认为,数字孪生的关键点在于能够在物理世界和虚拟世界之间建立起实时、准确的联系,能够让虚拟世界和真实世界进行交互和反馈。
虽然现在,这种联系仅仅依靠于某个实物或者实体,但是如果有一天,我们完全有能力把大多物体制作出对应的虚拟世界映像呢?
正如我们有了魂斗罗和黑白机,那年夏天,“小霸王其乐无穷”此起彼伏;
正如皮克斯有了玩具总动员,那一年,美国万人空巷一票难求;
正如戈尔提出了数字地球,那一年,地理遥感和世界各国政府争相效仿;
正如NASA提出了数字孪生,多年以后我们回头想想,数字世界和真实世界的边界在那几年正在逐渐模糊;
徘徊在光影之间,这或许就是我们能够期待的未来。真实和虚幻,并不遥远。