元宇宙背后,你应该了解的人工智能核心技术

原创:王稳钺
资料来源:单博

一、真假元宇宙

最近元宇宙这个概念非常火,网上的资料也是铺天盖地。但个人认为元宇宙这个概念里蹭热点的人非常的多,元宇宙还是处于概念为主的阶段。很多人说自己在做元宇宙,但其实都是真假难辨的状态。在元宇宙这个词出现之前,其实有很多相关的概念,比如虚拟现实( VR )、数字孪生、自动化等。数字孪生其实就是仿真建模,比如说我国的国产的飞机 919 等大型的机械化的电气化的设备在生产的过程中,都会涉及到跟数字孪生相关的一些数字仿真。元宇宙这个概念,其实应该更加理性去看待,关于元宇宙,人们达到了一个共识就是它一定是确定性的一个未来,但是它如何、何时能够到来,还是一个未知数。

关于一个技术的发展,经常可以用 Gartner 技术成熟度曲线来对它进行一个衡量。在一个技术诞生初期会有一个爆发期,但是往往会带来一个过高的期望,来到一个峰值。峰值过后就会有一个下降的冷却期。之后,在泡沫崩盘之后会有一个缓慢爬升的过程,最后才能投入到真实的生产科研这些应用当中。

如果要实现能够在一个虚拟的世界里面生活、互联、人际交往,其实还需要大量的基础设施,软硬件的发展、市场的培育、内容的建设,需要这几点甚至更多的协同才能实现。所以元宇宙现在有真有假,众说纷纭,所以一定要用相对冷静和务实的态度来看待元宇宙。

二、人工智能现在在哪里?

人们普遍认为AI是离元宇宙相对较近的方向,我们可以通过 AI 和元宇宙之间的关联来了解一下 AI 技术现在发展到了什么程度,未来还有哪些发展。元宇宙中一个重要的方面就是人机交互和信息的传递,这在 AI 当中也有很多应用。例如抖音,有没有发现抖音越刷越爱看呢?每天推荐的都是感兴趣的内容。还有淘宝,即使最近不太想买东西,偶尔也会打开淘宝看一看。淘宝就会根据最近浏览过的商品来推荐可能感兴趣的商品,比如最近浏览过手机耳机,就有可能会推荐其他电子产品;搜索过衣服,就会推荐很多符合审美,符合价位的服装。除此以外,包括很多音乐软件也有猜你喜欢等等歌单的推荐。这些都是属于推荐系统在日常生活中的应用。

计算机视觉在日常生活中也有广泛的应用。比如说手机解锁,上下班刷脸打卡、高铁站机场等需要通过人证比对来做身份的检验、自动驾驶等等。自然语言处理同样如此,人们的生活也都离不开有道词典等翻译软件。

三、认识人工智能

很多书、教材中都会说人工智能没有一个明确的定义。但是我们可以将它定义为——为机器赋予人的智能,即像人一样感知,像人一样思考,像人一样行为。其实感知、决策控制这三点就是机器要具有的人的智能。感知,就像人的视觉、听觉;思考,像人一样在不同的情况下要做出决策;做出决策,还要执行,这就属于像人一样行为。

在人工智能诞生之初,人工智能这个词是怎么来的呢?其实它最早和控制论是非常相关的。其实控制论和人工智能是一个相辅相成的概念。控制论这个词出现得更早,其实它就是早期的人工智能概念。随着学术界出现了争执和风波,一群 AI 的学者,为了脱离原本维纳的控制论,所以起了一个新词叫人工智能。所以如果在谷歌的词频里面搜索一下的话,也可以看出来,早期的时候,在五六十年代的时候,控制论这个词迎来了一波高峰,但后来就衰落了。

那现在这个时代,当谈论到人工智能的时候,其实是在谈两个概念,即算法工具和智能硬件。因为人工智能其实是在硬件的促进下发展的,三驾马车指的就是算法、算力和数据。关于算法工具,其实就是深度学习和强化学习。AlphaGo 就是将深度学习和强化学习相结合产生的。硬件系统主要的就是指移动端的芯片,比如手机里的芯片。

今天人工智能算法中最火的名词就是深度学习了。但是人工智能有许多流派,符号主义、连接主义、统计主义、行为主义等等,在这些流派下面会诞生不同的算法的门类,不同的算法门类里面细节还有很多算法,人工智能的算法非常多,比如说知识图谱、专家系统、遗传算法等,他们都属于 AI的算法。但最近十年是深度学习比较流行,但是如果真的想扎根于人工智能的话,不要放弃其他算法,因为人工智能的发展,一直都是三十年河东,三十年河西。在最早的时候符号主义和专家系统特别流行,现在就不流行了,但没人知道十年之后他不会再次流行。

在人工智能诞生之初,科学家会想怎么实现人工智能呢,然后就诞生了不同的流派。在最早符号主义比较占上风,科学家们都认为通过这种基于规则的数理逻辑、数学逻辑(加减乘除、与或非)就可以实现人的智能。因为计算机刚刚诞生的时候,就是利用这些进行计算的。但是即使到了现在人脑的原理,人们也没有完全的理解,现在的电脑也还是不能代替人脑,所以符号主义没有走得很远,逐渐没落了。

其实在人工智能诞生的早期,还有另外一个流派就叫做连接主义,或者叫连接流派。它是模拟大脑的连接结构。该流派主要是模拟人脑的结构。人脑由神经元组成,那机器脑就由人工神经元构成;人的大脑皮层是一层一层连接起来的,那机器里面的大脑就由一层一层的人工神经元连成。这就是连接主义这一派的思路,所以这也是神经网络和深度学习所属的流派。所以从最早人工神经元发展到多层感知机,然后发展发展到神经网络,这些学习算法发展到现在就成为了深度学习。

其实行为主义也一直在流行。行为主义的代表算法就是遗传算法。遗传算法是强化学习的一个特例,这一类的算法是模拟人的行动和决策的,人类看到什么事情,会做出什么样的行动。比如,当人类看到前方有障碍物会躲避,那这个从感知到行动的行为,科学家认为如果机器也能像人一样有从感知到行为的映射,那机器就具有了人类的智能,所以叫行为主义。

最后一个流派叫统计主义,这个非常像数理统计这一派的,它其实就是机器学习,因为机器学习的全称叫做统计机器学习。那这一类的流派的科学家就希望系统可以自动地从数据中获得知识,而不需要人告诉他,也就是在数据,也可以叫经验中学习。在经验中学习,其实跟人的学习的过程是很像的。比如监督学习和无监督学习,就很像人类的学习的过程。机器学习通常被划分为监督学习、无监督学习和强化学习。监督学习就类似于老师在说,哪个是正确的哪个是错误的。在这种标签或者老师的监督下,在数据中产生算法,产生模型。监督学习非常适合解决分类或者回归类问题。监督学习就没有老师了,相当于完全自习的状态,所以无监督或者无老师学习,它很适合解决一些聚类的问题,没有明显的标签或者是没有明显的好坏,甚至没有明确的对错的一些问题。比如社交网络里面的一些舆情的信息等等,都可以用聚类来做分析。另外一个就是强化学习,它适合解决的是决策问题,比如说机器人的控制、自动驾驶、下围棋、下国际象棋等等。当然围棋因为它的难度比较高,在 2016 年的时候才被 AlphaGo 解决,但也并不能叫完全解决。

机器学习之后就发展到了神经网络。神经网络根据网络结构可以分为两类,即卷积神经网络和递归神经网络(或循环神经网络)。卷积神经网络更适合于解决空间相关的信号,比如照片。递归神经网络,或者循环神经网络,它适合解决与时间相关的信号,比如语音信号。

深度学习是什么时候得到发展的呢?在 2012 ImageNet 挑战赛里,Alex 提出了一个网络,把深度学习变成了一个参数可调可学习的状态。所以从 2013 年开始,深度学习就蓬勃发展了。但这一个挑战赛最早只在学术界有一定的影响力。什么时候工业界和大众都开始关注到深度学习呢?其实是 AlphaGo 战胜人类之后,但战胜人类的是深度强化学习,但反倒让深度学习火了,这也是非常有意思的情况。

四、像人一样感知——以人脸识别为例

如果让机器实现人脸识别,总共分几步呢?其实有三步就够了。如果要求高的话,就需要有四步。第一步就是做一个人脸检测,先要检测出人脸区域,再去识别。但在检测和识别中间还需要检测关键点。什么叫人脸的关键点呢?比如鼻子、嘴巴、眼睛、眼角、鼻翼、嘴角等等。关键点的作用是因为人脸识别不一定是正对镜头,有可能是侧面,通过关键点就能把偏的人脸矫正,然后通过正的人脸去比对。

解决人脸的检测问题又分几步呢?人脸检测其实最早分为三步,在深度学习的发展之后,人脸检测流程就变简单了。虽然算法变复杂了,但流程呢变简单了,速度也变得越来越快了。现在有一些目标检测叫两阶段检测,例如 RCNN 系列算法。还有一阶段的算法,比如 YOLO,SSD 系列。在深度学习的驱动下,目标检测算法兵分两路,分为一阶段和两阶段。

五、像人一样决策&行动——以自动驾驶为例

就一辆车来说,让 AI 代替驾驶员的过程就是完全代替人的过程。那什么来代替人的眼睛呢?可以是激光雷达,但激光雷达的价格非常高;还有可能是摄像头,比如特斯拉,就不使用激光雷达,只基于视觉的障碍物检测;还可以是毫米波雷达。因为毫米波雷达它测距比较远,价格便宜,所以可以在汽车上装很多个。一般自动驾驶的计算设备就在车的后备箱中,由工控机、GPU 等组成。还包括一些执行单元,比如方向盘、油门等。

那要实现无人驾驶,要解决几个问题呢?第一要解决这种感知问题,比如车道线、障碍物等等。第二还要认知它,克服一些不确定性,增强检测的鲁棒性等等。第三就是决策,看到了障碍物,还要思考该如何规划轨迹。第四就是控制,最后就是执行了。另外,比如说高精度地图、定位感知和 GPS、北斗等等,这些也都是非常重要的环节。

在自动驾驶中,因为获取数据的传感器很多,比如有单目相机、双目相机、毫米波雷达、激光雷达等,这就会涉及到传感器的融合了。其实传感器融合是一个非常传统的科研方向。早期的时候都叫数据融合,但随着科研领域流行词汇的改变,现在更多的称为多模态融合。

其实学习人工智能并不难,想要实现前面提到的目标检测任务,其实只需要十几行代码。元宇宙是未来下一代互联网,是人类未来的数字化生存。元宇宙是一系列技术的“连点成线”,能够带来超越想象的潜力,驱动产品创新和商业模式创新。终极的元宇宙将包含:互联网、物联网、AR / VR、3D 图形渲染、AI 人工智能、高性能计算、云计算等技术,具有改变世界的潜力。如果对元宇宙感兴趣,而又不知道从哪入门,那么从 AI 这个大家公认与元宇宙最相近的方向开始学习是很好的选择。

你可能感兴趣的:(元宇宙背后,你应该了解的人工智能核心技术)