只服这篇“神文”:基于老子哲学、相对论的超级人工智能模型

作者 | Anonymous authors

译者 | TroyChang

出品 | AI科技大本营(ID:rgznai100)

在此前我们为大家介绍 ICLR 2020 论文投稿情况时,提到了一篇“神作”在论文中作者们提出一个 ASI 概念(Artificial Super Intelligence),在实现 ASI 时构建了一个 Multi-Agent RL 模型,而这个模型结合了广义相对论(General Relativity)和广义达尔文主义(Universal Darwinism)。

之后,AI科技大本营(ID:rgznai100)也一直关注着这篇文章的录用结果,不过结果是被拒绝。听起来如此“高大上”的论文是为何被拒绝的?写这篇被拒绝的论文又是意在何为呢?

和几位 AI 研究者交流过程中,抛开这些是否是民科内容,还是没有严谨的科学逻辑,让人不明觉厉的内容的拼凑,大家都提出了一个共同的质疑:这篇文章提出的模型具体工作是什么呢?在论文根本没有具体的阐述。

 

仿佛今天在对这篇“神文”做过多的评价已经没有过多的意义,很多网友的评论与反应想必已经发出了很多人的心声,在试图学习这篇论文的“深刻内涵”过程中发现,对想法,对实力都是一种考研。

而且还得从哲学、广义相对论、达尔文主义学起:

广义相对论和达尔文主义分别是宇宙和生命的基石。广义相对论概括了狭义相对论,完善了牛顿的万有引力定律,提供了对引力的统一描述,这种引力是时空的几何效应,或者说是时空术语(SpaceTime)。时空的曲率可以模拟重力,并且与存在的任何物质和辐射的能量和动量直接相关。该关系由爱因斯坦域方程式指定。 

达尔文主义是达尔文等人发展起来的一种生物进化论,声称所有生物物种都是通过自然选择,遗传的变异而产生和发展的,这些变异可以提高个人的竞争,生存和繁殖能力。新达尔文主义也称为现代进化综合,表示通过自然选择将查尔斯·达尔文的进化论、自然遗传奠基人格雷戈尔·孟德尔的遗传学理论和数学人口遗传学相结合;通用达尔文主义是将达尔文主义和新达尔文主义扩展到其在地球上生物演化的原始范围之外的多种方法,并以广义形式制定,用于解释物理学、心理学、经济学、文化,医学、计算机科学等其他广泛领域的演化。

 

宇宙、多元宇宙、基因、大脑、经济、游戏、区块链、AI 和 ASI,甚至流体动力学,它们都有一个共同点:在复杂动力学系统中都是非线性的。从图灵、冯·诺依曼、维纳、薛定谔、香农、麦卡锡和明斯基等人提出人/脑与机器/计算机之间相似性的见解,然后沃森和克里克发现了DNA结构之后,人工智能开始了经历了几次繁荣和萧条。

 

然而,即使近些年在深度学习、强化学习、元学习(AutoML和AutoDL),元学习,迁移学习等领域取得了一些进步,它们尝试模仿人类和其他生命系统如何与环境交互以及基于DNN形式的神经网络如何在软件和硬件中实现,高效能的深度强化学习通过各种启发式方法取得了令人瞩目的成就,但在很多情况下,它还是不能完全发挥作用或与现实生活中很好地配合,而作者认为根本原因在于未能为 ASI 建立一致的数学基础,同时能未成功地从生物物理角度去理解ASI的本质。

 

贤者老子的著作《道德经》中曾写道:道生一,一生二,二生三,三生万物。在 2500 年前,提出这一宇宙开始的说法自然是合理的;同期,希腊哲学家毕达哥拉斯相信多元宇宙是由数学方程式支配的,metempsychosis(灵魂的迁徙)派认为灵魂在不同身体间循环是不朽的,但是这些说法到目前为止都还没有证据加以证明,增加的是哲学意义;德国哲学家黑格尔表示:理想的就是现实的,现实的就是理想的,那这些存在于哲学中的理论在现实中被证明的如何了?作者是如何做的?

只服这篇“神文”:基于老子哲学、相对论的超级人工智能模型_第1张图片

在作者从广义相对论、达尔文主义、哲学各论观点到基因与环境的交互等多角度阐述后,提出了他们的观点:人类智能和其他自然智能由先天的基因设计,然后通过学习,与环境的交互得到发展,因此 ASI 也应该通过 Multi-Agent 来完成设计与学习,将上面这些深奥思想集于一身提出一种智能设计方法:扩展广义相对论和达尔文主义来建模 Multi-Agent RL的 ASI 模型。

 

如今,深度学习已应用于与计算机视觉,语音识别,自然语言处理,音频识别,社交网络过滤,机器翻译,生物信息学,药物设计,医学图像分析,材料检查和游戏这些领域,并且产生了优于人类的结果。尽管取得了如此巨大的成功,深度学习工作原理仍然是一个黑匣子,大家不断进行各种尝试来理解深度学习在数学层面上的规则,其中一项重要的工作就是通用近似定理。定理指出,简单的神经网络(例如FNN)大约可以在给定适当的参数和适当的活动函数的情况下表示各种连续函数。但是,它没有解释为什么这些神经网络如何用数学证明可学习性、智能性。

 

在这个工作中通过人工设计解决 AI 和 ASI 中深度学习的黑盒难题,将 HMMMPDRL 视为多元宇宙,不考虑 Multi-Agent 和 Multi-Environment 之间的互斥,重用了基于广义相对论的 4维伪黎曼流形时空模型来完成 HMMMPDRL 的强化学习部分;对 T 对称性进行广义相对论的扩展,替换了 N 维 GeneSpace 中使用的 N 维空间,并为 HMMMPDRL 的深度学习部分建立基于 N 维黎曼流形的 GeneSpace 模型,深度学习架构则用近似HMMMPDRL中非常复杂的由状态-动作空间组成的环境。

 

通过这些方式用人工设计严格地对 ASI 进行建模,作者表明,无论是自然的,人工的还是超人工的智能,它只是由几何化导致的N维GeneSpace的几何效应,为实现理论上的通用设计自动化ASI铺平了道路。当然,我们的多元化努力不会止步于此,会支持我们以您可能想像的各种方式人为地共促进人类文明。

 

强化学习本身可以用数学来解释,深度强化学习并不是用于功能逼近的深度学习的黑盒性质。分层多代理多环境系统(自组织系统)是一个复杂的分层系统,由与多个环境交互的多个交互智能代理组成。分层多代理多环境系统可以解决单个代理或整体系统难以解决或无法解决的问题。包括策略,战术和反应控制在内的层级智能。

 

广义相对论通过概括狭义相对论和牛顿理论,提供了对重力的统一描述,作为空间和时间的几何属性(SpaceTime),它产生了一些惊人的发现,如黑洞,引力波和大爆炸。早期的宇宙,在广义相对论中,没有将空间和时间建模为单独的实体,而是将其建模为4维时空,三个空间维和一个时间维,并且将重力视为这种4维时空的弯曲几何形状的结果。

 

       只服这篇“神文”:基于老子哲学、相对论的超级人工智能模型_第2张图片       

时空的曲率与能量和动量直接相关。爱因斯坦场方程,非线性偏微分系统方程是广义相对论的核心,描述了时空拓扑中的四维伪黎曼流形的几何形状与该时空中包含的能量动量之间的关系。由于本质上是非线性的,因此很难解决,除了在有限条件下的几个已知精确解(例如Schwarzschild解,Reissner-Nordstrom解,Kerr解)之外,这些解中的大多数都是基于基于计算的数值方法的近似值例如采用基于深度学习的方法的摄动或函数逼近。其中一种解决方案是宇宙膨胀。

 

伪-黎曼流形是黎曼流形的推广,其中正定性的要求得到了放宽,度量张量不需要是正定的,而只需要是非退化双线性形式。爱因斯坦流形是一种黎曼流形或伪黎曼流形,黎曼曲率张量根据 LeviCivita 连接 ∇ 通过以下公式给出:R(u,v)w =∇uvv-∇v∇uw-∇[u,v] w。对于每对切线向量,u,v,R(u,v)是流形切线空间的线性变换,它在u和v中是线性的,因此定义了张量,对于流形M上的度量g,流形M上每个点的切向量可分为三种不同类型,

 

爱因斯坦场方程可用于为HMMMPDRL的ASI增强学习部分建模,其列出如下:

 

       只服这篇“神文”:基于老子哲学、相对论的超级人工智能模型_第3张图片      

 

在上面用于HMMMPDRL的Ainstein方程中指出时空(真/准空间动作-时态状态空间)告诉ASI的强化学习如何演示代理智能/计算智能/计划智能/开发智能,以及ASI的强化学习告诉SpaceTime如何弯曲。因此,代理智能/计算智能/计划智能/开发智能被建模为4维时空的曲率。

 

当时间倒转时,系统的行为没有差异时,则表示为T对称。热力学第二定律解释了任何孤立的系统的不可逆性现象,其熵在自然界中不断增加。因此,我们可以对智能基于CPT(电荷,奇偶校验,时间)对称性进行T对称扩展(物理学中最基本的对称性之一),这种扩展利用了黎曼流形的曲率对称性,这是伪黎曼流形缺少的空间对称性的一部分,因为曲率归类保留了黎曼张量。

 

       只服这篇“神文”:基于老子哲学、相对论的超级人工智能模型_第4张图片      

 

       只服这篇“神文”:基于老子哲学、相对论的超级人工智能模型_第5张图片      

 

在上面基于 HMMMPDRL 的 ASI 模型中,深度学习部分的扩展 Einstein 方程指出 GeneSpace 告诉 ASI 深度学习如何演示环境智能/学习智能/试验和错误智能/探索智能,而 ASI 的深度学习部分告诉GeneSpace如何弯曲。因此,环境智能/学习智能/试验和错误智能/探索智能被建模为N维GeneSpace的曲率。

 

我们扩展工作不仅为 ASI 奠定了一致的数学基础,还使解决方案空间可见和透明,也为我们正在进行的降低 ASI 复杂性的工作铺平了道路。无论是离散的还是连续的,确定性的还是随机的,在线的还是离线的,精确的或近似的(有/没有严格的(上下)界限最佳解决方案,对于AI 和 ASI 来说,降低计算和学习的复杂性仍然是巨大的挑战。

 

优化可以分为不同的方法:离散优化(例如整数编程和组合优化)与连续优化;基于梯度的(一阶相对于二阶优化)与约束优化;凸优化与非凸优化。所有问题都可以分为P,NP,NP完全和NP困难。很少有最优/精确但贪婪的算法可以利用特殊结构的优势,必须求助于各种启发式方法,以进行有无复杂度的逼近;同时,在AI和ASI时代,相关性主导因果关系,由于计算复杂性和学习复杂性之间的内在差异不断增加,这些都需要在时间与空间资源之间进行权衡;此外,量子计算不会改变计算复杂性的性质。但是,实现 ASI 并不需要 100% 的计算可处理性,对于棘手的问题,只需要一个可行的解决方案,而不是最佳的解决方案。

 

新科学理论和新技术实践是任何工业革命的两大支柱。很难否认的是,而后者必须从一开始就被大多数人所接受。无论是自然的、人工的还是超人工的,如ASI那样的智能,都是4维时空和N维GeneSpace的几何效应的组合,这是由几何计量引起的,就像广义相对论和普遍达尔文主义,也是与直觉思维相悖的。

 

上面已经在有限范围内对这篇涉猎如此之广的论文进行了简要的介绍,最后总结就是:这篇文章可真是太难了。

(*本文为AI科技大本营编译文章,转载请微信联系 1092722531)

精彩推荐

开幕倒计时 2 天!2019 中国大数据技术大会(BDTC)即将震撼来袭!豪华主席阵容及百位技术专家齐聚,十余场精选专题技术和行业论坛,超强干货+技术剖析+行业实践立体解读。

推荐阅读

  • 陆首群:评人工智能如何走向新阶段?

  • 准备面试题就够了吗?这些内容对考核更重要

  • 一张图生成定制版二次元人脸头像,还能“模仿”你的表情

  • 无需标注数据,利用辅助性旋转损失的自监督GANs,效果堪比现有最好方法

  • 激辩:机器究竟能否理解常识?

  • Instagram个性化推荐工程中三个关键技术是什么?

  • 从YARN迁移到k8s,滴滴机器学习平台二次开发是这样做的

  • 【建议珍藏系列】如果你这样回答「什么是线程安全」,面试官都会对你刮目相看!

  • 985 高校计算机系学生都在用的笔记本,我被深深地种草了!

  • 从拨号到 5G :互联网登录完全指南

  • 你点的每个“在看”,我都认真当成了AI

你可能感兴趣的:(只服这篇“神文”:基于老子哲学、相对论的超级人工智能模型)