人工智能发展前夜,基于控制论的杂谈

在这里插入图片描述

谢邀。

目录

    • 《What the Frog's Eye Tells the Frog's Brain?》简介
    • 我是怎么理解这篇文章的?
    • 被后世频繁引用的「青蛙」
    • 从「青蛙」再重新转向控制论

《What the Frog’s Eye Tells the Frog’s Brain?》简介

帕斯克在实践和理论中,将人类的适应性行为引入机器,从而无意间将控制论带入了二阶控制论(Second - order cybernetics,由海因茨·冯·福斯特在1970年代提出)。二阶控制论和一阶控制论的区别在于:后者认为观察者独立于被观察的客观系统;前者将观察者也纳入被观察的系统一同研究,将控制论研究世界的方法应用于研究控制论自己,被福斯特称为“控制论的控制论”,出现了“大脑被要求写出关于大脑的理论”的递归状态。所以二阶控制论认为不存在绝对的客观对象,观察者和被观察系统相互影响,并且引入了“具身经验”的概念。帕斯克将人纳入到反馈回路之中,认为智能产生在互动的适应性行为之中,而非像一阶控制论学家一样,仅仅制造一个能模仿人类行为(智能)的机器,例如格雷·沃尔特(Grey Walter)的Tortoise机器人。
如今看来,帕斯克的机器远不够精巧,但其理念中对不同系统间差异的有意模糊,潜藏了“人≈机器”的视角。这后来被当做控制论世界观/本体论的重要特征,并且很容易招来诘问:“这难道不是将人和机器等同视之,贬低为一个反馈机器?”

控制论对人的定义与生物学很接近,不同的是控制论关心的不只是肌肉记忆或神经反射,还有大脑如何认知世界。相信很多人都对青蛙的反射实验并不陌生,这揭示了生物电和神经反射的存在,其实有关青蛙的实验在控制论中也具有举足轻重的地位。1947年,梅西基金会会议主席沃伦·麦卡洛克(Warren McCulloch,计算神经科学开创者)在会议上发表了一篇关键的论文《青蛙的眼睛向青蛙的大脑显示什么?》(What the Frog’s Eye Tells the Frog’s Brain?)。他和团队研究了青蛙的视觉神经系统,证明青蛙视网膜向大脑输出的信息经过了系统构造的再组织,导致青蛙对具备某类视觉特征的物体(例如飞行的昆虫)更为敏感:

  1. 局部的清晰边缘和反差;
  2. 黑暗物体的边缘曲率;
  3. 边缘的移动;
  4. 由移动或快速的整体变暗产生的局部变暗。

因此青蛙的视觉系统不是在反映世界,而是在构建现实。有趣的是,该论文在1959年刊登在 《无线电工程师学会期刊》(Proc. Inst. Radio Engr. 1959)上,而非生物学期刊。随后他和沃尔特·皮茨(WalterPitts)提出了三维神经网络(Nervous Net)模型,用来识别视觉输入, 可以看做是现在卷积神经网络的雏形。 麦卡洛克、皮茨和维纳并称为控制论的黄金三角。三人各自的研究与控制论的关系是另一个庞大的话题,在此不多展开。

对于是否要将论文中得出的最终结论引申到人类的大脑以及思维,麦卡洛克持着非常谨慎的态度。不过后面几次梅西会议上,其他学者逐渐将其发展为后续研究重要前提:我们所知道的现实并非完全客观,而是被我们的生理结构塑造过的。我们对世界的认知和智能都由此决定。反之,那些与人类不同的其他物种不是没有“智能”,只是表现形式不同而已。没有哪一种存在仅仅是一种纯粹的“反馈机器”,它们都是在适应被自己的生理结构所认知的环境/世界。某种程度上,人类无法只通过数据和实验等“科学方法”完全认知另一种存在,因为这些方法很难帮助人类切身感受另一种看待世界的角度。

维纳想要皮茨将他的大脑模型改造得更加接近现实一些。虽然皮茨和麦卡洛克的成果已是很大的进步,但是他们的工作却几乎没有在大脑科学家中激起任何浪花。一部分的原因是他们所使用的符号逻辑很难解释清楚,另一部分原因是他们朴素且过分简化的模型并没有反应出生物学大脑的整个杂乱程度。但维纳明白他们所做这些的意义,知道一个更现实的模型将会改变整个游戏规则。他也认识到要开启他梦寐以求的控制论革命的话,皮茨的神经网络必须要有在人造机器上实现的可能性。维纳认为皮茨如果想要建造一个拥有1000亿个相互连接的神经元的真实大脑模型的话,他还需要统计学的配合。而统计学和概率论正是维纳的专业领域。毕竟是维纳发现了信息的准确数学定义——概率越高,熵就越高而内容就越低

当皮茨开始了在MIT的工作,他发现虽然遗传学要对整体的神经特征负责,但是我们的基因没有办法决定大脑中数万亿个的神经突触连接——所需要的巨大的信息量是无法维持的。他认为,情况一定是我们一开始得到的是随机的神经网络——概率最高的状态,包含可以忽略不计的信息量(这种观点的辩论一直持续至今)。他怀疑随着长时间对神经元阙值的调整,这种随机性会渐渐让位于有序性,而信息就涌现出来了。他着手用统计力学来为这个过程建模。维纳激动的鼓励他,他知道如果将这样一个模型植入一台机器的话,它就将能够「学习」。

我是怎么理解这篇文章的?

首先我依照论文本身,对文章按照总分结构,先给你做一个全文的梳理:

  • I. 引言和背景
    A. 介绍青蛙视觉系统作为研究对象的背景和重要性
    B. 引出研究问题:青蛙眼睛对大脑传递了哪些信息?

  • II. 方法和实验设计
    A. 描述使用的实验方法,包括使用微电极记录神经元活动
    B. 详细解释研究对象——视网膜神经节细胞的特性和功能
    C. 说明如何进行视觉刺激以触发神经元的活动,并记录其响应

  • III. 视网膜神经节细胞的响应模式
    A. 揭示不同视觉刺激对神经元的影响
    B. 阐述边缘、方向和运动等刺激对神经元活动的影响
    C. 强调不同刺激导致的不同响应模式,即神经元的编码方式

  • IV. 视觉信息的解读和理解
    A. 讨论神经元响应模式与外部环境信息之间的关系
    B. 提出视网膜神经节细胞的活动模式可视为对外部环境信息的编码方式
    C. 强调大脑通过解读神经元活动模式来识别和理解外部世界

  • V. 论文的意义和影响
    A. 概述论文对神经科学的贡献和基础奠定
    B. 强调论文对计算机视觉和人工智能领域的启发
    C. 总结论文对感知和认知过程的理解提供的重要线索

这篇论文探讨了青蛙的视觉系统如何处理和解释来自外部环境的视觉刺激。在论文的研究过程中,使用了一种被称为青蛙视网膜神经节细胞(retinal ganglion cells)的细胞类型来研究青蛙视觉系统的工作原理。研究人员通过记录和分析这些神经元在对特定视觉刺激的响应过程中产生的电信号,揭示了青蛙眼睛和大脑之间的信息传递方式。

按论文表述,他们的关键发现与结论是,青蛙的视网膜神经节细胞对于外部世界的信息进行了特定类型的编码。研究人员发现,这些细胞对于不同的视觉刺激,如边缘、方向和运动,会产生特定的响应模式。通过这些特定的响应模式,青蛙的大脑可以解读和理解环境中的视觉信息。在这项研究中,Lettvin等人使用了青蛙的视觉系统作为研究对象,特别关注了位于青蛙视网膜上的视网膜神经节细胞。这些细胞是视觉信息处理的起始点,它们接收来自视网膜上的感光细胞的输入,并将其转化为电信号传递到大脑。

通过使用微电极记录,研究人员能够测量和分析视网膜神经节细胞的活动。他们发现,这些细胞对于不同的视觉刺激呈现出不同的响应模式。这些刺激包括边缘、方向、运动等。例如,某些细胞对于特定方向的边缘刺激会显示出更强烈的活动,而对于其他方向的刺激则响应较弱。于是,研究人员提出了一个假设,即视网膜神经节细胞的响应模式可以被视为对于外部环境的信息编码方式。这意味着细胞的活动模式可以传递关于环境中不同特征的信息,而大脑可以通过解读这些模式来识别和理解外部世界。

这项研究的重要性在于它揭示了神经元在视觉系统中的编码方式,并提供了对于感知和认知过程的一种基本理解。它为后续的神经科学研究奠定了基础,并对计算机视觉和人工智能领域产生了影响。

我们现在去回看这篇文章,在计算机视觉NLP领域,这项研究启发了一些关于如何设计和构建视觉系统的算法和模型。例如,研究人员开始尝试使用类似于青蛙视网膜神经节细胞的编码方式来处理图像,以实现更有效的图像识别和理解。

总结的话,这篇论文通过研究青蛙的视觉系统,揭示了神经元如何编码和传递视觉信息的原理。它为我们理解视觉感知提供了重要线索,并对神经科学、计算机视觉和人工智能领域的进展做出了贡献。

被后世频繁引用的「青蛙」

前几年,在基金委SOC专项支持下,东南大学王志功教授通过所谓“微电子神经桥”和3G无线互联网传输技术,探讨集成电路是否可以传递神经信号,实现了千里之外两只蟾蜍坐骨神经信号的互通和两条腿的互感互动。IEEE有一个生物医学工程学会,研究用电子工程的原理和装置有助于解决生物和医学方面的问题。这些都是所谓逆向工程,就是功能已知,研究其原理和实现。已有一个集成电路,拆开来,反过来进行设计和制造。这是逆向工程。而已知生物的某些功能,研究它是怎么实现的,这对人类了解自己、医疗及医疗设备的研制有重大意义。这个工作不像基因排序、蛋白质分析那样,发表影响因子20、30的SCI非常理论的论文,而是很有针对性的解决实际问题。神经感知和神经活动的逆向工程是神经工程的主要部分,也是神经系统和康复工程的主要组成部分。神经系统能够通过学习和重新连接达到神经自适应的效果。这种神经自适应性,就像60年代计算机科学家没想到电源消耗是个大问题一样,是近年来重要的发现。(科学网 闵应骅的博客)

从「青蛙」再重新转向控制论

研究生命体、机器和组织的内部或彼此之间的控制和通信的科学。英文cybernetics一词源于希腊文κυβερνητηζ,原意为“掌舵人”,转意为“管理人的艺术”。法国物理学家和数学家A.-M.安培1834年曾用这个名词称呼管理国家的科学。美国数学家维纳创立控制论时采用这个名词,一方面借此纪念英国物理学家J.C.麦克斯韦1868年发表的论述反馈的论文《论调速器》(On governors),governor一词就是从希腊文“掌舵人”讹传而来的;另一方面船舶的操舵机曾是早期的一种通用反馈机构。(百度百科 控制论)

控制论在一开始就作为一个广义名词,却狭义的在某一细分领域被使用并重新定义。该词汇由来已久,却在不同的领域都有控制论名词的存在。维纳在计算机领域有了卓越的研究成果,他认为自己的研究开创了一个新的领域,而新领域的代称需要有个响亮的词汇,但也要恰如其分。他选择cybernetics,参考了希腊文κυβερνητηζ,也借用这个词的由来,意为:“在驾驶船舶时,舵手根据观察到的效果不断调整转向,从而在不断变化的环境中保持稳定的航向”,这种反馈,也很好的诠释了维纳控制论的核心理论,即一种复杂的可研究的反馈机制,他原文的表述是 「Wiener introduced the neologism cybernetics to denote the study of “teleological mechanisms” and popularized it through the book Cybernetics: Or Control and Communication in the Animal and the Machine.」

再进行向下的延申,就要涉及到不同条线的控制论研究了。控制论使系统能自动按照人们预定的程序运行,最终达到最优目标,在自动控制、通讯技术、计算机科学、数理逻辑、神经生理学、统计力学、行为科学等多种科学技术相互渗透形成的一门横断性学科。维纳伟大的著作也是这样起名,《控制论——关于在动物和机器中控制和通讯的科学》。


联系我 交流请署名

你可能感兴趣的:(TD_BrainStrom,人工智能,概率论,算法)