【CSDN 编者按】专家通过数据研究,睡眠可防止 AI 失忆。
译者 | 刘春霖 责编 | 张红月
出品 | CSDN(ID:CSDNnews)
神经网络可以在很多任务上有超越人类的表现,但如果要求一个 AI 系统吸收新的记忆,它们可能会突然忘记之前所学的内容。
现在,一项新的研究揭示了神经网络经历睡眠阶段,并帮助预防这种健忘症的新方法。
人工神经网络面临的一个主要挑战是“灾难性遗忘”(catastrophic forgetting)。当它们去学习一项新任务时,会有一种不幸的倾向,即突然完全忘记他们以前学到的东西。本质上,新学到的知识会覆盖过去的数据。
相比之下,人类的大脑能够终身学习新任务,而不会影响其执行先前记忆的能力。在早有的研究表明,当一轮又一轮的学习穿插着睡眠时,人脑的学习效果最好。睡眠显然有助于将近期经历融入长期记忆中。
“重组记忆实际上可能是生物体需要经历睡眠阶段的主要原因之一,”加州大学圣地亚哥分校的计算神经科学家 Erik Delanois 说道。
那 AI 是否可以睡觉呢?此前的一些研究试图通过让 AI 模拟睡眠来解决灾难性遗忘。例如,当神经网络学习一项新任务时,一种被称为交错训练的策略会同时向机器提供它们之前学习过的旧数据,以帮助它们保留过去的知识。这种方法之前被认为是在模仿大脑在睡眠时的工作方式,不断重播旧的记忆。
然而,科学家们曾假设交错训练需要在神经网络每次想要学习新事物时,为其提供最初用于学习旧技能的所有数据。这不仅需要大量的时间和数据,而且似乎也不是真正的大脑在真正的睡眠中所做的事情——生物既不会保留学习旧任务所需的所有数据,睡觉时也没有时间重播所有这些内容。
在一项新研究中,研究人员分析了灾难性遗忘背后的机制,以及睡眠对于预防这种遗忘中的效果。研究人员没有使用传统的神经网络,而是使用了一种更接近模拟人脑的“脉冲神经网络”。
在人工神经网络中,被称为神经元的组件被输入数据,并共同解决一个问题,例如识别人脸。神经网络反复调整突触(神经元之间的联系),并观察由此产生的行为模式是否能更好地找到解决方案。
随着时间的推移(不断训练),网络会发现哪些模式最适合计算结果。最后,它采用这些模式作为默认模式,这被认为是部分模仿了人脑的学习过程。
此图代表了抽象突触空间中的记忆及其在睡眠和不睡眠时的演化
在大多数人工神经网络中,神经元的输出是随着输入的变化而不断变化的数字。这大致类似于生物神经元在一段时间内可能发出的信号数量。
相比之下,在脉冲神经网络中,一个神经元只有在给定数量的输入信号后,才会产生输出信号,这一过程是对真正生物神经元行为的真实再现。由于脉冲神经网络很少发射脉冲,因此它们要比典型的人工神经网络传输的数据更少,原则上也需要更少的电力和通信带宽。
正如预期的那样,当脉冲神经网络学会在网格中发现水平粒子对,然后被训练去寻找网格中垂直粒子对时,它显示出灾难性的遗忘。然而,在之后的几轮学习后,研究人员让脉冲神经网络经过一段时间间隔,参与学习第一个任务的神经元集合被重新激活。这更接近神经科学家目前认为的睡眠过程。
简单来说就是,脉冲神经网络使得之前学习过的记忆痕迹能够在离线处理睡眠期间自动重新激活,并在不受干扰的情况下修改突触权重。
该研究使用带有强化学习的多层脉冲神经网络来探索将新任务训练周期与类睡眠自主活动周期交错,是否可以避免灾难性遗忘。值得注意的是,该研究表明,可以通过周期性地中断新任务中的强化学习(类似睡眠阶段的新任务)来预防灾难性遗忘。
捷克科学院计算机科学研究所的计算神经科学家 Pavel Sanda 表示“有趣的是,我们没有明确地存储与早期记忆相关的数据,以便在睡眠期间可以人为地重放它们,以防止遗忘。”
科学家们发现,他们的策略有助于防止灾难性的遗忘。在经历了类似睡眠的阶段后,脉冲神经网络能够执行这两项任务。他们认为,此项策略有助于保存与新旧任务相关的突触模式。
“我们的工作展现了开发受生物学启发的解决方案的实用性”Delanois 说道。
研究人员指出,他们的发现不仅限于脉冲神经网络。Sanda 表示,即将开展的工作表明,类似睡眠的阶段可以帮助“克服标准人工神经网络中的灾难性遗忘”。
该研究于 11 月 18 日发表在《 PLOS Computational Biology 》杂志上。
参考链接:https://spectrum.ieee.org/catastrophic-forgetting-deep-learning
☞真程序猿?马斯克演示猴子用“意念”打字,更称:6个月后植入人体
☞挑战 Google 搜索?OpenAI 发布最强 AI 对话系统 ChatGPT
☞AIGC , 超级热点 or 程序员创富新起点?