目录
尺度和坐标轴空间的建立是 生物大脑和深度学习的基石
深度学习必须有合适的时空框架, 能容纳特征空间的信息
生物大脑是如何建立时空框架的?
在算法层面, 生物用三角周期函数来做向量算法, 例如做位置的卡尔曼滤波算法
网格细胞生成的理论
仿生算法实现上的困难
具体设计思路
这是绕不开的基本概念,应该引起足够重视.
时间是什么? 空间是什么? 是频率, 是周期? 是多个嵌套的有层级的周期?
深度学习是个筐,什么都能往里装吗?
一旦采用cnn结构,就假设了训练集空间里有稀疏的特征, 和特征在空间上相邻.
一旦采用特征提取+ 生成结构, 就假设训练集空间里有稀疏的特征
为了让网络学习得到, 就要用合适的容器
现在有算法已经在使用 三角周期函数 , 例如transformer 里除了QKV的基本算法, 还有位置信息, 位置信息是多个二进制的三角函数的叠加
现今机器学习网络, 能够很好的拟合定性的特征, 但是在定量学习上, 不太能够学习到 基本的加法和减法, 更不要说更高阶的运算了.
人类非常擅长用数学工具, 建立复杂规则.
如果神经网络里仅仅引入一套这样的系统, 似乎问题不大. 但是引进后如何使用这个系统是个问题.如果在顶层统一引进, 需要每个神经元都与之发生交互规则, 比较消耗资源. 如果在每个神经元或神经元群组都引进一套这样的尺度, 会更加消耗资源,并且如何保持一致性也是大问题.
GPT-3这个模型拥有海量的参数和训练集,也没有能够学会最基本的四则运算.
生物则不然,擅长用非常简单的规则生长出异常复杂的结果.
接下来看看生物是如何优雅地建立维度和尺度关系的.
▼下图, 相同色彩的小圆点代表同一个位置细胞
1971年 John O'Keefe教授 在鼠脑的海马区发现存在一群神经元,只有当动物经过特定位置时才会发放。通过组合的形式,“位置细胞”组成的集群能够以唯一的方式编码环境中的每一位置。
当老鼠位于房间中的某个位置时,某些细胞被激活,而当老鼠移动到另一个位置时,其他细胞也被激活。也就是说,这些细胞形成了房间的内部图。
▼下图左侧, 网格细胞 (红点), 叠加在老鼠运动路线上(黑线)
2005年 Moser教授夫妇 在鼠脑内嗅皮层发现存在一群神经元,当老鼠经过空间中某些点时,就会激活. 形成排列成六边形网格的导航坐标系, 名曰网格细胞。上面说过的位置细胞的主要信号来源于网格细胞的输入。
▼下图, 在硬件方面,在解剖层面, 动物大脑中有专门的位置来安放尺度框架结构. 容纳时空相关的尺度信息.
▼下图, 网格细胞, 包含了金字塔层级算法, 右下角的网格细胞的从上向下,间距逐步加大
内嗅皮层II层的邻近细胞具有相似的间距和方向。它们的间距从内嗅皮层的背侧到腹侧单调增加 ,就像位置细胞的空间尺度从海马体的背侧到腹侧增加一样.
对于空间特征, 人工神经网络在cnn建立框架的基础上, 再用金字塔层级过滤出特征, 保持缩放不变性. 对应的, 生物网格细胞也有层级结构, 但是这里的层级结构似乎只是用来生成尺度缩放的信息.
▼下图, 网格细胞, b图,c图,从左到右, 间距逐步加大
▼下图, 生物 脑中的 卡尔曼滤波算法. 海马中的位置细胞 ,使用两种类型的输入更新位置:位置估计和视觉校准。位置-速度-方向信号集成在这些神经细胞中,此计算过程称为“路径积分”。
果蝇大脑是这样建立时空框架的:
小鼠大脑是这样建立时空框架的:
具体来说,是 用正弦(余弦)波的幅度代表速度(大小), 用相位代表角度.
一维连续吸引子网络 编码了头朝向,二维连续吸引子网络 编码了空间位置,
from 脑中的指南针和环吸引子模型
from 果蝇神经网络向量运算方式
模板作用, 金字塔细胞的分布密度, 大致决定了网格细胞的密度.
吸引子和图灵斑理论中有激活和抑制两种机制在对抗, 一个是广泛的远程抑制作用, 一个是强大但作用距离短的近程激活作用, 当二者在数量级上达到基本均衡就会产生图灵斑.
生物非常擅长自组织结构,用简单规则,生成复杂pattern, 建立复杂功能. 不论是时间还是空间, 似乎都能用 三角周期函数来代表, 真正的实现了时空的大一统.
所以说, 如果不从芯片层级, 从硬件层级去模仿生物脑, 仅从软件方式去模拟, 或者不可行, 或者能效太低以至于接近不可行.
所以, 半机器学习 + 半手动编程的 杂交算法是现阶段理性的选择.
可能采用的一些算法
如果建立了一些基本的概念和框架, 植入了一些先验知识, 网络也许能够学习到数值表示的本质和相应的运算规则
人工智能,能学会加减乘除吗? - 知乎