本文作者Tim Urban:
Wait but Why的作者Tim Urban 是埃隆马斯克(特斯拉/SpaceX创始人)强烈推荐的科技博主。他写的AI文章是全世界转发量最高的。他的粉丝还包括:Facebook创始人马克扎克伯格,Facebook COO谢丽桑伯格等。Tim也是TED演讲平台上有史以来最受欢迎的演讲者之一。
在一个由人工智能和“其他所有生物”组成的未来, 人类只有一条出路:“变成人工智能”。
本长文作者是Tim Urban,之前大热的文章《为什么有很多名人让人们警惕人工智能》也是出自他手,英文原文刊载于waitbutwhy.com。本翻译版本由谢熊猫君提供,全文共六万字。两百余张图片,分成六个章节,将分成六篇推送完成。
第一章:人类巨灵 (约7000字)简述人类语言、智能和人类巨灵的崛起
第二章:大脑 (约8000字)简述大脑结构,为了解脑机接口提供基础知识
第三章:脑机接口(约12000字)讲述脑机接口的基本原理和目前的技术水平
第四章:挑战(约8000字)讲述目前脑机接口跨越到全脑接口所要面临的挑战
第五章:魔法纪元(约13000字)全脑接口实现后未来的人类会是怎样
第六章:大融合(约10000字)人类唯一的出路:变成人工智能
本次推送是总过五篇推送中的第三篇《脑机接口》,本文预计阅读时间10分钟,建议先收藏。
03第三章
脑机接口
首先,让我们回到公元前五万年,绑架一个人,然后把他带回2017年。
这位是老王。老王,我们很感谢你和你的伙伴们发明了语言。
为了感谢你,我们想带你看看你们的神奇发明所带来的成果。
然后我们带老王看一下飞机,然后看一下潜水艇,然后去一下迪拜塔的楼顶。然后我们在看看望远镜、电视机和iPhone。然后我们再让老王玩一下互联网。
好啦,老王你觉得怎样?
呵呵,我们猜到你会被这一切吓尿的。好了,最后,让我们给你展示一下我们现在是怎么互相沟通的。
老王会被人类学会语言后发明的这些“魔法”所震惊,但是当我们真的用语言和彼此交流的时候,好像与老王那个时代的人彼此交流没什么差别。当人们说话沟通的时候,他们其实是在使用已经有五万年历史的技术。
同样的,在一个充满了神奇机器的世界,造出这些机器的人类日常的身体和老王那个时代的人的肉体也没啥区别。为啥会这样呢?
这就是为什么脑机接口这个神经工程学的子领域(神经工程学本身是生物技术的一个子领域),会是一个这么充满诱惑的产业。我们用我们的技术反复征服了这个世界,但是对于我们最核心的工具“脑”,整个技术世界好像没有什么建树。
所以我们还在用老王那个时代就发明的技术“语言”在交流,所以当我写这段话的时候,我的打字速度大概是我思考速度的二十分之一,也是为什么大脑疾病对人们生活造成很大的困扰和影响。
但是在发明语言五万年后的今天,这一切也许就将改变。脑的下一个大跃进,可能就将在它自身体现。
脑机接口有很多种,各自会有不同的功能。不过所有脑机接口领域的人,基本上都是在以下两个问题上努力:
1)我怎样把正确的信息从大脑里取出来?
2)我怎样把正确的信息发给大脑?
问题一是关于接受大脑的输出——记录神经元的话
问题二是关于把信息传入大脑的神经流,或者改变神经流,也就是关于刺激神经元。
这两样事情本身是在你的大脑内自然发生的。现在你的眼睛正在做一些水平运动,使得你能看完这句话。这就是大脑的神经元把信息输出给机器(也就是你的眼睛),而机器收到了这些信息,做出了适当的反应。而随着你眼睛的移动,光子进入你的视网膜,刺激枕叶里的神经元,使得这些字的图像进入你的思想。这个图像又刺激了大脑其它部位的神经元使得你能处理储存在这些图像里的信息,进而了解这句话的意思。
输入和输出信息是大脑神经元的本职工作,脑机接口领域就是想参与到这项工作里面去。
粗看,这个事情好像不怎么难。大脑不就是是个果冻球嘛,而皮质不就是块餐巾嘛。而且这块餐巾还很巧的就在脑的最外层,很容易就接触到。皮质里面有大约200亿的神经元,如果我们能学会这200亿个神经元的工作方式,与它们合作,就能让我们从更高的高度掌控我们的生活、健康,以及这个世界。
我们能做到吗?虽然神经元很小,但是我们连怎样拆开一个原子都知道,神经元的直径可是有原子的十万倍大呢。如果原子是一个玻璃球大小,那神经元的直径类比之下应该是一公里,所以尺寸应该不是问题对吧?
所以问题究竟是啥?
好吧,上面这段逻辑其实是有可取之处的,正因为这段逻辑中的那些想法,这个行业有着很大的前景。
但当你能够真正理解大脑内发生的事情的时候,你才会意识到搞懂这一切可能是人类能做到的最难的一件事。
在我们开始谈论脑机接口之前,我们先来仔细看看这些试图制造脑机接口的人面对的困难吧。最好的解释方式就是先把大脑放大一千倍来看看。
回到我们的皮质餐巾的方式吧。
如果我们把这块餐巾放大一千倍,那么餐巾大概是六个曼哈顿街区见方,你绕着四周走一圈大概要花25分钟。而脑本身大概会占据一个两个街区见方的空间,大概和麦迪逊广场花园差不多。(注:此处指长度和宽度与麦迪逊广场花园,放大一千倍的脑的高度应该是麦迪逊广场花园的两倍高。)
那我们就把大餐巾和脑铺到曼哈顿吧。住在曼哈顿的几十万人大概是不会介意的......吧
我选择一千倍这个倍率,一是因为计算方便,每一毫米的脑现在就相当于一米,而每个神经元现在大概相当于一毫米;其次,皮质这个时候就很符合人类尺寸了,原本只有二毫米的皮质,现在和一个二米高的人一般了,也就是说这块餐巾现在是二米厚。
现在,我们从这块餐巾里面切出一块一立方米的方块来研究一下,帮助我们理解一立方毫米的皮质中所发生的事情。
我们在这一立方米的皮质中会看到一团糟,我们先把里面的东西倒出来,然后再逐一放回去。
首先,我们把神经元的胞体们放回去。
胞体的大小各异,神经科学家们表示皮质里的神经元的胞体直径一般是10-15微米,也就是说如果把7-10个神经元胞体排一列,这一列的长度大概会有头发丝的直径一般。在我们放大一千倍的世界里,胞体的直径大概是1-1.5厘米,和玻璃球差不多。
整个皮质的体积大概是50万立方毫米,这个空间中存在着约200亿个神经元胞体,也就是说每立方毫米大概存在四万个神经元。所以,我们的一立方米的方块中大概有四万个玻璃球。如果我们把一立方厘米的方块均分成四万份,每一块约是三厘米边长的小立方体,胞体就存在与每个小立方体的正中间,与周围其它胞体的距离也正好是三厘米。
至今为止还听得懂吗?此时你的脑中是否能够想象出一个一立方米的方块,里面悬浮着四万个玻璃球?
下图是胞体在皮质中的显微镜照片。
目前为止问题还不大。可是胞体只是神经元的一小部分,从每一个胞体出发的是弯曲分叉的触突,在我们放大一千倍的世界里,这些触突会向不同方向伸展三到四米,而和触突接触的轴突可能有一百米长(轴突可能要直接延伸到皮质的其它部分),甚至一千米长(一些触突可能要直接到达脊髓或者身体其它部位)。而每个触突、轴突都只有一毫米厚,这些线状物把皮质变成了一团杂乱又无法解开的毛线球。
而这团毛线球里面有很多事情在发生。每个神经元会和上千个甚至上万个其它神经元接触。整个皮质里面的200亿个神经元,组成了大概20兆(20,000,000,000,000)个神经连接,而整个脑里面的神经连接可以多达千万亿个(1,000,000,000,000,000)。在我们手头的一立方米方块中,大概会有2000万个神经连接。
还不止如此,我们的四万个玻璃球不只每个都会伸出多根毛线,还有成千上万的来自皮质其它部位的毛线会穿过我们这个方块。也就是说,如果我们试图去记录我们这个立方米方块里的信号的话,会遇到很大的阻碍,因为在一堆毛线球面前,很难分清楚哪些毛线源自这个立方米方块里的玻璃球。
当然,不要忘了神经可塑性这个东西。每个神经元的电压是会不断变化的,每秒钟可以变化数百次。而我们的立方米方块里那几千万个神经连接是会经常改变大小、消失或者出现的。
这还没完呢。脑里还有一种叫做神经胶质细胞的东西,胶质细胞有很多类型,承担很多不同的功能,比如清扫神经连接释放出来的化学物质,或者把轴突包裹在髓鞘里,以及充当脑的免疫系统。下面是几种常见的胶质细胞:
皮质里有多少胶质细胞呢?大概和神经元数量差不多。所以我们要往我们的立方米方块中再加四万个这些奇形怪状的东西。
最后,还有血管。每立方毫米的皮质里,有大概一米长的毛细血管。也就是说在我们的立方米方块里有一千米长的血管,看起来大概是这样的:
神经科学界有一个了不得的项目叫人类连接组计划。项目里的科学家在试图创建整个人脑的详细地图,在此之前从没有这样规模的人脑图谱工作。
这个项目把人脑切成了不可思议薄的切片,每片大约30纳米厚,也就是一毫米的三万三千分之一。
项目中产生了很多好看的代表轴突的丝带图。
人类连接组计划帮助人们从视觉上理解脑内是有多么的拥挤和繁杂。下面展示的是一小片小白鼠脑里面包含的东西(还不包括血管哦) :
上图中,E是整个切片的样子,F到N是组成E的不同部分。
所以我们的立方米方块非常拥挤,电荷乱飘,而且无比复杂。然后,让我们提醒自己,这个立方米方块里面的一切,在现实的脑里,只是一立方毫米而已。
而脑机工程师们要做的是搞清楚那一立方毫米里的胞体传递的信息是什么,或者用正确的方法刺激正确的胞体,来达成工程师们想要的目的。
祝这些工程师们好运吧。
即使在一个完全平铺开,并且被放大一千倍的皮质餐巾是,做这一切都无比困难,而事实上,这块餐巾是深深的折叠在麦迪逊广场花园上面的。只有不到三分之一的皮质是露在脑的表面的,大部分的皮质都被埋在深深的折叠之中。
而且,工程师们可不是在一些被取出来的脑上工作,这些脑可是被俄罗斯套娃般一层层掩盖起来的。如果把头骨放大一千倍,就有七米厚。而且大部分人是不愿意让你打开他们的头骨来研究的,工程师的工作得尽量无创。
然而以上说的这些,都是假设我们是研究皮质而已。而很多的脑机接口研究,都是研究更深层的结构,假设你站在麦迪逊广场花园顶部的话,这些研究专注的是表面往下50-100米的东西。
更不要忘了,我们的立方米方块,只是皮质的五十万分之一而已。如果把这五十万个立方米方块排成一直线,大概能从曼哈顿排到五百公里外的波士顿。走完这段路程要花100多个小时,在这整段路程里,你随时停下来,身边都会有一个复杂无比的立方米方块。这所有所有的复杂加起来,就是你的脑里正在发生的事情。
我现在确实很庆幸不用为这样复杂的事情操心
那么科学家和工程师是怎么面对这些问题的呢?
他们用他们现在有的工具来尽量做到最好,这些工具用来记录神经元信息,或者刺激神经元。
根据现在的工作进展,有三个标准用来衡量记录工具的优劣:
1)规模——能记录多少神经元
2)分辨率——工具收集到的信息有多细。分辨率有两种,空间性(记录的信息能多准确的反应单个神经元的动向),以及时间性(能够多准确的确认所记录行为发生的时间)
3)创伤性——是否需要手术,如果需要,到什么程度。
远期的目标是能够同时达成三个目标。不过,现在的情况基本是“哪一个或两个标准我们愿意完全舍弃”。工具之间不是简单的升级和降级,而是权衡取舍。
我们来看下目前使用的一些工具:
功能性磁共振成像(fMRI)
规模: 高,能展示全脑的信息
分辨率: 空间性中低,时间性非常低
创伤性: 无创
fMRI通常不是用来做脑机接口研究的,但是它本身是个很好的记录工具,它能够给你提供脑内正在发生的事的信息。
fMRI使用磁振造影技术。二十世纪七十年代发明的磁振造影技术,是X光CT的升级。磁共振不用X光,而是用磁场(以及其它电波和信号)来生成身体和脑的影像。
挺厉害的技术。
fMRI使用磁振造影追踪血液流动的变化。为什么要这么做呢?因为当大脑的特定部位变得活跃的时候,那个部位就需要更多的能量,也就需要更多的氧气,所以那些部位的血流会增加来传递更多的氧气。fMRI的扫描是这样的:
当然,大脑的各处时刻都有血液流过,这张图显示的是血流增加的部分(红橙黄)和减少的部分(蓝)。因为fMRI扫描的是整个大脑,所以结果是3D的。
fMRI有很多医学应用,比如告知医生病人中风后脑的各个部位是否运行正常。它也教会了神经科学家很多东西,包括大脑的哪些区域参于哪些功能。fMRI扫描也能帮助提供整脑在给定时刻的整体情况,并且很安全,而且完全无创。
一个大的缺陷是分辨率。fMRI扫描和电脑屏幕一样是有个实际的分辨率的,只不过像素点是3D的。
随着技术的进步,fMRI的像素点也在缩小,不断提高空间性分辨率。现在的fMRI像素点能够小到约1立方毫米。脑的总体积约是一百二十万立方毫米,所以一台高性能的fMRI能够把脑细分成一百万个小方块。问题在于,在神经元的级别上,这还是太大了,每个像素点包含了成千上万的神经元。所以fMRI展现的,最好也就是每四万个左右神经元区域的平均血液流量。
更大的问题是时间性分辨率。fMRI扫描血液流量,这是很不准确,并且有大概一秒的延迟。一秒对于神经元来说是个太长的时间了。
脑电图描记器(EEG)
规模: 高
分辨率: 空间性非常低,时间性中高
创伤性: 无创
EEG有将近一个世纪的历史,而它其实就是在头上摆好多电极的那个东西:
对于一个2050年的人来说,EEG肯定是个很原始的科技了,但是现在来看,它是仅有的能够无创的和脑机接口合作的工具之一了。EEG记录大脑不同区域的电活动,然后把结果像这样呈现出来:
EEG图能够获取关于癫痫等疾病的医学信息,追踪睡眠规律,或者用来确认麻醉剂的效果。
不过和fMRI不同的是,EEG的时间性分辨率很好,能够即时的获取脑内电信号的产生。当然头骨对于时间性分辨率的准确性还是会有一定影响,因为骨的导电性不好。
EEG的主要弱势是空间性分辨率,在这方面EEG基本谈不上分辨率。每个电极只是记录一个很粗略的平均值,所有这个电极覆盖范围内的数百万到数亿个神经元的电量的矢量总和,而这个值还是受到了头骨影响后的。
如果把大脑想象成一个棒球场,每个神经元是现场的一个观众,而把我们想要从脑获取的电信息类比成每个观众的声带的振动。在这样的情况下,EEG的效果就好像放在棒球场外的一堆麦克风,透过棒球场的外墙,麦克风可以听到观众的欢呼声,并且能够大致推断出他们为什么在欢呼。你甚至能够从一些蛛丝马迹中听出两队正在交换攻防,或者比分是否咬的很紧,你甚至能够察觉到是否有不寻常的事情发生。
但也就止步于此了。
脑皮层电图描记法(ECoG)
规模:高
分辨率:空间性低,时间性高
创伤性:有创
ECoG和EEG类似,同样是利用表面电极的,只不过它是把电极放到了头骨下面,直接放到了脑的表面。
听这样的描述是不是有种说不出来的恶心?但是这个做法很有效,至少比EEG有效很多。没有头骨的干扰,ECoG能够获得更高的空间性分辨率(精确到1厘米)和时间性分辨率(精确到5毫秒)。ECoG的电极可以被放置于硬脑膜上方或者下方。
用回我们上面的棒球场的比喻。ECoG用的麦克风在球场里面,而且离观众比较近,所以获得的声音也比EEG从球场外获得的声音更加清晰,并且ECoG麦克风能够更好的区分各个独立区域的观众声音。
但是这种改进是有代价的,ECoG需要在有创手术的前提下操作。当然,在有创手术的领域,这还不是很糟糕,一个神经外科医生的曾这样跟我描述:“你能够相对不那么有创的把东西放到硬脑膜下面,虽然还是要先在头上钻一个洞,但是相对来说创伤不大。”
局部场电位(Local Field Potential,LFP)
规模:低
分辨率:空间性中高,时间性高
创伤性:非常有创
从LFP开始,我们不再用表面电极,而是用微电极了,微电极就是外科医生扎进脑里面的小针头。
脑外科医生Ben Rapoport跟我描述过他的父亲,一位神经学家,曾经是怎样制造微电极的。
“我父亲需要造微电极的时候,都是手工做出来的。他用的都是直径只有10-30微米的非常细的金线、铂金线或者铱线,把这些细线塞进直径只有1毫米左右的玻璃毛细管中,然后他会把这块玻璃管放在火焰上烤软,然后他把玻璃管拉长到玻璃边的非常薄,把这时候的玻璃管从火焰上移开,然后敲碎。
这时候的玻璃管内部就紧贴着里面的细线了。玻璃是绝缘体,而细线是导体,于是完成品就是一个有玻璃绝缘外层的坚硬的电极,电极的尖头只有几十微米粗。”
现在,虽然有些电极还是手工做出来的,但新技术已经能够利用硅晶元做原材料,制作工艺也是借鉴了集成电路产业的做法。
LFP的做法很简单:把这些超级细的带有电极头的针插入皮质1-2毫米,这样每个电极就能收集到附近一定范围内的神经元电量的平均值。
LFP拥有fMRI般还可以的空间性分辨率,同时又具有ECoG的高时间性分辨率,在分辨率这个角度来看算是鱼和熊掌兼得了。可惜在其它标准上做的还是比较糟糕的。
与前面提到的fMRI、EEG和ECoG不用,微电极LFP的规模性很低,它只能采集电极附件一小块区域的信号,而且LFP的侵入性非常强,它实际上已经进入了脑的内部。
用回棒球场的比喻的话,LFP就是一个悬挂在单块座位上方的单个麦克风,它能采集到那块区域的声音,甚至有可能时不时采集到单个观众的声音,但是大部分时间还是只能获得一个大概。
这个领域最新的进展就是多电极阵列技术,本质和LFP一样,区别是它会在单个皮质区域(大约4毫米见方)同时使用上百个LFP。
单细胞记录(Single-Unit Recording)
规模:非常小
分辨率:非常高
创伤性:非常有创
在使用LFP的时候,为了能够收集到较广的区域,电极的头是略微磨圆了的,这样能够让电极的表面积更大,把电阻降低(注:此处使用“电阻”便于读者理解,实际的技术称呼并不是电阻)。这样能让更大范围内的弱信号都能被收集到,结果就是电极这个麦克风会收集到附近区域的大合唱。
单细胞记录同样使用针状电极,但是把电极头磨的非常锋利,来大大提高电阻。这能够阻绝大部分的噪音,使得电极几乎采集不到任何东西,直到电极和一个神经元非常接近(大约相距50微米左右),在这个距离下神经元的信号足够强,所以能够越过电极头的高电阻。因为能够收集到单个神经元的信号,并且没有背景噪音,这个电极现在能够用来窥视单个神经元的“隐私”。这是最小的规模,也是最大的分辨率。
有些电极技术则是更近一步,采用了一种叫膜片钳的技术。膜片钳直接去掉了电极头,只留下个叫作玻璃微量吸管的小管子。膜片钳会把神经元的细胞膜的一小块吸进管子里,来达到更准确的测量。
不同于上面提到的所有方法,膜片钳还有个优势,那就是它和神经元产生了物理接触,所以它不但能够记录,还能刺激单个神经元,比如通过输入电流或者控制电压来进行一些测试。其它的方法虽然也能刺激神经元,但是只能批量的做。
最后,还有些电极能够直接穿过神经元的细胞膜,更进一步的侵入神经元,这种技术叫作尖锐电极记录。只要电极头足够尖,就不会损伤细胞,因为细胞膜会在电极周围闭合。这使得刺激神经元和记录神经元内外电压差变得非常容易。不过这种技术的使用时间有限,一个被刺穿的神经元是存活不了太久的。
在我们的棒球场比喻里,单细胞记录是个挂在一位观众衣领上的指向性麦克风。膜片钳就是一个在观众喉咙里的麦克风,它能够记录声带的每个动作。这种技术能够很好的记录这个观众在球赛现场的体验,但是却记录不到任何背景信息,并且你无从得知这个观众的声带发出的声音和动作,和球场上正在发生的事情是否有关。
以上就是我们目前常用的所有技术手段了。这些对我们来说是难以置信的先进,但是对于未来人类来说,可能又像石器时代技术一样原始——必须在分辨率和规模之间做取舍,而想要真正高质量的读取和写入大脑信息,居然要打开头骨。
我们已经有的脑机接口
虽然这些工具有它们各自的局限,但是它们已经帮助我们了解了很多关于大脑的知识,并且帮忙创造出了一些神奇的早期脑机接口。以下我们来看看我们已经有的脑机接口吧
1969年,研究员Eberhard Fets把一只猴子脑中的一个神经元连接到了这只猴子面前的仪表转盘上。当这个神经元触发的时候,仪表转盘就会动。每当猴子的思考触发了那个神经元,使得转盘转动的时候,它就会获得一个香蕉味嚼片作为奖励。
经过一段时间后,为了获得更多的嚼片,猴子变的很擅长玩这个游戏了。这只猴子学会了怎样让那个特定的神经元触发,并且不经意间成为了第一个脑机接口的使用主体。
之后的几十年,这个领域的进展很慢,不过到了90年代中期,进展开始出现。从那时开始,这个领域一直在默默发力加速发展。
因为我们对于大脑的理解,以及我们的电极设备都还比较原始,我们一直以来所作的努力都是集中在建设与我们理解最透彻的大脑部位的接口,比如运动皮质和视觉皮质对应的接口。
同时,因为人体实验只有在那些想要通过脑机接口来对抗残疾的人身上才真的有可操作性,并且目前的市场需求也是这个方向,所以我们至今为止的努力也几乎完全是关注于恢复残疾人士的受损能力上面。
未来那些会给予人类魔法超能力并且改变世界的大型脑机接口产业,目前都还在孕育阶段。我们现在可以先看看他们在做的事情,来体会一下2040年,2060年或2100年的世界可能会有多神奇。
比如,我们来看下这个:
这是图灵在1950年建造的电脑,它叫作Pilot ACE,在当时真的是尖端科技。
再看看这个:
在读下面的这些例子的时候,我希望你能够一直做下面这个类比:
Pilot ACE 之于 iPhone 7
就好像
这个脑机接口 之于 ________
然后在做这个类比的时候,想想空格处的东西会是怎样,我们会在后面再来讨论空格处的东西。
根据我所读到的,和与这个领域的人讨论到的,目前脑机接口领域主要有三个大类的工作方向:
早期脑机接口类型一:把运动皮质变成遥控器
早期脑机接口类型二:人造耳朵和人造眼
早期脑机接口类型三:深脑刺激
早期脑机接口类型一:把运动皮质变成遥控器
防止你忘了几千字前的内容,运动皮质是下面这个:
脑的所有部位对我们来说都是天书,但是运动皮质稍微不那么难懂一些。更重要的是,它和身体各部位的对应关系很好,也就是说运动皮质的特定部位是对应特定身体部位的。(还记得前面那个恶心的何蒙库鲁兹吗?)
同样很重要的是,运动皮质是控制我们输出行为的区域之一。当一个人做一些事情的时候,运动皮质几乎都有参于,而且至少它会参于物理运动的那部分。所以,其实人脑不需要学习怎么把运动皮质当遥控器用,因为一直以来,运动皮质都是人脑的遥控器。
试着举起你的手,然后再把手放下。发现没?你的手就好像玩具无人机一样,而你的脑就是拿起来运动皮质这个无人机遥控器,在控制着你举起和放下手。
基于运动皮质的脑机接口的目的就是能够接入运动皮质,这样当这个遥控器发出一些命令的时候,脑机接口能够收集到这个命令,然后把命令传达给一些机械,让机械做出和你的手类似的反应。神经连接你的运动皮质和你的手,而脑机接口就负责连接你的运动皮质和一台计算机,就是这么简单。
一些雏形的脑机接口,能够让一个人(通常是高位瘫痪或者截肢人士)能够通过意念就移动屏幕上的鼠标。
这种效果的实现,基于植入使用主体运动皮质的100针多电极阵列来实现。一个瘫痪了的人的运动皮质通常是没问题的,出问题的多是作为运动皮质和身体的中间人的脊髓。电极阵列植入运动皮质后,研究员会让使用主体尝试把手往不同方向移动。虽然他们的手不会真的动起来,但是运动皮质还是会正常触发的。
当一个人移动他的手臂的时候,他的运动皮质会产生一系列的行动,但是每个神经元通常只关注一个类型的运动——某个神经元可能在这个人每次把手臂往右移的时候都会触发,但是手臂往其它方向移的时候就不那么活跃了。这单个神经元,其实就能告诉计算机这个人什么时候想要把手臂往右移,什么时候又不想。但单个神经元能做到的也就是这样了。
不过随着电极阵列的接入,100个单细胞电极各自采集100个不同神经元的信息。当研究员们做测试的时候,比如研究员让测试主体把手往右边移,假设100个电极中有38个采集到各自对应的神经元触发,而当主体试图把手往左边移的时候,41个电极采集到各自对应的神经元触发。经过一系列这样的不同方向和速度的测试后,计算机能把从电极处收集到的信息分析合成为一种对于触发规律的理解,知道怎样的触发规律对应怎样的二维坐标系移动。
而当我们把这些合成结果连接到一个计算机屏幕时,测试主体就能通过“想”移动鼠标,来真正的控制鼠标,在实际操作中这种方法是可行的。经过运动皮质脑机接口的先驱BrainGate公司的努力,真的有人能够靠“想”来玩游戏。
100个神经元能够告诉我们测试主体想怎样移动鼠标,它们也完全可以告诉我们测试主体想要拿起一杯咖啡喝一口。一个四肢瘫痪的女士可以在飞行模拟中控制一架F-35战斗机。最近,有只猴子还用意念控制轮椅的移动。
而且这种控制 不止于手臂。巴西脑机接口先驱Miguel Nicolelis和他的团队就打造了一整套外骨骼,让一位瘫痪人士为巴西世界杯开球。
不要忘了本体感知
控制这些“神经义肢”的关键是记录神经元信息,但是要让它们真的高效运作起来,不能只倚赖单向的信息传输,需要一个信息采集和刺激的双向闭环。虽然我们不会注意到,但是你能够拿起一件物品,很大程度上依赖于手的皮肤发送回脑的触觉信息,也就是本体感知。
在我见过的一个视频中,一位女士的手指麻木,但没有其它残疾,而当她试图点燃火柴的时候,她做的非常困难。在另一个视频中,一位有着完好的运动皮质但是失去了本体感知的男士,也有着很严重的不便。所以要让仿生义肢真的能够像人的手臂一样运作,我们还需要让这些义肢能够把信息发送回脑里。
然而,刺激神经元比记录神经元难多了。研究员Flip Sabes是这么跟我解释的。
“好比我记录一些行为规律,但不代表我们能够轻易重现把这些规律。就好像我们的太阳系一样,你可以观测行星的移动,并且记录它们的轨迹。但如果你把太阳系打乱,然后试图重现一个行星的原本轨迹,你可不是简单的把这个行星放回它原本的轨道这么简单,因为它的行动受到其它所有行星的影响。
同样的,神经元不是独立工作的,这个过程本质上是不可逆的。同时,因为大量轴突和树突的存在,要刺激你想要刺激的神经元而不影响到其它东西,也是很难的。”
Flip的实验室尝试让脑本身来帮忙克服这些挑战。前面提到了,如果每当猴子的一个特定神经元触发后,你就给这个猴子一些奖励的话,猴子最终会学会触发这个神经元。这时,这个神经元就能被当作一种遥控器来用。也就是说,利用寻常的运动皮质的指令只是控制机制的一种可能性。
同样的,在脑机接口技术足够成熟到能够进行刺激的时候,你能把脑的神经可塑性作为一个捷径。如果让一个人的仿生手指发送回触觉信息太难实现的话,仿生义肢完全可以发送一些其它信息给脑。最初,主体对于这些信号可能不太适应,但是长此以往,脑会学会把这些信号诠释成一种新的新的触觉。这个把脑作为脑机接口的助手的概念叫作感官替代。
掩藏在这些进展之下的,是未来的技术突破,例如脑对脑沟通。
Nicolelis设计了一个实验,试验中有一只在巴西的老鼠,这个老鼠能够触摸到笼子内的两个开关,并且它知道其中一个开关能够给它带来一份小食。这只巴西老鼠的运动皮质通过互联网,连接到了一只在美国的老鼠的运动皮质。美国的老鼠处在和巴西老鼠一样的实验环境和笼子中,只不过它并不知道两个开关中哪个可以给它带来小食,并且它能收到巴西老鼠的脑发来的信号。
在实验中,如果美国老鼠做出了和巴西老鼠一样的正确选择,两只老鼠都能获得小食,而如果美国老鼠选择了错的开关,两只老鼠都得不到小食。神奇的是,经过一段时间,两只老鼠学会了合作,虽然它们不知道彼此的存在,但是两只老鼠像同一个神经系统一样工作。在完全随机的情况下,美国老鼠的成功率应该是50%,但是因为它能收到巴西老鼠发来的信号,它的成功率达到了64%。
类似的实验在真人测试中也可行。两个待在不同楼里的两个人,一起玩一个游戏,其中一个人能够看到屏幕,而另一个手握控制手柄。用简单的EEG设备,能够看到屏幕的那个玩家能够在不移动手的情况下,用意念“想”按动射击按钮。而因为两个玩家的脑设备在互相通信,手握控制手柄的玩家会感觉到手指的颤抖,然后按下射击按钮。
早期脑机接口类型二:人造耳朵和人造眼
让失聪的人恢复听觉和让失明的人回复视力是比较可控的脑机接口领域,之所以这样,是因为以下的原因:
首先,和运动皮质一样,我们对感官皮质的了解也还不错,这部分归功于感官皮质和身体部位的对应关系也比较好。
其次,在很多的早期应用中,我们不需要直接和大脑打交道,我们只需要和耳朵/眼睛连接大脑的部分打交道就可以了,因为功能丧失基本都是在这些部位发生的。
同时,运动皮质相关的工作都是通过记录神经元行为来把信息从脑取出来,人造感官则是另一个方向——刺激神经元,把信息发回脑中。
具体到人造耳的领域,近几十年我们已经在人造耳蜗领域已经有了非常长足的进展。
当你以为你“听到”声音的时候,其实整个过程是这样的:
声音其实是你的头附近的空气分子的振动。当吉他的弦,或者某人的声带,或者风,或者其它任何东西发出声音的时候,是因为发声的东西在振动,使得其周围的空气分子产生类似的振动。这种振动于是以球形传播开来,就好像你触碰到水后,水面会扩散出圆形水波一样。
你的耳朵就是把这些空气振动转化为电信号的机器。当空气(或者水,或者其它分子会振动的媒介)进入你的耳朵时,你的耳朵把空气振动的方式转化成一种电码转述给相连的神经末梢。这使得神经产生一系列的动作电位,把这些信息传送到听觉皮质里进行处理。你的脑因此就会收到这些信息,而我们把接收这类信息的体验叫作“听到”。
大多数失聪或者有听力障碍的人并没有神经问题或者听觉皮质问题,他们通常只是耳朵有问题。他们的脑和其他人的脑一样可以把电子信号转换为“听”,只是因为耳朵这个电子信号转换机器出了问题,导致他们的听觉皮质根本就没收到这些电子信号。
耳朵有很多部分组成,而耳蜗是做转换的关键部件。当分子振动进入到耳蜗内的液体的时候,振动会带动耳蜗内数千的小毛发的振动,与这些毛发相连的细胞会把振动的机械能转化为电子信号,刺激听觉神经。
耳蜗还会根据频率对声音进行分类。下面这个图解释了为啥低频声音是在耳蜗尽头处理,而高频声音是在开头处理,以及为什么耳朵能听到的声音频率会有上下限。
人造耳蜗就是一个小计算机,它的一端是个贴在耳朵上的小麦克风,另一端则是一条连接安装在耳蜗中的电极的电线。
声音进入到麦克风,然后进入那个褐色的组件,褐色组件会去除不是那么有用的频率范围,然后把剩下的信息通过皮肤的电传导传到计算机的另一个组件,这个组件会把信息转化成电子信号然后送入耳蜗。耳蜗里的电极和耳蜗里的毛发一样按照频率过滤脉冲信号,然后刺激听觉神经。从外面看,人造耳蜗长这个样子。
也就是说,这就是一个人造耳,这个人造耳做“声音——脉冲——听觉神经”的处理,就和人耳一样。人造耳的声音一般听起来都不怎样,为什么呢?因为要达到和人耳一样的处理效果,需要大概3500个电极,大部分人造耳蜗只有16个电极,太粗糙了。
我们现在还处在Pilot ACE时代,当然会比较粗糙了。
能让失聪的人听到声音,并且与人进行对话,这本身就是很大的进步了。
很多失聪婴儿的父母都会在婴儿一岁左右的时候把人造耳蜗植入到婴儿耳中。
在视觉领域,同样的革命也在发生,对应的例子就是人造视网膜。
失明通常是视网膜疾病造成的。这种情况中,人造视网膜能够像人造耳蜗协助听力一样协助视觉。人造视网膜取代视网膜做眼睛本身会进行的操作,然后把电子脉冲信号传达给视觉神经。
人造视网膜是比人造耳蜗更复杂的脑机接口。第一例被美国食品药物监督管理局(FDA)批准的人造视网膜出现在2011年,它叫作Argus II,由Second Sight公司生产,它长这样:
这个人造视网膜有60个传感器,相比人类视网膜的一百万个左右的神经元,太粗糙了。不过能够看到模糊的边缘和形状,以及亮、暗的差别,怎么也好过什么都看不见了。令人振奋的是,其实我们不需要一百万个传感器来获得还过得去的视觉,模拟运算显示,600到1000个电极就能产生足够阅读和进行人脸识别的视觉。品略个人图书馆 http://www.pinlue.com/
早期脑机接口类型三:深脑刺激
早在上世纪八十年代末,深脑刺激就作为一个粗糙的工具开始改变很多人的生活了。
这个类型的脑机接口不和外部世界交流,它们是通过内部改造来治疗或者改善人体机能。
深脑刺激通常有一到两根电线,连接四个不同位置的电极,然后会插入到脑中,绝大部分会被插入到边缘系统里。然后一个连接了这些电极的小起搏器会被安装到胸口的位置,像下面这位:
当需要的时候,电极就能产生一些刺激,继而引发一些比较重要的行为发生,例如:
减低帕金森患者的抖动
减轻癫痫发作的强度
安抚强迫症
实验上(因为还未经FDA批准),这些设备还能减缓一些慢性疼痛,比如偏头痛和幻肢痛,治疗焦虑、抑郁和创伤后应激障碍,甚至可以结合身体其它部位的肌肉刺激来修复中风或神经疾病造成的神经损伤。
以上就是早期脑机接口行业的情况,也是埃隆马斯克进入这个行业时候的行业现状。对于埃隆和Neuralink来说,今天的脑机接口行业就是A点。我们讲到现在都一直在讲过去,一直讲到了现在这个节点。下一步就是谈谈未来,聊一下B点是怎样的,以及我们怎样才能从A走到B。
品略个人图书馆 http://www.pinlue.com/