认知学领域的注意力机制研究

本文来自“程序媛的日常”的微信公众号,前段时间正在学习注意力机制的偏机器学习方面的工作,这篇文章总结了认知学家的研究工作进展。相当不错。我写这个文章的目标就是为了学习,再加工。把里面的一部分内容进行了翻译。
微信号:girlswhocode

1. 注意力过程总共有三种,警觉 alerting;关注 orienting 和 执行 executive

警觉 我们定义其为由一个不可预知的外部线索激发的冲动或者等待状态的产生;
关注 是从环境中选择信息的注意力转变,可能和一个眼部或者头部的动作相关,也可能无关;
执行 是解决为了选择目标相关动作的竞争性输入的冲突。

2. 注意力过程出现在认知系统的多个模块和层级中

注意力机制在很多的模型中被放在输出层的前面,而且是固定和独立的模块。但是在认知学家的眼中,注意力机制实际上是出现在认知过程的多个模块和层级中的。很难被看做是独立存在的一个模块。

他们可能是跨越不同的感知模块进行工作的,最终共同来规范多个感知模块的信息,根据最后整合的信息行动。

3. 即使是 4-6 个月的婴儿,他们也已经有了很强的注意力认知能力

注意力尽管并不是从一开始就成熟的,只是这种认知能力会很快成长起来。有研究表明 4-6 个月的婴儿已经有了克服干扰物去主动转移注意力到目标(警觉+关注)的能力。

到了 4-6 个月的婴儿能够在他们作出注意力关注转移的时候克服先前的关注对象的影响。

关于克服干扰的能力,作者联想到了 话题的异化、语义的缺漏、字符的转移等等这些在文本中出现的语义断裂的现象。考虑当前文章当前句子关注的是语义上的隐藏话题时,下一句可能就是按照另外一个话题产生的,所以这样的能力让我们能够摆脱之前的话题。

4. 从婴儿到成年,人的注意力机制会逐渐发展成熟

人们的注意力能力涉及到方方面面,视觉上的例子比较清楚,我们首先成熟的是局部感知能力,基于这个,才有了空间感知能力,然后才能有更高的注意能力,比如说,执行注意力控制。

例如,视觉处理的皮质层最早成熟,然后是头顶骨和时序区域的成熟,这个会支持空间和基于对象的注意力。结合这些能力,这些观测最终会导致我们给出一个关于嵌入视觉注意力发展的到视觉pathway的这种层次性架构组织形式涌现功能中的框架。

注意力机制并非扁平或者单模块的。如果我们想模拟不同的注意力或者更复杂的注意力,可能就会需要在多个层引入注意力机制。这点和 Learning Wake-Sleep Recurrent Attention Models 相合了。本文中,作者使用了 hard+soft 注意力的两层注意力网络。

认知学领域的注意力机制研究_第1张图片
认知学领域的注意力机制研究_第2张图片

5. 高层注意力过程解决信息冲突

如果存在不同层次的注意力过程,那么每个层次的信息和决策就可能出现冲突。这时候,层级化的认知过程再次发挥了作用(如同大脑信息组织一样),由高层来进行统一调配。

我们假设,随着视觉的发展,在高层区域内存在一个前向信息的注意力分配的竞争,因此自顶向下的视觉注意力发展和视觉经验相关联。还有,现在参与了的这些区域发送自顶向下的信号来调整局部视觉区域,在很产后第一年的早期就在设置层次性的环。

这一点对应在 NLP 上,可以看做 polysemy,parsing MT 中的reordering等。但凡我们需要解决候选者的冲突,可以尝试一下这种高层执行注意力的控制。

6. 注意力过程会影响高层控制,反之,高层控制也可以影响注意力

这是一种双向的过程。比方说,嵌入作为神经网络的输入,既可以是输入,也可以是神经网络的参数,在反向传播的时候进行权重的调整。同时,注意力在影响了控制函数后,也会受到反向的影响,这样使得自身的参数发生相应的变化(假设我们已经建模完成)

需要注意的是,这种视觉注意力和高层控制函数之间的交互式是双向的:高层认知函数(类似 LSTM 这种)同样会影响视觉注意的部署。我们已经发现了在成年人种编码进入 LSTM 的信息和分类知识可以指导其注意力,但是近期的研究发现这样的场景在小孩子身上也会出现。

7. 情绪会影响人们的注意力

最近研究表明,当人们拥有正向的情绪时,识别人脸面孔的能力会更好;反之则更差。结论就是:情绪会影响人的注意力,导致人们将注意力分配在不同的地方。

需要注意的一点是情感和注意力范围之间的关联,还有随之而来的全面的(configural)处理,可能会比宽泛的假设的预测更加灵活。
正面的情感和中立的状态则可以获得可比较的在基于物品的细节表示上的任务表现,而反面情绪则会提升对细节的记忆。
对比一下,当前的研究表明正面情绪促进了全面性的处理和人脸识别。

情绪首先影响了人们的注意力范围,但人脸识别是复杂的过程,仅仅靠简单识别的细节小范围难以完成。所以,当注意力能够更大范围地关注和加工人脸的时候,我们的识别能力会更强;反之,则更弱了。

认知学领域的注意力机制研究_第3张图片

你可能感兴趣的:(认知学领域的注意力机制研究)