选择性注意中的“salience map”的作用是什么?

“salience map”即显著性图谱,代表了相应视觉场景的视觉显著性[1]。显著性图谱最早由Koch和Ullman针对选择性注意的自下而上加工方式提出。简单来说通过显著性图谱,在复杂的环境下,主体能够迅速过滤掉次要的刺激,抓住重要的刺激。根据重要性完成复杂环境信息的顺序接收。

对于人类等灵长类动物而言,还存在着那些与生俱来的显著性图谱,能够帮助其避免伤害。

我认为salience map是保证,自下而上的、无意识的选择性注意的一种重要机制。

具体的一些内容如下。

知觉最严重的问题就是信息超载,随着感觉信息不断传入,处理所有传入的信息需要很高的计算成本,因此对于神经系统来说,选择哪些可用信息进行进一步的处理,丢弃哪些信息是非常重要的。

进一步来说,要对外界信息形成连续不断的反应,就要做到能够迅速进行信息的选择、排序、处理。这一机制就是 选择性注意

自下而上加工和自上而下加工因素被证明对选择性注意起作用的可行因素[1]。

自下而上的加工(bottom-up processing)也称数据驱动加工(data-driven processing)(Lindsay & Norman,1977),这种加工方式无须复杂的思维推理等高级认知过程的参与,由人的生物性决定的,依赖于瞬间感觉输入,不考虑生物体的内部状态。比如说爆竹突然爆炸引起的注意。

自上而下 加工(top-down processing )也称为概念驱动的加工,自上而下则考虑了有机体的内部状态,如目标,经验等。比如饥饿的动物选择性注意找不到的事物,而忽略其他刺激。

S alience Map是针对自下而上的加工展开的。

图1 输入信息从感觉、知觉组织到辨认与识别的加工过程。资料来源:Psychology and Life(Nineteenth Edition).Richard J. Gerring &Philip G.Zimbardo

针对注意的自下而上加工及其潜在的神经机制方面,Christof Koch和Shimon Ullman 最早提出Salience Map 。

Koch和Ullman, 1985 (p. 221)认为一个确定位置的 显著性主要取决于该位置在颜色、方向、运动、深度等方面与 周围环境的差异。这一差异越大,相应位置在视野中的显著性也就越高。为了评估整体的显著性,Koch 和Ullman提出将有助于对某一刺激的选择性注意的 不同视觉特征 地图(颜色、方向、运动等基本特征) 组合成一个 单一的地形定向地图(single topographically oriented map),即 显著性 图谱,基本特征图谱上的位置能够映射到显著性图谱。

投影的确切性质在这里无关紧要,只要特征图上显著性的增加与显著性图谱上显著性的增加 相对应。由于显著性图谱是早期视觉系统的一部分,它很可能根据颜色、运动方向、深度和方向等简单属性来编码物体的显著性。

基于显著性图谱,可以通过 Winner-Take-All机制(见图2)计算图谱中最大值的位置来获得该位置[2]。

图2 WTA方法示意图。资料来源:Christof Koch and &Shimon Ullman ,1987

下图是显著性图谱在选择性注意作用的一个机制示意图:

根据颜色、线段方向、运动、视差等基本特征对视觉场景中的每个位置进行分析,并在不同的特征图中表示。

特征图的输出被合并到显著性图谱,编码视觉场景中的显著特征。

WTA网络随后选择最显著的位置,将相应的属性转移到中心表示。

选择完成之后之一位置的活动被一直,开始寻找第二个显著性图谱

图3 显著性图谱在选择性注意作用机制。资料来源:Christof Koch and &Shimon Ullman ,1987

Koch和Ullman 当时的研究纯粹是概念性的,搭建了一个显著性图谱模型基本的框架,并没有将这一概念进行实际的应用。

除此之外,注意是一种认知功能,对人类具有非凡的意义,Koch和Ullman 没有考虑其生物学特性,缺乏对神经基础的研究,这些都得到了后人的补充。

如下图所示,Sugase等人对猕猴的研究表明其颞叶皮层的大量神经元会对以下面孔做出反应,这其中包含着复杂的反应机制。Sugase等人记录了猕猴在呈现几何形状的视觉刺激以及猴子和人类不同表情时颞叶皮层单个神经元的活动,结果发现,单个神经元在它们的放电模式中传递了两种不同规模的面部信息,延迟一段时间后开始。

Sugase等人认为在反应的最初部分,传递了将刺激分类为猴脸、人脸或形状的整体信息。关于身份或表情的精细信息传递的时间较晚,平均在整体信息之后51毫秒开始。Sugase等人推测,全局信息可以用作”头部”,为目标区域接收更详细的信息做好准备。[5]

从显著性图谱的角度去思考这个研究,我们可以认为反应的最初部分,传递的即是一种存储在大脑指定部位的显著性图谱。因此灵长类动物和人类才能够迅速对如此复杂的刺激做出反应

而Vidhya Navalpakkam, Laurent Itti基于Koch和Ullman 的研究,考虑了生物学上的证据——猕猴视觉系统中的单个单元记录表明 存在着许多不同的 视觉环境地图,这些地图似乎编码了目标的显著性和或行为意义[3]。

在上丘、枕下和侧次区、额眼区和顶内沟区域都发现了这种地图(Colby & Goldberg,1999 Gottlieb, Kusunoki, & Goldberg, 1998;Kustov & Robinson, 1996;Thompson & Schall, 2000)[3]。

由于这些神经元分布在大脑的不同部位,专门负责不同的功能,可以假设它们可能编码不同类型的显著性图谱。

图3 多重显著性图谱。资料来源:Vidhya Navalpakkam, Laurent Itti * , 2005

Koch和Ullman(1985)对显著性图谱的最初定义是基于 神经过程和转换 过程,而不是基于认知。因此,显著性图谱在大脑中的位置问题就很自然地产生了。

显著性图谱位置 没有逻辑上 的必要性 ,它可以被理解为一个功能地图,其组成部分可以分布在大脑的许多区域 也有可能有多个按地形组织的显著性 图谱

然而,鉴于许多早期视觉的特征图实际上是定位在中枢神经系统的特定部位,有人提出,显著性图谱可能也是如此。

Koch和Ullman(1985)提出它可能位于丘脑外侧膝状核;克里克(1984)曾认为该区域在注意控制中起主要作用。

Robinson和Petersen 认为它可能位于丘脑核,枕核,被认为与注意力有关(Robinson和Petersen, 1992),也被认为是显著性地图的候选区域。

Kustov和Robinson 认为它可能位于上丘,它同样与注意力的控制有关(Kustov和Robinson, 1996)。

也有人认为是其他的一些皮层区域,包括V1 (Li 2002), V4 (Mazer和Gallant 2003)和后顶叶皮层(Gottlieb 2007)。

我认为显著性图谱应该存在于大脑的不同部位,并且受到情绪,动机相关脑区的调节。

最直接的延伸是预测眼动(例如,Parkhurst et al, 2002, Underwood et al, 2006)。

在许多技术应用程序中,显著性图通常用于优先选择,例如在可视化输入流中 识别最重要的信息,并使用它来提高生成或传输可视化数据的性能(回顾:Parkhurst和Niebur 2002)。

“逆”显著性地图也得到了使用,用来 降低显著图像区域的重要性,并将注意力转移到其他区域(Su et al . 2004)。

显著性地图也被集成到视觉选择性注意的VLSI硬件模型中(Indiveri 2000)。

(以上内容来自文献[1])

选择性注意是感知和认知的核心组成部分,存在于所有的感觉模式中。

虽然迄今为止的讨论都是关于视觉中显著性地图的使用,但也有人提出,显著性地图可以用于一般的听觉知觉(Kayser等人,2005),比如”鸡尾酒会效应”,在嘈杂的声音中人们也能听到自己的名字。

在躯体感觉方面,也有一些著名的躯体地图,如神经生理学和影像学研究表明,痛觉刺激表现在体感觉、扣带和岛叶皮层,即所谓的”疼痛矩阵”,Legrain等人(2011)提出,这些区域代表疼痛刺激的位置和强度,用于将注意力导向可能潜在损害身体的显著感觉事件。

Jiang和Zhang(2012)开发了一种结合视觉和嗅觉信息的显著性地图。

Huber等人(2009)提出了一种融合视觉、触觉、听觉等多种形式信息的显著性地图,这些信息都投影到一个共同的坐标系上。

Original: https://blog.csdn.net/qq_37147083/article/details/120885807
Author: 温别Serein
Title: 选择性注意中的“salience map”的作用是什么?

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/556922/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球