HomeHomeHome


Материалы к семинару

Конфигурационные и категориальные характеристики зрительного восприятия схематических фигур

Ч.А. Измайлов (2003)

Московский государственный университет им. М.В. Ломоносова

Тезисы доклада на Московском семинаре по когнитивной науке

Часть 1. Многомерное шкалирование схематических лиц, основанное на оценках различий и амплитудах вызванного потенциала различения (ВПР)

Нейропсихологические данные о прозопагнозии у пациентов с поражениями затылочных и нижневисочных областей коры показывают специфичность зрительной идентификации лица человека (Adolphs, et al., 1994). Нейрофизиологические исследования механизмов распознавания лица показали наличие двух самостоятельных типов нервных клеток в височной коре, которые связаны с идентификацией лица и с детекцией его эмоционального выражения (Rolls. 1984, 1998; Perret et al., 1982).

Очевидно, что как идентификация, так и эмоциональное выражение определяются конфигурационным паттерном лица (Ekman, Friesan, 1978). Поэтому исследование роли линейной конфигурации (паттерна лица) в восприятии эмоционального выражения лица и его распознавании представляет значительный интерес. Наиболее существенными характеристиками линейной конфигурации лица являются очертания рта и форма средней области лица (глаза и брови). В психофизических исследованиях с использованием фотографий и схематических изображений лиц в качестве стимулов было показано, что эмоциональное выражение лица можно определить как многомерную функцию от кривизны губ, наклона бровей и других конфигурационных характеристик лица (Ekman, Friesan, 1978; Парамей, Измайлов, Бабина, 1992). Контур рта, глаз и бровей может, в свою очередь, рассматриваться, как набор линий разной ориентации, детекция которых создает основу для распознавания эмоциональной экспрессии лица (Измайлов, Коршунова, Соколов, 1999; Измайлов и др., 2003). Это говорит о тесном взаимодействии нейронов затылочной коры, ориентированных на детекцию конфигурационных признаков воспринимаемого изображения (Hubel, Wisel, 1965; Супин, 198_; Шевелев, 2000), и нейронов височной коры, связанных с детекцией лица (Rolls, 1984, Perret, et al., 1982).

В данной работе ставится задача выявить вклады нейронных сетей затылочной и височной коры в восприятие эмоционального выражения лица. С этой целью в работе методом многомерного шкалирования строится пространство различения схематических лиц по амплитудам вызванного потенциала различения, зарегистрированного в затылочной и височной коре человека в ответ на мгновенную смену стимулов, которое сравнивается с аналогичным пространством, построенным по данным субъективной оценки эмоциональных различий между этими же лицами.

В этом направлении данная работа завершает цикл наших исследований восприятия эмоциональных выражений схематического лица, изображенного в виде овала, в котором линиями были изображены брови, глаза, нос и рот (рис 1). Эмоциональное выражение лица задавалось кривизной рта, которая менялась от нулевого уровня (горизонтальная линия) вверх и вниз с шагом в 14 градусов, и наклоном бровей, также от нулевого уровня вверх и вниз с шагом в 6 градусов. Целью этих работ является построение геометрической модели зрительного различения схематических лиц как по амплитудам вызванного потенциала различения, зарегистрированного в коре человека в ответ на мгновенную смену стимулов, так и по данным субъективных оценок различий между эмоциональными выражениями этих же схематических лиц. В первой работе (Измайлов, Коршунова, Соколов, 1999) методом многомерного шкалирования матрицы оценок попарных различий между 25 лицами-стимулами была построена геометрическая модель восприятия эмоциональных выражений схематического лица. В этой модели схематические лица представлены точками в четырехмерном пространстве, так что евклидовы расстояния между точками, пропорциональны воспринимаемым различиям между эмоциональными выражениями этих лиц. При этом точки-стимулы не заполняют четырехмерное пространство целиком, а все располагаются на поверхности гиперсферы. Три угла четырехмерной сферы сопоставляются с субъективными характеристиками эмоциональной экспрессии, которые обозначены в работе Соколова и Букзайна (2001) как эмоциональный тон (радость, горе, печаль и др.), интенсивность эмоций и «эмоциональная насыщенность». Четыре декартовы координаты этого пространства характеризуют возбуждения нейронных каналов, кодирующих ориентацию линий рта и бровей.

В следующей работе (Измайлов, Коршунова, Соколов, 2000; Izmailov, Korshunova, Sokolоv, 2001) был представлен метод измерения различий между схематическими лицами на основе регистрации вызванного потенциала в ответ на мгновенную смену стимулов. В соответствии с положением о специфичности компонентов зрительного вызванного потенциала различения (Измайлов и др., 1998) в каждом ВПР рассматривались четыре меры межстимульных различий – пиковые амплитуды средне латентных компонентов N180 и P230 и межпиковые амплитуды P120-N180 и N180-P230. Межпиковые амплитуды сравнивались с оценками воспринимаемых различий между этими же лицами, полученными в первой работе (Измайлов и др., 1999), и с угловыми значениями кривизны рта и бровей на схематическом лице.

Было показано, что наименьшее соответствие обнаруживает пиковая амплитуда Р230. Это касается как субъективных оценок, так и физических различий между стимулами. Отсюда можно сделать вывод, что длиннолатентные компоненты ВПР не содержат в себе информации ни о конфигуративных различиях между стимулами-лицами, ни о различиях в эмоциональной экспрессии лица. Среднелатентные компоненты, напротив, показывают достаточно высокое соответствие, и наибольшая корреляция обнаруживается для межпиковых амплитуд по сравнению с пиковой амплитудой N180. Две межпиковые амплитуды P120-N180 и N180-P230, в свою очередь, различаются по отведениям. Более ранний компонент P120-N180 показывает большую корреляцию для отведений Т5 и Т6, тогда как более поздний компонент – N180-P230 – показывает наибольшую корреляцию для отведений О1 и О2, Р3 и Р4. И еще один интересный результат, который обнаруживается в этой работе, состоит в том, что амплитуды ВПР больше коррелируют с физическими угловыми различиями, чем с оценками эмоциональных различий.

Таким образом, полученные в предыдущих работах результаты позволяют рассматривать амплитуды определенных компонентов ВПР как адекватные меры межстимульных различий, с тем, чтобы построить по ним геометрическую модель различения схематических лиц нейронными сетями в затылочной и височной коре, и сравнить их с аналогичной моделью, основанной на субъективных оценках.

Субъективное пространство различения эмоциональных выражений схематического изображения лица представляет собой интегральную модель в виде сферы в четырехмерном евклидовом пространстве, в котором четыре декартовы координаты точки-лица характеризуют нейронную сеть детектирования конфигурационных признаков изображения лица, тогда как две сферические координаты этой же точки (горизонтальный и вертикальный углы) характеризуют эмоциональное выражение лица. Эта геометрическая модель служит в настоящей работе основанием для анализа данных регистрации вызванного потенциала различения в затылочной и височной областях коры с целью выявить вклад этих областей в процесс восприятия человеческого лица.

Часть 2. Зрительное восприятие схематических изображений циферблата часов.

В работе сравниваются две геометрические модели, построенные методом многмерного шкалирования для двух типов оценок воспринимаемых различий между одними и теми стимулами – схематическими изображениями циферблата часов. В одной экспериментальной серии стимулы были представлены испытуемым как специфические конфигурации, составленные из линий разной ориентации, и испытуемые оценивали конфигурационные различия между стимулами, а в другой – как циферблат часов с различными значениями времени суток, и испытуемые оценивали различия по категории «время суток». Полученные геометрические пространства анализировались в терминах двухканальной сферической модели различения стимулов Соколова и Измайлова.

В результате анализа было показано, что конфигурационные различия между стимулами полностью описываются двумя сферическими координатами в трехмерном евклидовом пространстве. На этом основании делается вывод, что распознавание паттернов такого типа, осуществляется трехканальной нейронной сетью, детектирующей две конфигурационные характеристики стимулов. Одна сферическая координата точки-стимула в этой модели представляет величину угла между линиями-стрелками на схематическом циферблате часов, а другая - ориентацию биссектрисы этого угла. Сравнение этих данных с исследованиями различения каждой из этих конфигурационных характеристик (величины угла и ориентации линий) по отдельности, показывает, что данная нейронная сеть различения схематических конфигураций является результатом специфического взаимодействия двух двухканальных сетей, детектирующих каждую из этих характеристик по отдельности. Таким образом, можно предположить, что распознавание сложных конфигураций (pattern recognition) осуществляется в зрительной системе по иерархическому принципу формирования сложных сетей из однотипных двухканальных механизмов, детектирующих отдельные конфигурационные признаки стимула.

Геометрическая модель категориальных различий между схематическими изображениями циферблата часов существенно отличается от модели различения конфигураций. Она представляет собой двумерное евклидово пространство, в котором точки, обозначающие различные стимулы, располагаются на окружности в точном соответствии с показаниями времени линиями-стрелками на циферблате часов. Оси этого категориального пространства не имеют никакой связи с осями конфигурационного пространства, что служит основанием предположения, что между конфигурацией и категорией зрительного образа связь не генетическая, а языковая.


Home << Публикации CogLab'а << Статьи <<