riskov 27 июл 2022 в 17:21

Исследования: как мозг строит гипотезы об окружающем мире и подгоняет ощущения под гипотезы

13 мин

7.9K

Перевод

Некоторые нейробиологи объясняют восприятие человека теорией «контролируемых галлюцинаций». Эта теория предполагает, что восприятие, память, контроль движений и другие функции мозга зависят не от сенсорной информации, а скорее от сравнения текущего реального опыта и смоделированных ожиданий мозга.

Вместо того, чтобы ждать сенсорной информации о реальном мире, мозг всегда активно строит гипотезы о том, как устроен мир и предполагает какую информацию получит. А потом использует гипотезы для объяснения реального опыта и заполнения недостающих данных. Другими словами — мозг галлюцинирует, потому что создает информацию, которой нет в реальности.

Теория «прогнозов»

Несколько лет назад компания DeepMind представила GQN — сеть генеративных запросов. Эта модель может сделать одно изображение нескольких объектов в виртуальной комнате, и без помощи человека определить, как выглядит трехмерная сцена.

Учитывая двумерное изображение структуры блоков (слева), искусственный интеллект GQN может вывести их трехмерное расположение в пространстве (справа).

Другими словами, на основе двухмерных изображений GQN генерирует прогноз о том, где должны быть расположены объекты, как тени должны падать на поверхности, какие области должны быть видны или скрыты на основе определенных перспектив. Модель использует различия между этими прогнозами и своими фактическими наблюдениями, чтобы повысить точность прогнозов, которые он делает или будет делать в будущем.

«Представьте, что вы смотрите на гору Эверест и передвигаетесь на метр: она не изменит своего размера, но вы поймете как до нее далеко. Примерно так и работает наша технология».
Али Эслами, один из руководителей проекта.

Этот алгоритм обучения GQN привлек внимание нейробиологов. Они давно подозревали, что аналогичный механизм управляет работой мозга по теории «прогностического кодирования» (предсказательной обработки).

Согласно теории, на каждом уровне когнитивного процесса мозг генерирует модели или убеждения о том, какую информацию он должен получать с уровня ниже него. Эти убеждения преобразуются в предсказания о том, что следует испытать в данной ситуации и объяснить то, что происходит, чтобы опыт имел смысл.

В этой теории работа органов чувств состоит в проверке предсказаний, чтобы убедиться, что внутренняя модель близка от реальности.

Прогнозы отправляются в виде обратной связи в сенсорные области мозга более низкого уровня. Мозг сравнивает свои прогнозы с фактическими сенсорными данными. Различия или ошибки в прогнозах мозг «объясняет» на основе внутренних моделей, определяя вероятные причины расхождений. Например, у нас может быть внутренняя модель стола в виде плоской поверхности, поддерживаемой четырьмя ножками, но мы все равно можем идентифицировать объект как стол, даже если что-то другое закрывает половину его из поля зрения.

Ошибки прогнозирования, которые невозможно объяснить, передаются через соединения на более высокие уровни (как «прямые» сигналы, а не обратная связь). Там они считаются «заслуживающими внимания», чтобы система обратила внимание и скорректировала модель.

За последнее десятилетие ученые-когнитивисты, философы и психологи рассматривали «прогностическое кодирование» как убедительную идею, особенно для описания работы восприятия, а также как более амбициозную, всеобъемлющую теорию о том, как работает весь мозг. Экспериментальные инструменты только недавно позволили начать тестирование конкретных механизмов гипотезы, и некоторые статьи, опубликованные за последние два года, предоставили поразительные доказательства в пользу теории.

Однако, теория остается спорной, о чем лучше всего свидетельствуют недавние дебаты о том, можно ли воспроизвести некоторые знаковые результаты.

Кофе, сливки и собаки

«Я пью кофе со сливками и ____».

Кажется естественным заполнить пробел словом «сахар». Именно на этот инстинкт рассчитывали ученые-когнитивисты Марта Кутас и Стивен Хилльярд из Калифорнийского университета в Сан-Диего. В 1980 году они провели серию экспериментов, в которых показывали людям предложение по одному слову за раз на экране, и записывали их мозговую активность.

Только вместо окончания «сахара» была «собака» — предложение гласило: «Я пью кофе со сливками и собакой».

Исследователи наблюдали более сильную реакцию мозга, когда участники исследования неожиданно сталкивались со словом «собака». Реакция характеризовалась специфическим паттерном электрической активности, известным как «эффект N400», который достиг максимума примерно через 400 миллисекунд после того, как слово было раскрыто.

N400 – компонент ЭЭГ-сигнала. Вызывается в ответ на определенный тип стимулов… Это негативное отклонение потенциала мозга с пиком амплитуды около 400 миллисекунд после начала стимула. При этом N400 может детектироваться в окне 250-500 мс, и, как правило, имеет максимальное распространение в центрально-теменных отведениях. N400 — часть нормальной реакции мозга на слова и другие значимые (или потенциально значимые) раздражители, в том числе зрительные и слуховые слова, язык жестов и знаков, рисунки, лица, звуки окружающей среды, и запахи. (Kutas, M. & Federmeier, 2000)

Но как это интерпретировать, оставалось неясным. Мозг отреагировал, потому что:

(1) Значение слова было бессмысленным в контексте предложения?
(2) Или потому, что слово было непредвиденным, которое нарушает любые прогнозы мозга?

В 2005 году Кутас и ее команда провели еще одно исследование, которое указало на второй вариант. Людей снова попросили прочитать на экране предложение по одному слову за раз:

«День был ветреный, поэтому мальчик вышел на улицу, чтобы полетать ____».

Поскольку «воздушный змей» (англ. «a kite») казался наиболее вероятным способом закончить предложение, испытуемые ожидали увидеть следующим словом «а». Когда участники вместо этого увидели «an» (как в «an airplane», ««в самолете»), они испытали эффект N400. Видимо потому, что мозгу пришлось обрабатывать несоответствие между его ожиданиями и реальностью. Эффект, по-видимому, не был связан со значением слова или какой-либо трудностью в обработке самого представленного стимула.

Работа 2005 года казалась отлично подходит для подтверждения теории прогностического кодирования. Но в апреле этого года в статье, опубликованной в eLife, сообщалось, что несколько лабораторий не смогли воспроизвести результат. Теперь другие исследователи начали отвечать, что тонкости в методах репликации по-прежнему благоприятствуют интерпретации, основанной на предсказаниях.

Эти рассуждения отражают большую часть дебатов, связанных с «предсказательным кодированием». Эксперименты Кутаса и им подобные, могут иметь множество интерпретаций. Их можно объяснить с помощью моделей, отличных от прогностического кодирования, но они не дают окончательного доказательства гипотезы, потому что не вникают в действующие механизмы — в то, что наш мозг постоянно делает выводы и сравнивает их с реальностью. Вместо этого сторонники прогностического кодирования искали способы доказать, что именно их конкретная версия истории правильна.

Байесовский мозг и эффективные вычисления

Понимание того, что мозг постоянно делает и оценивает свои собственные прогнозы относительно текущего опыта, не всегда считалось само собой разумеющимся.

Взгляд на неврологию, который доминировал в 20 веке, характеризовал функцию мозга как функцию детектора признаков: он регистрирует наличие стимула, обрабатывает его, а затем посылает сигналы для выработки поведенческой реакции. Активность в определенных клетках отражает наличие или отсутствие стимулов в физическом мире. Например, некоторые нейроны в зрительной коре реагируют на края объектов в поле зрения, другие срабатывают, чтобы указать ориентацию, окраску или оттенок объектов.

Но процесс оказался гораздо сложнее, чем казалось. Тесты показали, что если мозг воспринимает, например, длинную линию, которая никак не заканчивается, то все нейроны-детекторы перестают срабатывать, даже если линия не исчезла. Но при этом через обратные связи все равно передавалась информация. Странно.

Вот тут-то и вступает в игру теория «байесовского мозга». Она переворачивает традиционную модель с ног на голову и предполагает, что мозг делает вероятностные выводы о мире на основе внутренней модели. Упрощенно, мозг вычисляет «лучший вариант» интерпретации того, что он воспринимает (в соответствии с правилами байесовской статистики, которая количественно определяет вероятность события на основе соответствующей информации, почерпнутой из предыдущего опыта).

Вместо того, чтобы ждать сенсорной информации для управления познанием, мозг всегда активно строит гипотезы о том, как устроен мир, и использует их для объяснения опыта и заполнения недостающих данных.

Вот почему, по мнению некоторых экспертов, восприятие похоже на «контролируемую галлюцинацию».

В этом ключе байесовский мозг объясняет, почему работают визуальные иллюзии. Например, две точки, быстро сменяющие друг друга на экране, выглядят как одна точка, но, которая движется движущаяся взад и вперед и наш мозг бессознательно относится к ним как к единому объекту. Понимание того, как движутся объекты — знанием более высокого уровня, но оно фундаментально влияет на то, как мы все воспринимаем.

Мозг просто заполняет пробелы в информации — в данном случае о движении — чтобы нарисовать картину (которая не совсем точна).

(Основано на оригинальном изображении Эдварда Х. Адельсона).

Это известная визуальная иллюзия: плитка A на шахматной доске выглядит значительно темнее, чем плитка B. Однако, как вы знаете, обе плитки одного оттенка серого.

Мозг использует цвет соседних плиток и расположение тени, отбрасываемой цилиндром, чтобы понять цвета шахматной доски. Мозг приходит к выводу, что A и B заштрихованы по-разному, хотя они идентичны. Справа на картинке показан «мост» между плитками для наглядности того, что плитки все же одного цвета.

Несмотря на то, какую роль генеративные модели и ожидания играют в функционировании мозга, ученым еще предстоит точно определить, как это все работает на уровне нейронных цепей.

«Байесовская история мозга относительно независима основных механизмов»

Марк Спревак, профессор философии сознания в Эдинбургском университете в Шотландии.

Теория предсказательного кодирования может найти механизмы того, как мозг может быть байесовским. Прогнозирующее кодирование получило свое название от метода более эффективной передачи телекоммуникационных сигналов. Поскольку видеофайлы содержат много избыточности от одного кадра к следующему, неэффективно кодировать каждый пиксель в каждом изображении при сжатии данных. Вместо этого имеет смысл кодировать различия между соседними кадрами, а затем работать в обратном направлении для интерпретации всего видео.

В 1982 году ученые обнаружили, что эта идею можно применить в неврологии — потому что она, по-видимому, объясняет, как нейроны в сетчатке кодируют информацию о визуальном стимуле и передают ее по зрительному нерву. Это также объясняет принцип функционирования системы вознаграждения мозга: дофаминовые нейроны кодируют величину несоответствия между ожидаемой наградой и фактической полученной наградой. По словам исследователей, эти ошибки в прогнозировании помогают животным обновлять свои будущие ожидания и принимать решения.

Но, несмотря на эти примеры, ученые в основном рассматривали «прогностическое кодирование» как процесс, специфичный для определенных сетей. Тесты функциональной магнитно-резонансной томографии и другие виды экспериментов начали менять это представление.

Универсальность

Что делает гипотезу предсказательного кодирования настолько убедительной, так это ее невероятная объяснительная сила.

«Что я нахожу убедительным, так это то, как много всего объясняется в этой теории»
Энди Кларк, профессор логики и метафизики в Эдинбургском университете и эксперт по теории.

Гипотеза объединяет восприятие и моторный контроль в рамках единого вычислительного процесса. По сути, это две противоположные стороны одной медали: в каждом случае мозг минимизирует ошибки прогнозирования, но по-разному.

С восприятием корректируется внутренняя модель.
С моторным контролем — реальная среда. Представьте, что вы хотите поднять руку. Если ваша рука еще не поднята, это несоответствие порождает большую ошибку в прогнозировании, которую можно свести к минимуму, если вы просто пошевелите рукой.

Эксперименты по управлению восприятием и моторикой предоставили убедительные доказательства теории предсказательного кодирования. Например, в статье, опубликованной в журнале Neuroscience, экспериментаторы просили испытуемых прочитать слово «kick» («удар») на экране, а затем прослушали искаженную запись слова «pick» («выбери»), которое звучало как громкий шепот.

Многие вместо этого слышали «kick», а сканирование МРТ показало, что мозг наиболее сильно воспроизводил начальные звуки «k» и «p», что коррелировало с ошибкой прогнозирования. Если бы мозг просто воспринимал слова, самый сильный сигнал должен был бы соответствовать «pick» (потому что это было представлено как на экране, так и в аудио).

Исследователи продолжают развивать теорию прогностического кодирования за пределы восприятия и движения. Карл Фристон, например, утверждает, что ее можно использовать для объяснения высших когнитивных процессов, включая внимание и принятие решений. Недавняя вычислительная работа над префронтальной корой головного мозга включила прогностическое кодирование в рабочую память и целенаправленное поведение.

Некоторые исследователи предполагают, что эмоции и настроения могут быть сформулированы в терминах прогностического кодирования: эмоции могут быть состояниями, которые мозг представляет, чтобы минимизировать ошибку прогнозирования внутренних сигналов, таких как температура тела, частота сердечных сокращений или кровяное давление. Например, если мозг распознает, что он возбужден, тогда он знает, что все эти факторы растут и поднимает давление, например.

Карл Фристон, нейробиолог из Университетского колледжа Лондона, десятилетиями разрабатывал ключевые принципы гипотезы предсказательного кодирования. Он утверждает, что теория может объяснить не только восприятие, но и более высокие уровни познания. Radboud Universiteit Nijmegen.

Большая часть работы, проводимой в этом направлении, сосредоточена на том, как прогностическое кодирование может объяснить психоневрологические расстройства и нарушения развития.

«Идея в том, что если мозг — это машина для вывода, орган статистики, то, когда что-то пойдет не так, он совершит те же ошибки, что и статистик. То есть будет делать неправильные выводы, уделяя слишком много или слишком мало внимания либо прогнозам, либо ошибкам в прогнозах»
Карл Фристон.

Например, аутизм может характеризоваться неспособностью игнорировать ошибки прогнозирования, связанные с сенсорными сигналами на самых низких уровнях иерархии обработки мозга. Это может привести к озабоченности ощущениями, потребности в повторении и предсказуемости, чувствительности к определенным иллюзиям и другим эффектам.

Обратно тоже верно, в условиях, связанных с галлюцинациями, например, шизофрении: мозг может уделять слишком много внимания своим собственным прогнозам о том, что происходит, и игнорировать сенсорную информацию, которая противоречит этим прогнозам. (Однако эксперты спешат предупредить, что аутизм и шизофрения слишком сложны, чтобы их можно было свести к одному объяснению или механизму.)

Эксперименты в лаборатории Корлетта показывают, что можно создать новые «убеждения» у здоровых испытуемых, которые побуждают их придумывать (галлюцинировать) стимулы, которые они ранее испытывали. Например, в одном эксперименте ученые заставляли участников ассоциировать тон с визуальным рисунком. Испытуемые продолжали слышать тон, когда видели шаблон, даже когда звука не было вообще!

Исследователи пытаются разгадать, как эти убеждения преобразуются в восприятие. Благодаря этим исследованиям у нас есть доказательства того, что восприятие и познание не так уж разделены. Новым убеждениям можно научить, и они могут изменить то, что вы воспринимаете.

Но эти доказательства даже близко не подошли к тому, чтобы предложить доказательства — до сих пор.

Ошибка в экспериментах

Экспериментальная работа часто показывает, что конкретный результат совместим с прогностической обработкой, но не лучшим образом объясняют этот результат.

«Теория широко признана в научных кругах, но в области системной нейробиологии она все еще немного не признана»
Георг Келлер, нейробиолог из Института биомедицинских исследований имени Фридриха Мишера в Швейцарии.

Георг Келлер, нейробиолог из Института биомедицинских исследований имени Фридриха Мишера, работает над поиском физиологических доказательств гипотезы предсказательного кодирования.

В исследовании, опубликованном в журнале Neuron, Келлер и его коллеги наблюдали за появлением «прогностических» нейронов у мышей. Однажды они решили обучить мышей видеоигре и при этом перепутали направления виртуального мира.

Обычно — и вплоть до начала эксперимента — мыши видели, как их поле зрения смещается вправо всякий раз, когда они поворачивались налево, и наоборот. Но по ошибке кто-то непреднамеренно еще раз перевернул направления так, что поворот влево означал поворот влево. Исследователи не растерялись и решили отслеживать сигналы мозга в этом случае.

Они обнаружили, что по мере того, как мыши изучали правила перевернутой среды, сигналы менялись медленно.

Если бы сигналы были лишь сенсорными представлениями визуального опыта мыши, они бы сразу(!) переключились в виртуальном мире. Таким образом «речь идет о предсказании визуального потока при заданном движении»

«Работа предоставляет своего рода доказательства, которых раньше не существовало. Очень локальная, пошаговая, послойная демонстрация того, что наиболее подходящей моделью для происходящего — это прогнозирующее кодирование»
Энди Кларк.

Примерно в то же время сообщалось о подобных находках в частях мозга, которые макаки используют для обработки лиц.Предыдущая работа уже показывала, что нейроны на более низких уровнях сети кодируют аспекты лица, основанные на ориентации, например, изучая любое лицо в профиль. На более высоких уровнях нейроны представляют лицо более абстрактно, обращая внимание на его личность, а не на его положение.

В исследовании макак исследователи обучали обезьян парам лиц, в которых одно лицо, появляющееся первым, всегда предсказывало что-то о втором. Позже экспериментаторы вмешались в эти ожидания определенным образом, показывая уже то же самое лицо под другим углом или другое лицо. Они обнаружили ошибки прогнозирования в областях более низкого уровня нейронов обработки лиц, но эти ошибки были связаны не с предсказаниями об ориентации, а с предсказаниями об идентификации. Ошибки проистекали из того, что происходило на более высоких уровнях системы, предполагая, что более низкие уровни формируют сигнал ошибки путем сравнения поступающих восприятий с предсказаниями, исходящими с более высоких уровней.

«Было интересно находить ошибки в предсказаниях и находить конкретное содержание предсказаний в этой системе»
Ведущий автор статьи Каспар Швидрзик, нейробиолог из Европейского института нейробиологии в Геттингене в Германии.

По словам Лючии Меллони, исследователя из Института эмпирической эстетики Макса Планка во Франкфурте, Германия, ее группа начинает видеть результаты, совместимые с объяснением ошибки прогнозирования в нейронных данных, которые в настоящее время собираются у людей.

Поиск «прогностических машин»

Не все согласны с тем, что аргументы в пользу «прогностического кодирования» достоверны. Некоторые ученые признают, что теория может объяснить определенные аспекты познания, но отвергают идею о том, что она может объяснить все.

Другие не признают даже этого. Для Дэвида Хигера, профессора психологии Нью-Йоркского университета, важно проводить различие между «прогностическим кодированием», которое заключается в эффективной передаче информации, и «прогностической обработкой», которую он определяет как составление прогнозов с течением времени.

«В литературе много путаницы, потому что предполагалось, что все эти вещи — часть одного и того же. И это не обязательно так, и это не обязательно лучший способ продвинуться в его изучении»
Дэвид Хигер

Другие типы байесовских моделей, например, могут обеспечить более точное описание функций мозга при определенных обстоятельствах.

Однако многие эксперты в этой области согласны с тем, что это исследование имеет потенциал для захватывающих приложений в машинном обучении. В настоящее время подавляющее большинство исследований в области искусственного интеллекта не связано с «прогнозирующим кодированием», вместо этого основное внимание уделяется другим видам алгоритмов.

Но разработка архитектуры «прогностического кодирования» в контексте глубокого обучения может приблизить машины к человеческому интеллекту, утверждает Фристон. GQN от DeepMind — хороший пример этого потенциала.

В прошлом году исследователи из Университета Сассекса даже использовали технологии виртуальной реальности и искусственного интеллекта, которые включали функции предсказательного кодирования, для создания того, что они назвали «Машиной галлюцинаций»,

Инструмент способен имитировать измененные галлюцинаторные состояния, обычно вызываемые психоделическими препаратами.

Достижения в области машинного обучения могут быть использованы для получения нового представления о том, что происходит в мозге, сравнивая то, насколько хорошо прогнозирующие модели кодирования работают с другими методами. По крайней мере, внедрение «прогностического кодирования» в искусственные системы может значительно улучшить интеллект этих машин.

Но прежде чем это произойдет, предстоит проделать большую работу. Ученым необходимо продолжить исследования, проводимые Келлером, Швид-Рзиком и другими, чтобы определить, где, например, находятся внутренние репрезентации мозга. И еще предстоит выяснить, могут ли подобные эксперименты подтвердить утверждения о прогностическом кодировании в высших когнитивных процессах.

Теги:

Хабы:

Исследования: как мозг строит гипотезы об окружающем мире и подгоняет ощущения под гипотезы

Теория «прогнозов»

Кофе, сливки и собаки

Байесовский мозг и эффективные вычисления

Универсальность

Ошибка в экспериментах

Поиск «прогностических машин»

Публикации

Истории

Работа

Ближайшие события