Недавние исследования, проведенные командой ученых из MIT, под руководством профессора Энн Грейбел, ставят под сомнение традиционное понимание механизма обучения с подкреплением. Дофамин, известный как "гормон счастья", играет ключевую роль в формировании ассоциаций между сигналами и наградами, но новые данные показывают, что его сигнализация может происходить иначе, чем предполагалось ранее.
Исследователи обнаружили, что дофамин не только реагирует на получение награды, но и начинает активироваться еще до ее получения, когда животное приближается к ожидаемому вознаграждению. Это открытие было сделано с использованием новых сенсоров, которые позволили более детально отслеживать, когда и где происходит выброс дофамина в мозге мышей.
В ходе экспериментов команда заметила, что в разных частях стриатума (области мозга, отвечающей за обучение) время выброса дофамина варьировалось. В частности, в латеральной части стриатума дофамин продолжал выделяться в ответ на награду, даже когда животные уже научились ассоциировать световой сигнал с вознаграждением. В то же время в медиальной части стриатума дофамин не выделялся в момент получения награды, а активировался только при появлении сигнала.
Эти результаты ставят под сомнение классическую модель обучения с подкреплением, которая предполагает, что дофамин должен реагировать на награду, а не на сигнал. Ученые предполагают, что в процессе обучения может играть роль когнитивный аспект, который позволяет мозгу удерживать информацию о сигнале.
Грейбел подчеркивает, что эти открытия могут привести к пересмотру существующих моделей, касающихся влияния базальных ганглиев на движение, мышление и эмоции. Это исследование открывает новые горизонты в понимании того, как мы учимся и как наш мозг обрабатывает информацию о наградах.