APPERCASE
vasb@nccrepnfr.eh +7 499 302-34-17

Возвращение к обучению с подкреплением: новые горизонты и возможности

Исследование MIT показывает, что традиционная модель обучения с подкреплением может нуждаться в пересмотре. Новые данные о сигнализации дофамина указывают на неожиданные паттерны, которые могут изменить наше понимание этого процесса.

Недавние исследования, проведенные командой ученых из MIT, под руководством профессора Энн Грейбел, ставят под сомнение традиционное понимание механизма обучения с подкреплением. Дофамин, известный как "гормон счастья", играет ключевую роль в формировании ассоциаций между сигналами и наградами, но новые данные показывают, что его сигнализация может происходить иначе, чем предполагалось ранее.

Исследователи обнаружили, что дофамин не только реагирует на получение награды, но и начинает активироваться еще до ее получения, когда животное приближается к ожидаемому вознаграждению. Это открытие было сделано с использованием новых сенсоров, которые позволили более детально отслеживать, когда и где происходит выброс дофамина в мозге мышей.

В ходе экспериментов команда заметила, что в разных частях стриатума (области мозга, отвечающей за обучение) время выброса дофамина варьировалось. В частности, в латеральной части стриатума дофамин продолжал выделяться в ответ на награду, даже когда животные уже научились ассоциировать световой сигнал с вознаграждением. В то же время в медиальной части стриатума дофамин не выделялся в момент получения награды, а активировался только при появлении сигнала.

Эти результаты ставят под сомнение классическую модель обучения с подкреплением, которая предполагает, что дофамин должен реагировать на награду, а не на сигнал. Ученые предполагают, что в процессе обучения может играть роль когнитивный аспект, который позволяет мозгу удерживать информацию о сигнале.

Грейбел подчеркивает, что эти открытия могут привести к пересмотру существующих моделей, касающихся влияния базальных ганглиев на движение, мышление и эмоции. Это исследование открывает новые горизонты в понимании того, как мы учимся и как наш мозг обрабатывает информацию о наградах.

Эта новость создана искусственным интеллектом на основе открытых данных и предназначена исключительно для информирования. Администрация сайта не несёт ответственности за её содержание. Новости агрегируются из различных источников, включая недружественные России страны и их средства массовой информации. Социальные сети Facebook, Instagram и WhatsApp принадлежат корпорации Meta, которая в России признана экстремистской организацией.

Visa и Mastercard представили новые инструменты на основе искусственного интеллекта для бизнеса, стремясь оптимизировать процессы и увеличить доходы за пределами традиционных транзакций.
Министерство труда США представило новый "Фреймворк грамотности в области искусственного интеллекта", который направлен на обучение работников, работодателей и образовательных учреждений основам использования ИИ.
На конференции GDC Nvidia анонсировала Dynamic Multi Frame Generation, которая будет доступна с 31 марта. Эта технология улучшит производительность игр, обеспечивая более высокие частоты кадров на экранах с высокой частотой обновления.
Написать нам