APPERCASE
vasb@nccrepnfr.eh +7 499 302-34-17

Необъявленная функциональность в системах машинного обучения: что это значит для разработчиков?

Исследователи предупреждают о растущих рисках, связанных с троянцами в моделях искусственного интеллекта, включая скрытые функции и отравление данных.

В последние годы искусственный интеллект стал неотъемлемой частью технологий, но с его развитием возникают и новые угрозы. Одной из самых серьезных проблем является возможность внедрения троянцев в модели ИИ. Это может происходить через скрытые функции или намеренные ошибки, которые на первый взгляд не видны.

Одним из методов является внедрение вредоносного кода в модели. Например, некоторые форматы хранения моделей, такие как pickle в Python, могут содержать исполняемый код. Это позволяет злоумышленникам активировать вредоносные функции при загрузке модели. В 2024 году в репозитории Hugging Face было обнаружено около 100 моделей с вредоносным функционалом, что подчеркивает серьезность проблемы.

Другим способом является отравление данных на этапе обучения. Злоумышленники могут манипулировать исходными наборами данных, чтобы модель работала неправильно в определенных случаях. Например, известен случай с чат-ботом Microsoft Tay, который за один день начал выражать расистские и экстремистские взгляды.

Кроме того, существует метод, называемый "теневая логика", который позволяет модифицировать вычислительный граф модели, добавляя дополнительные ветви, что может привести к нежелательному поведению при определенных входных данных.

Чтобы защитить модели ИИ от таких атак, важно тщательно контролировать цепочку поставок. Это включает в себя проверку источников компонентов системы ИИ, а также использование безопасных форматов для хранения моделей. Ведущие репозитории постепенно внедряют цифровые подписи для проверки подлинности моделей.

Эта новость создана искусственным интеллектом на основе открытых данных и предназначена исключительно для информирования. Администрация сайта не несёт ответственности за её содержание. Новости агрегируются из различных источников, включая недружественные России страны и их средства массовой информации. Социальные сети Facebook, Instagram и WhatsApp принадлежат корпорации Meta, которая в России признана экстремистской организацией.

Google поддерживает Animaj, парижскую студию, использующую ИИ для ускорения производства анимационного контента. Это сотрудничество обещает повысить качество и скорость создания анимации, что особенно актуально в условиях современных трендов.
Hyundai Motor Group объявила о планах инвестировать более 6 миллиардов долларов в создание инновационного хаба в Южной Корее, сосредоточив внимание на робототехнике, искусственном интеллекте и энергетических решениях.
Дивья Бонтала разрабатывает надежные системы управления ИИ для корпоративных технологий, автоматизируя процессы и снижая операционные затраты. Ее работа уже принесла значительные экономические выгоды и признание в отрасли.
Написать нам