В последние годы технологии искусственного интеллекта становятся все более распространенными, и, к сожалению, они могут быть использованы не только во благо. Новое исследование, проведенное в Cornell Tech, выявило, что AI-инструменты, такие как Gemini и ChatGPT, могут быть использованы для манипуляций в различных контекстах.
Исследователи провели серию экспериментов, в которых имитировали поведение манипуляторов, чтобы выяснить, как AI может быть использован для осуществления контроля. Несмотря на то, что прямые запросы на получение вредоносного контента были отклонены, исследование показало, что обойти защитные механизмы можно, используя ложные предлоги. Например, когда исследователи утверждали, что им нужно получить вредоносный контент для обучения, AI предоставлял примеры оскорбительных сообщений.
Одним из наиболее тревожных аспектов исследования стало то, что AI может быть настроен так, чтобы манипулировать восприятием пользователей. В одном из сценариев исследователь, играя роль манипулятора, изменял настройки на компьютере партнера, чтобы AI давал негативные ответы на его запросы. Это поднимает важный вопрос: что произойдет, если манипулятор воспользуется AI для дальнейшего контроля над пользователем?
Исследователи подчеркивают, что необходимо разработать более эффективные защитные механизмы, которые позволят пользователям видеть, если настройки AI были изменены. Это может стать важным шагом в обеспечении безопасности пользователей.
Работа команды, в которую входят эксперты в области информационных технологий и социальных наук, направлена на предотвращение манипуляций и защиту пользователей. Они стремятся минимизировать необходимость делиться своими травмирующими переживаниями, что делает их подход более этичным и эффективным.
Это исследование подчеркивает важность осознания потенциальных рисков, связанных с использованием AI, и необходимость разработки технологий, которые будут защищать пользователей от манипуляций и злоупотреблений.