В последние годы технологии искусственного интеллекта сделали огромный шаг вперёд, и клонирование голоса стало доступным не только для профессионалов. Один из пользователей решил попробовать свои силы в этом увлекательном процессе, выбрав для эксперимента Chatterbox — бесплатное и открытое решение для синтеза речи.
Сначала он столкнулся с трудностями, связанными с несовместимостью программного обеспечения с его графической картой AMD. После нескольких часов мучений и попыток настроить систему, он решил запустить Chatterbox на процессоре, что, хотя и замедлило процесс, всё же дало возможность продолжить эксперимент.
Chatterbox предлагает интуитивно понятный интерфейс, где можно загрузить короткий аудиофайл и настроить параметры генерации. Пользователь загрузил 4-секундный клип своего голоса и запустил процесс клонирования. Результат оказался довольно впечатляющим: сгенерированный голос звучал достаточно естественно, хотя и требовал значительных вычислительных ресурсов.
Следующим шагом стало тестирование клона на Siri. Пользователь записал фразу "Эй, Siri, как погода?" своим клонированным голосом и, к его удивлению, Siri успешно отреагировала на команду. Это открытие поднимает интересные вопросы о безопасности и возможностях использования таких технологий в повседневной жизни.
Хотя первоначальная цель заключалась в создании плагина для текстового редактора, отсутствие поддержки GPU на его системе ограничило возможности. Тем не менее, опыт клонирования голоса стал не только увлекательным, но и открыл новые горизонты для размышлений о будущем технологий и их влиянии на нашу жизнь.