В мире технологий произошел настоящий прорыв! Исследователи из Техасского университета создали уникальную систему ИИ, которая способна превращать звуковые записи в точные изображения улиц. Это открытие ставит под сомнение представление о том, что только человек может связывать звук и визуальные образы.
Команда использовала генеративный ИИ для анализа 100 аудиозаписей с YouTube, охватывающих города Северной Америки, Азии и Европы. На основе этих данных был обучен ИИ, который затем смог создавать высококачественные изображения, основываясь только на 10-секундных звуковых фрагментах. Удивительно, но результаты показали, что машины могут воспроизводить визуальные характеристики окружающей среды, используя только звуковые сигналы.
Исследование также продемонстрировало, что люди могут точно сопоставлять звуки с изображениями в 80% случаев, что сопоставимо с результатами ИИ. Это открывает множество возможностей для применения технологии, например, в создании звуковых ландшафтов для музеев или виртуальной реальности.
Как говорит один из авторов исследования, это может помочь нам лучше понять звуковую среду и даже снизить уровень шума в городах.