В мире технологий искусственный интеллект продолжает удивлять своими возможностями. Недавно исследователи из SINTEF совместно с норвежской компанией Norsonic разработали инновационную систему NoiseTag, которая позволяет эффективно фильтровать шумы на строительных площадках. Эта система помогает отделять звуки, исходящие от строительной техники, от посторонних шумов, таких как крики птиц или проезжающие автомобили.
Согласно словам старшего научного сотрудника Femke B. Gelderblom, работа с аудио является более сложной задачей для искусственного интеллекта по сравнению с анализом изображений или текста. Несмотря на то, что для человека распознавать звуки довольно просто, для AI это представляет собой настоящую проблему. Например, различить звуки, исходящие от одного и того же источника, но на разном расстоянии, может быть сложно для модели.
NoiseTag автоматизирует процесс фильтрации звуков, который ранее требовал ручной работы. Теперь вместо того, чтобы прослушивать записи и удалять ненужные звуки, система обучается на примерах и сама определяет, какие звуки следует оставить, а какие — исключить. Это значительно экономит время и усилия специалистов.
Система использует откалиброванные микрофоны, соответствующие норвежским стандартам измерения строительного шума, и помогает различать шумы, вызванные строительной деятельностью, и окружающие звуки. Gelderblom отмечает, что, хотя люди могут быстро идентифицировать источник звука, машинам требуется обширное обучение. Например, два экскаватора могут звучать по-разному из-за различной скорости работы двигателя, но человек легко распознает их как экскаваторы.
С запуском NoiseTag ожидается, что система будет становиться все более точной по мере накопления данных. Чем больше людей будет использовать устройство, тем лучше оно будет работать.
SINTEF также анонсировала новый исследовательский проект под названием Robust Acoustic Recognition (RoAR), который будет направлен на снижение ручного труда при обучении AI-систем классифицировать новые источники звука. Этот проект продлится до 2028 года и обещает еще больше усовершенствовать технологии распознавания звуков.