В мире машинного обучения выбор признаков остаётся одной из самых сложных задач, особенно в условиях высоких размерностей. Традиционные методы, такие как оптимизация с помощью роя муравьёв и серых волков, показывают неплохие результаты, но сталкиваются с двумя основными проблемами: избыточностью выбранных признаков и высокой вычислительной стоимостью.
В ответ на эти вызовы был разработан новый алгоритм TMPA-HC, который представляет собой двухступенчатую гетерогенную многонаселённую структуру с кооперативным поиском для выбора признаков в высокоразмерных данных. Алгоритм включает начальную стадию фильтрации на основе оценки Фишера, за которой следует этап оптимизации с использованием многонаселённого подхода.
На втором этапе популяция делится на несколько подгрупп с различными ролями поиска, что позволяет организовать структурированное поведение в исследовании и эксплуатации. Для эффективного взаимодействия между подгруппами TMPA-HC использует несколько кооперативных механизмов, таких как гибридизация элитных особей, циклическая передача информации и реорганизация подгрупп.
Кроме того, алгоритм включает адаптивную стратегию управления, основанную на уровне успеха, которая динамически регулирует интенсивность поиска каждой подгруппы. Легковесный локальный поиск с направлением на элиту и механизмы перезапуска при стагнации повышают стабильность и надёжность сходимости.
Эксперименты на множестве высокоразмерных тестовых наборов данных показали, что TMPA-HC демонстрирует конкурентоспособные результаты в выборе признаков с постоянной сходимостью, что подтверждает его эффективность и стабильность в работе с высокоразмерными данными.
Этот алгоритм открывает новые горизонты для применения в различных областях, где требуется обработка больших объёмов данных, и может значительно улучшить качество моделей машинного обучения.