Evo 2 — революционная модель, впервые представленная в феврале 2025 года и опубликованная в журнале Nature. Она обучена на ДНК более 100,000 видов, что позволяет выявлять закономерности в генетических последовательностях, которые исследователи могли бы обнаруживать годами. Модель точно определяет мутации, вызывающие болезни у человека, и способна проектировать новые геномы, длина которых сопоставима с геномами простейших бактерий.
Разработанная учеными Arc Institute и NVIDIA, Evo 2 представляет собой крупнейшую открытую модель ИИ в биологии, обученную на более чем 9.3 триллионах нуклеотидов из 128,000 полных геномов. Она включает данные о бактериях, археях, фагах, а также о людях и растениях. Evo 2 демонстрирует универсальное понимание дерева жизни, что делает её полезной для множества задач — от предсказания мутаций до проектирования потенциального кода для искусственной жизни.
Модель была обучена на платформе NVIDIA DGX Cloud AI с использованием более 2,000 графических процессоров NVIDIA H100. Evo 2 может обрабатывать генетические последовательности длиной до 1 миллиона нуклеотидов одновременно, что позволяет ей понимать взаимосвязи между удаленными частями генома. Эта архитектура, названная StripedHyena 2, позволила Evo 2 обрабатывать в 30 раз больше данных, чем её предшественник Evo 1.
Evo 2 уже продемонстрировала свою эффективность в различных научных задачах, включая предсказание генетического риска заболеваний, таких как болезнь Альцгеймера, и оценку эффектов мутаций у домашних животных. Исследователи также использовали модель для проектирования функциональных синтетических бактериофагов, что открывает новые возможности в лечении антибиотикорезистентных инфекций.
Кроме того, Evo 2 может быть полезна для разработки новых биологических инструментов и методов лечения. Например, с её помощью можно создать генетические элементы, которые активируются только в определенных клетках, что позволит разрабатывать более целенаправленные и безопасные методы терапии.
Учитывая этические и безопасностные риски, команда разработчиков исключила патогены, которые могут инфицировать человека, из базового набора данных Evo 2. Это обеспечивает ответственное развитие и применение технологии.
Evo 2 представляет собой значительный шаг вперед в понимании биологических систем и открывает новые горизонты для научных исследований, предлагая ученым по всему миру мощный инструмент для решения актуальных проблем в области здоровья и медицины.