Google анонсировал новые модели локальных языковых моделей Gemma 4, которые обещают улучшить баланс между качеством и скоростью работы. Эти модели, основанные на исследовании Gemini 3, представлены в четырех вариантах и выпущены под лицензией Apache 2.0, что значительно упрощает их использование в коммерческих и самохостинговых проектах.
Каждая из моделей Gemma 4 имеет свои особенности. Флагманская 31B модель обеспечивает высокое качество, достигая 89.2% на AIME 2026, в то время как 26B-A4B Mixture of Experts (MoE) модель активирует лишь 3.8 миллиарда параметров за токен, что позволяет ей работать почти так же быстро, как 4B модель, но с качеством, близким к 31B. Это делает 26B-A4B идеальным выбором для пользователей, которые ищут оптимальное соотношение скорости и качества.
Кроме того, Gemma 4 включает два более компактных варианта — E4B и E2B, которые поддерживают не только текст, но и аудио, что открывает новые возможности для создания голосовых помощников и других приложений. Эти модели могут выполнять задачи распознавания речи и обработки аудио без необходимости подключения к облаку, что делает их особенно привлекательными для мобильных устройств и встроенных систем.
Одной из ключевых особенностей Gemma 4 является встроенная поддержка вызова функций, что позволяет моделям эффективно взаимодействовать с внешними инструментами и API. Это значительно упрощает разработку приложений, использующих локальные LLM, и расширяет их функциональность.
Несмотря на некоторые ограничения в производительности, такие как отсутствие Multi-Token Prediction в открытых версиях, Gemma 4 демонстрирует значительные улучшения по сравнению с предыдущими моделями. Пользователи могут ожидать более быструю и качественную работу, что делает эти модели отличным выбором для различных задач в области искусственного интеллекта и обработки данных.