Google официально объявила о запуске новой серии открытых моделей четвертого поколения — Gemma 4. Эта модель использует ту же техническую архитектуру, что и Gemini 3, полностью переходит на коммерчески дружественную лицензию Apache 2.0 и делает акцент на мощных возможностях запуска на локальном устройстве.
(Контекст: Google квантовые компьютеры, как сообщается, взломали биткоин за 9 минут — как считать цифры и где реальная угроза?)
(Дополнение к фону: Прогнозирование стихийных бедствий с помощью ИИ — Google представила фреймворк «Groundsource», который с помощью Gemini превращает мировые новости в 2,6 млн данных, спасающих жизни)
Оглавление
Переключатель
Google вновь делает мощный выпад в сфере open source AI. Официально объявлено о запуске серии «Gemma 4»: утверждается, что это самые умные открытые модели в линейке компании. Gemma 4 напрямую унаследовала мировые исследовательские технологии флагманской модели Gemini 3, обеспечивая прорывные возможности рассуждений и агентные (Agentic) рабочие процессы. Больше всего привлекло внимание сообщества то, что Google на этот раз откликнулась на запросы разработчиков: полностью перешла на коммерчески дружественную лицензию Apache 2.0, позволяя пользователям свободно собирать и безопасно разворачивать решения в любой среде, полностью контролируя собственные данные и инфраструктуру.
Мы только что выпустили Gemma 4 — наши самые интеллектуальные открытые модели на сегодняшний день.
Построенная на тех же мировых исследованиях, что и Gemini 3, Gemma 4 приносит прорывной интеллект прямо на ваше собственное оборудование для продвинутых рассуждений и агентных рабочих процессов.
Выпущена под коммерческой… pic.twitter.com/W6Tvj9CuHW
— Google (@Google) 2 апреля 2026 г.
Чтобы удовлетворить разные сценарии с разным железом и в разных приложениях, Gemma 4 выпущена в четырех версиях различного масштаба. Самая легкая E2B (2B параметров) предназначена для мобильных устройств и пограничных устройств вроде браузеров; E4B (4B параметров) балансирует между производительностью и эффективностью и более нативно поддерживает ввод зрения и аудио. А на стороне высокопроизводительных конфигураций 26B A4B использует архитектуру «Mixture of Experts» (MoE): при рассуждении запускается примерно только 4B параметров, что существенно снижает требования к памяти — даже на потребительских устройствах вроде Mac Mini с 24GB памяти Gemma 4 может работать плавно. Самая старшая версия — плотная модель на 31B — является флагманом производительности всей серии.
С точки зрения технических характеристик, в версиях крупной модели Gemma 4 максимальная поддержка контекстного окна достигает 256K токенов, позволяя разработчикам за один раз обрабатывать целиком репозиторий кода или массивные документы. Помимо нативной поддержки обработки текста и изображений (E2B и E4B также поддерживают аудио), Gemma 4 обладает мощной нативной возможностью вызова функций (Function Calling): она стабильно выдает структурированный формат JSON, что обеспечивает отличную основу для построения автономных агентных приложений. Кроме того, ее обучающие данные включают более 140 языков, что обеспечивает высокую глобальную применимость.
Gemma 4 делает акцент на крайне высокой «эффективности на байт». Согласно данным открытых рейтингов моделей вроде AI Arena, Gemma-4-31B сейчас занимает 3-е место среди открытых моделей, а общая производительность даже сопоставима с громоздкой Qwen3.5-397B, хотя ее масштаб составляет лишь одну десятую от размера последней. В исследовательском уровне тестов на рассуждения (GPQA Diamond) версия на 31B также показала выдающиеся 84,3%.
Давайте посмотрим, как развивалась открытая модель Gemma в ее последних трех версиях.
– Gemma 4 занимает 100 позиций выше, чем Gemma 3
– Gemma 3 занимает 87 позиций выше, чем Gemma 2Все три модели от @GoogleDeepMind примерно одного размера (31B, 27B, 27B), и эти улучшения пришли лишь через 9 и 13… https://t.co/9JnbveYzwT pic.twitter.com/JQtTz09Y1A
— Arena.ai (@arena) 2 апреля 2026 г.
На данный момент разработчики могут напрямую опробовать Gemma 4 в Google AI Studio или перейти на такие платформы, как Hugging Face, Ollama, чтобы скачать весовые модели. Сообщество также быстро подключилось: были выпущены квантованные версии, оптимизированные под GPU. Однако некоторые разработчики отмечают, что при работе с реально сложными сценариями отладки кода у Gemma 4 все еще есть пространство для оптимизации. Но в целом этот релиз с открытым исходным кодом без сомнений стал сильным стимулом, чтобы усилить цифровой суверенитет и локальные AI-приложения.