- Microsoft не выпустит портативную Xbox в... (40)
- Пока акции Tesla летят вниз, стоимость... (40)
- Из совета директоров в кресло генерального... (66)
- Колесо в поворотах трется о лонжерон, сбои... (65)
- Новая статья: Обзор процессорного кулера... (56)
- Новая статья: Обзор телевизора Digma Pro... (73)
- Такую Lada Iskra мы ещё не видели: фото... (125)
- Всё та же корейская сборка, японские... (120)
- Первый след на Луне в новой эре исследований... (169)
- Тот же Volkswagen Jetta, только больше и... (163)
- Авторы амбициозного симулятора жизни Inzoi... (160)
- Одна только Radeon RX 9070 XT продалась... (175)
- Intel показала очень важные для себя... (193)
- Пионер в сфере роботов-пылесосов iRobot... (188)
- Израильский стартап BeeFree Agro выпустил... (199)
- Intel в живую показала 18-ангстремный... (177)
Google анонсировала Gemma 3 — малую ИИ-модель с контекстом 128K токенов и мультимодальностью
Дата: 2025-03-12 20:16
Несмотря на популярность крупных языковых моделей, компании всё чаще обращаются к компактным решениям, чтобы сократить энергозатраты и расходы на вычисления. В ответ на этот тренд Google выпустила третью версию своей малой языковой модели Gemma 3, сохранившей производительность «старших» моделей Gemini 2.0, но оптимизированной для работы на устройствах с ограниченными ресурсами — смартфонах, ноутбуках и серверах с базовыми GPU.
Новая модель доступна в четырёх вариантах: 1B, 4B, 12B и 27B параметров. Главное улучшение — увеличение контекстного окна до 128 тысяч токенов против 80 тысяч у Gemma 2. Это позволяет обрабатывать более объёмные запросы и сложные сценарии. Gemma 3 поддерживает мультимодальный анализ текста, изображений и коротких видео, автоматизацию задач через вызов функций, а также работает с 140 языками.

Для дальнейшего снижения вычислительных затрат Google представила квантованные версии модели. Квантование, или сокращение точности числовых значений в весах нейросети, действует как «сжатие» без потери точности. Это позволяет запускать Gemma 3 даже на одном GPU или TPU, что критично для локальных приложений.
По заявлению компании, Gemma 3 демонстрирует «передовую производительность для своего класса», опережая такие LLM, как Llama-405B, DeepSeek-V3 и o3-mini. В тестах Chatbot Arena Elo версия 27B заняла второе место после DeepSeek-R1, обойдя Mistral Large и Claude 3.7 Sonnet.
Разработчики могут интегрировать Gemma 3 через инструменты вроде Hugging Face Transformers, Ollama, PyTorch, JAX и Keras, а также через Google AI Studio, Hugging Face или Kaggle. Для корпоративных клиентов доступен запрос к API модели через AI Studio.
Безопасность стала ключевым фокусом обновления. В Gemma 3 встроен ShieldGemma 2 — 4B-параметровый фильтр изображений, блокирующий генерацию контента с насилием, сексуальными сценами и другими нарушениями. Система допускает кастомизацию под нужды пользователей. Как отметили в Google, при обучении модели использовались строгие правила обработки данных, тонкая настройка в соответствии с политиками безопасности и тесты на риски, включая оценку потенциального misuse в создании опасных веществ.
Интерес к малым моделям резко вырос после дебюта первой Gemma в феврале 2024 года. Такие решения, как Microsoft Phi-4 и Mistral Small 3, подтверждают спрос на ИИ, способный решать узкие задачи без избыточных мощностей LLM. При этом Gemma не является дистиллированной версией Gemini — она обучалась на том же наборе данных и архитектуре, но без прямого «наследования» знаний от крупной модели.
Компании всё чаще выбирают SLM или дистиллированные версии LLM для конкретных сценариев. Например, вместо развёртывания мощной модели вроде Claude 3.7 Sonnet для простого редактора кода эффективнее использовать компактный аналог, который не требует значительных ресурсов и снижает риски переобучения. С выходом Gemma 3 Google укрепляет позиции в этом сегменте, предлагая баланс между производительностью, стоимостью и безопасностью.
Подробнее на iXBT
Предыдущие новости
Разработчики Titan Quest 2 анонсировали эксклюзивное тестирование — допустят только избранных
Мифологический ролевой экшен Titan Quest 2 до сих пор не вышел в раннем доступе, но скоро у игроков всё-таки появится возможность опробовать проект студии Grimlore Games (SpellForce 3) и издательства THQ Nordic. Источник изображений: THQ...
Niantic продаст Pokemon Go и остальной игровой бизнес создателю Monopoly Go и Stumble Guys за 3,5 миллиарда долларов
Сделка по продаже игрового имущества американской компании Niantic (Pokemon Go, Pikmin Bloom, Monster Hunter Now), о которой в феврале сообщали источники издания Bloomberg, всё-таки состоится. Источник изображения:
Оказывается, бывший завод Hyundai в России вообще не останавливался. Объемы производства растут, поставщики активно набирают персонал
Южнокорейские поставщики завода АГР (бывший завод Hyundai Motor) активизировались и начали набор персонала. Вакансии открыли Hyundai Mobis (производит переднюю панель, передний и задний бамперы, собирает подушки безопасности), Hyundai WIA (двигатели), «Петерформ» (кузовные детали), Hyundai Steel Rus (стальной лист для кузовных панелей), Sungwoo Hitech (каркасы дверей, сидений,...
Учёные предупредили: автономные системы ИИ снижают аварии, но создают риски для экономики и этики
Прогресс искусственного интеллекта в инженерии продолжает набирать обороты, однако масштабное внедрение технологии сопровождается не только прорывами, но и комплексными вызовами. Отправной точкой для дискуссии стал конкурс DARPA 2004 года, где автономные автомобили пытались преодолеть 150 миль по бездорожью — лучший результат тогда не превысил 8 миль. Всего через год пять...