- Лояльность к iPhone превысила 96 % —... (5898)
- Ветеран Apple, который выводил на рынок... (5362)
- Смартфон Huawei Mate 80 Pro с продвинутыми... (5511)
- Надёжный инсайдер подтвердил дату выхода... (5502)
- Одноплатный компьютер Orange Pi Zero 3W... (6503)
- Intel наняла руководителя для своего... (5773)
- Tesla уже ищет на Тайване инженеров для... (8198)
- OnePlus покинет ключевые рынки и... (5289)
- Акции ASML и TSMC упали в цене на фоне... (5479)
- ИИ-агент OpenAI Codex получил многие... (5721)
- Новая статья: Обзор Dreame X60 Ultra... (6265)
- Ядро Linux лишается поддержки российских... (6783)
- Ракета Blue Origin New Glenn прошла огневые... (6216)
- Нуарный ретрошутер Mouse: P.I. For Hire... (5753)
- Keychron представила геймерские беспроводные... (6630)
- Metro 2039 отправит бороться с кошмарами... (6944)
Новейший искусственный интеллект от Google, Gemini 2.5 Flash, оказался хуже предшественника и провалил собственные тесты на безопасность
Дата: 2025-05-03 07:22
Недавно выпущенная модель искусственного интеллекта Gemini 2.5 Flash от Google показала худшие результаты в некоторых тестах безопасности, чем ее предшественница.
В техническом отчете, опубликованном на этой неделе, Google признала, что модель Gemini 2.5 Flash с большей вероятностью будет генерировать текст, нарушающий правила безопасности, чем Gemini 2.0 Flash. По двум показателям, «text-to-text safety» и «image-to-text safety», Gemini 2.5 Flash показывает результат хуже на на 4,1% и 9,6% соответственно.
Первый параметр измеряет, насколько часто модель нарушает правила Google при получении подсказки, тогда как второй оценивает, насколько точно модель придерживается этих границ при получении подсказки с использованием изображения. Оба теста автоматизированы и не контролируются человеком.
Изображение Qwen Представитель Google подтвердил, что Gemini 2.5 Flash «хуже справляется с безопасностью преобразования текста в текст и изображения в текст».
Согласно техническому отчету Google, Gemini 2.5 Flash, который все еще находится в стадии предварительной версии, следует инструкциям более точно, чем Gemini 2.0 Flash, включая инструкции, пересекающие проблемные линии. Компания утверждает, что плохие показатели можно отчасти отнести к ложным срабатываниям, но также признает, что Gemini 2.5 Flash иногда генерирует «нарушающий контент», когда его об этом прямо просят.
Подробнее на iXBT
Предыдущие новости
Представлен BMW Alpina XB7 с V8 — он стал 7-миллионным автомобилем на заводе в Спартанбурге
Компания BMW представила внедорожник Alpina XB7, созданный на заводе в Спартанбурге, США. Этот автомобиль выделяется цветом Alpina Green, 23-дюймовыми легкосплавными дисками и роскошным салоном с отделкой из кожи Tartufo Full Merino и орехового дерева. Под капотом Alpina XB7 установлен твин-турбо V8 мощностью 631 л.с., знакомый по спортивным моделям BMW M. Стоимость Alpina XB7...
«Одно из самых больших улучшений эффективности правительства в истории», — Илон Маск останется влиятельной фигурой в аппарате президента США
Вице-президент США Джей Ди Вэнс прокомментировал роль Илона Маска в американской политике после его ухода с поста руководителя инициативы по повышению эффективности работы правительства (Doge). По словам Вэнса, Маск не исчезнет из политической жизни, а продолжит оказывать влияние, хотя и не будет ежедневно в Вашингтоне. Он отметил вклад Маска в оптимизацию государственных...
Минюст США потребовал от Google продать почти весь рекламный бизнес
Министерство юстиции США (DOJ) будет добиваться принудительного отчуждения рекламной биржи Google AdX и платформы Google Ad Manager. По мнению ведомства, отчуждение этих активов является единственным способом устранения монополии Alphabet, владеющей Google, на рынке цифровой рекламы. Google AdX представляет собой крупнейшую платформу торгов за рекламные места в интернете,...
Удалённый доступ к Windows содержит «дыру», которую Microsoft не собирается исправлять
Исследователи вновь обратили внимание на серьёзную уязвимость в протоколе удалённого подключения Windows (Remote Desktop Protocol, RDP). Проблема заключается в том, что система позволяет использовать устаревшие пароли, даже если они были изменены или скомпрометированы. При этом Microsoft официально заявила, что не будет устранять этот недостаток из-за возможных проблем с...