- Snapdragon 8 Elite Gen 6 Pro и... (5210)
- «Искра» всё никак не разгорится? В феврале... (4743)
- В жаркие дни ИИ ЦОД способны потреблять воды... (4920)
- Gemini появился в боковой панели Chrome за... (4826)
- iPhone 18 Pro сохранит дизайн модели iPhone... (4849)
- Microsoft первой среди крупных компаний... (4488)
- OpenAI встроит генератор видео Sora прямо в... (4885)
- Oracle уверена, что бум ИИ продлится как... (5168)
- Гигантские радиоимпульсы у магнетара XTE... (4763)
- В Японии ажиотажный спрос на Blu-ray-плееры... (5219)
- 24 ядра с частотой 5,5 ГГц за 300 долларов:... (5102)
- Представлен топовый робот-пылесос Xiaomi Mi... (4754)
- Обогнали YouTube и Rutube: «VK Видео» стал... (4587)
- Дешевых накопителей больше не будет?... (4350)
- Google обеспечит Пентагон ИИ-агентами на... (4951)
- Китай намерен впервые высадить тайконавтов... (4903)
Новейший искусственный интеллект от Google, Gemini 2.5 Flash, оказался хуже предшественника и провалил собственные тесты на безопасность
Дата: 2025-05-03 07:22
Недавно выпущенная модель искусственного интеллекта Gemini 2.5 Flash от Google показала худшие результаты в некоторых тестах безопасности, чем ее предшественница.
В техническом отчете, опубликованном на этой неделе, Google признала, что модель Gemini 2.5 Flash с большей вероятностью будет генерировать текст, нарушающий правила безопасности, чем Gemini 2.0 Flash. По двум показателям, «text-to-text safety» и «image-to-text safety», Gemini 2.5 Flash показывает результат хуже на на 4,1% и 9,6% соответственно.
Первый параметр измеряет, насколько часто модель нарушает правила Google при получении подсказки, тогда как второй оценивает, насколько точно модель придерживается этих границ при получении подсказки с использованием изображения. Оба теста автоматизированы и не контролируются человеком.
Изображение Qwen Представитель Google подтвердил, что Gemini 2.5 Flash «хуже справляется с безопасностью преобразования текста в текст и изображения в текст».
Согласно техническому отчету Google, Gemini 2.5 Flash, который все еще находится в стадии предварительной версии, следует инструкциям более точно, чем Gemini 2.0 Flash, включая инструкции, пересекающие проблемные линии. Компания утверждает, что плохие показатели можно отчасти отнести к ложным срабатываниям, но также признает, что Gemini 2.5 Flash иногда генерирует «нарушающий контент», когда его об этом прямо просят.
Подробнее на iXBT
Предыдущие новости
Представлен BMW Alpina XB7 с V8 — он стал 7-миллионным автомобилем на заводе в Спартанбурге
Компания BMW представила внедорожник Alpina XB7, созданный на заводе в Спартанбурге, США. Этот автомобиль выделяется цветом Alpina Green, 23-дюймовыми легкосплавными дисками и роскошным салоном с отделкой из кожи Tartufo Full Merino и орехового дерева. Под капотом Alpina XB7 установлен твин-турбо V8 мощностью 631 л.с., знакомый по спортивным моделям BMW M. Стоимость Alpina XB7...
«Одно из самых больших улучшений эффективности правительства в истории», — Илон Маск останется влиятельной фигурой в аппарате президента США
Вице-президент США Джей Ди Вэнс прокомментировал роль Илона Маска в американской политике после его ухода с поста руководителя инициативы по повышению эффективности работы правительства (Doge). По словам Вэнса, Маск не исчезнет из политической жизни, а продолжит оказывать влияние, хотя и не будет ежедневно в Вашингтоне. Он отметил вклад Маска в оптимизацию государственных...
Минюст США потребовал от Google продать почти весь рекламный бизнес
Министерство юстиции США (DOJ) будет добиваться принудительного отчуждения рекламной биржи Google AdX и платформы Google Ad Manager. По мнению ведомства, отчуждение этих активов является единственным способом устранения монополии Alphabet, владеющей Google, на рынке цифровой рекламы. Google AdX представляет собой крупнейшую платформу торгов за рекламные места в интернете,...
Удалённый доступ к Windows содержит «дыру», которую Microsoft не собирается исправлять
Исследователи вновь обратили внимание на серьёзную уязвимость в протоколе удалённого подключения Windows (Remote Desktop Protocol, RDP). Проблема заключается в том, что система позволяет использовать устаревшие пароли, даже если они были изменены или скомпрометированы. При этом Microsoft официально заявила, что не будет устранять этот недостаток из-за возможных проблем с...