- В Китае назвали самые «дальнобойные» гибриды... (582)
- Стало известно, когда ожидать первый iPhone... (407)
- Realme возвращается в (660)
- Это как умная колонка, только с... (593)
- Дженсен Хуанг обвалил акции производителей... (389)
- У каждой клавиши свой экран, а рядом экран... (575)
- Motorola представила свой первый... (706)
- Представлен панорамный корпус Asus ROG... (401)
- Летающий мотоцикл Leo Flight впервые... (586)
- Теперь Raspberry Pi 5 стоят как самые... (405)
- Razer начала выпускать рабочие станции для... (535)
- На Камчатке больше недели не работает... (644)
- Апскейлер DLSS 4.5 ориентирован на режимы с... (405)
- Поясница скажет спасибо. Представлено первое... (739)
- Учёные впервые увидели самую далёкую... (397)
- Связка из Ryzen 9955HX3D и RTX 5090 Laptop.... (623)
Новейший искусственный интеллект от Google, Gemini 2.5 Flash, оказался хуже предшественника и провалил собственные тесты на безопасность
Дата: 2025-05-03 07:22
Недавно выпущенная модель искусственного интеллекта Gemini 2.5 Flash от Google показала худшие результаты в некоторых тестах безопасности, чем ее предшественница.
В техническом отчете, опубликованном на этой неделе, Google признала, что модель Gemini 2.5 Flash с большей вероятностью будет генерировать текст, нарушающий правила безопасности, чем Gemini 2.0 Flash. По двум показателям, «text-to-text safety» и «image-to-text safety», Gemini 2.5 Flash показывает результат хуже на на 4,1% и 9,6% соответственно.
Первый параметр измеряет, насколько часто модель нарушает правила Google при получении подсказки, тогда как второй оценивает, насколько точно модель придерживается этих границ при получении подсказки с использованием изображения. Оба теста автоматизированы и не контролируются человеком.
Изображение Qwen Представитель Google подтвердил, что Gemini 2.5 Flash «хуже справляется с безопасностью преобразования текста в текст и изображения в текст».
Согласно техническому отчету Google, Gemini 2.5 Flash, который все еще находится в стадии предварительной версии, следует инструкциям более точно, чем Gemini 2.0 Flash, включая инструкции, пересекающие проблемные линии. Компания утверждает, что плохие показатели можно отчасти отнести к ложным срабатываниям, но также признает, что Gemini 2.5 Flash иногда генерирует «нарушающий контент», когда его об этом прямо просят.
Подробнее на iXBT
Предыдущие новости
Представлен BMW Alpina XB7 с V8 — он стал 7-миллионным автомобилем на заводе в Спартанбурге
Компания BMW представила внедорожник Alpina XB7, созданный на заводе в Спартанбурге, США. Этот автомобиль выделяется цветом Alpina Green, 23-дюймовыми легкосплавными дисками и роскошным салоном с отделкой из кожи Tartufo Full Merino и орехового дерева. Под капотом Alpina XB7 установлен твин-турбо V8 мощностью 631 л.с., знакомый по спортивным моделям BMW M. Стоимость Alpina XB7...
«Одно из самых больших улучшений эффективности правительства в истории», — Илон Маск останется влиятельной фигурой в аппарате президента США
Вице-президент США Джей Ди Вэнс прокомментировал роль Илона Маска в американской политике после его ухода с поста руководителя инициативы по повышению эффективности работы правительства (Doge). По словам Вэнса, Маск не исчезнет из политической жизни, а продолжит оказывать влияние, хотя и не будет ежедневно в Вашингтоне. Он отметил вклад Маска в оптимизацию государственных...
Минюст США потребовал от Google продать почти весь рекламный бизнес
Министерство юстиции США (DOJ) будет добиваться принудительного отчуждения рекламной биржи Google AdX и платформы Google Ad Manager. По мнению ведомства, отчуждение этих активов является единственным способом устранения монополии Alphabet, владеющей Google, на рынке цифровой рекламы. Google AdX представляет собой крупнейшую платформу торгов за рекламные места в интернете,...
Удалённый доступ к Windows содержит «дыру», которую Microsoft не собирается исправлять
Исследователи вновь обратили внимание на серьёзную уязвимость в протоколе удалённого подключения Windows (Remote Desktop Protocol, RDP). Проблема заключается в том, что система позволяет использовать устаревшие пароли, даже если они были изменены или скомпрометированы. При этом Microsoft официально заявила, что не будет устранять этот недостаток из-за возможных проблем с...