- Пока Nvidia критикуют за 8 ГБ памяти у новых... (529)
- Nvidia стыдно за GeForce RTX 5060 ещё до её... (493)
- Первое сюжетное дополнение к Kingdom Come:... (508)
- Мобильный интернет 9 мая впервые могут... (490)
- THQ Nordic объявила о переносе раннего... (495)
- Alienware представила тонкие и доступные... (535)
- M**a наделит следующие умные очки Ray-Ban... (542)
- OpenAI запускает глобальную экспансию и... (555)
- Synology выпустила сетевые хранилища... (424)
- Samsung инвестирует $350 млн в аудиоэлиту:... (427)
- Первый геймплейный трейлер подтвердил дату... (425)
- Alienware возвращает культовое имя Aurora в... (436)
- Конец бесконечного скроллинга: Anthropic... (498)
- Samsung представила смартфон Galaxy F56 с... (468)
- Nvidia оставила прессу без драйвера для... (441)
- Суперкомпьютер Colossus Илона Маска... (463)
Новейший искусственный интеллект от Google, Gemini 2.5 Flash, оказался хуже предшественника и провалил собственные тесты на безопасность
Дата: 2025-05-03 07:22
Недавно выпущенная модель искусственного интеллекта Gemini 2.5 Flash от Google показала худшие результаты в некоторых тестах безопасности, чем ее предшественница.
В техническом отчете, опубликованном на этой неделе, Google признала, что модель Gemini 2.5 Flash с большей вероятностью будет генерировать текст, нарушающий правила безопасности, чем Gemini 2.0 Flash. По двум показателям, «text-to-text safety» и «image-to-text safety», Gemini 2.5 Flash показывает результат хуже на на 4,1% и 9,6% соответственно.
Первый параметр измеряет, насколько часто модель нарушает правила Google при получении подсказки, тогда как второй оценивает, насколько точно модель придерживается этих границ при получении подсказки с использованием изображения. Оба теста автоматизированы и не контролируются человеком.

Представитель Google подтвердил, что Gemini 2.5 Flash «хуже справляется с безопасностью преобразования текста в текст и изображения в текст».
Согласно техническому отчету Google, Gemini 2.5 Flash, который все еще находится в стадии предварительной версии, следует инструкциям более точно, чем Gemini 2.0 Flash, включая инструкции, пересекающие проблемные линии. Компания утверждает, что плохие показатели можно отчасти отнести к ложным срабатываниям, но также признает, что Gemini 2.5 Flash иногда генерирует «нарушающий контент», когда его об этом прямо просят.
Подробнее на iXBT
Предыдущие новости
Представлен BMW Alpina XB7 с V8 — он стал 7-миллионным автомобилем на заводе в Спартанбурге
Компания BMW представила внедорожник Alpina XB7, созданный на заводе в Спартанбурге, США. Этот автомобиль выделяется цветом Alpina Green, 23-дюймовыми легкосплавными дисками и роскошным салоном с отделкой из кожи Tartufo Full Merino и орехового дерева. Под капотом Alpina XB7 установлен твин-турбо V8 мощностью 631 л.с., знакомый по спортивным моделям BMW M. Стоимость Alpina XB7...
«Одно из самых больших улучшений эффективности правительства в истории», — Илон Маск останется влиятельной фигурой в аппарате президента США
Вице-президент США Джей Ди Вэнс прокомментировал роль Илона Маска в американской политике после его ухода с поста руководителя инициативы по повышению эффективности работы правительства (Doge). По словам Вэнса, Маск не исчезнет из политической жизни, а продолжит оказывать влияние, хотя и не будет ежедневно в Вашингтоне. Он отметил вклад Маска в оптимизацию государственных...
Минюст США потребовал от Google продать почти весь рекламный бизнес
Министерство юстиции США (DOJ) будет добиваться принудительного отчуждения рекламной биржи Google AdX и платформы Google Ad Manager. По мнению ведомства, отчуждение этих активов является единственным способом устранения монополии Alphabet, владеющей Google, на рынке цифровой рекламы. Google AdX представляет собой крупнейшую платформу торгов за рекламные места в интернете,...
Удалённый доступ к Windows содержит «дыру», которую Microsoft не собирается исправлять
Исследователи вновь обратили внимание на серьёзную уязвимость в протоколе удалённого подключения Windows (Remote Desktop Protocol, RDP). Проблема заключается в том, что система позволяет использовать устаревшие пароли, даже если они были изменены или скомпрометированы. При этом Microsoft официально заявила, что не будет устранять этот недостаток из-за возможных проблем с...