- Очень дешевый MacBook вышел вслед за самым... (4626)
- «Яндекс» научил «Алису» управлять смартфоном... (5134)
- Caviar представила эксклюзивные Galaxy S26... (7560)
- Конкурент Tank 500 и Land Cruiser. Марка... (4422)
- Huawei начала глобальные продажи своих... (5712)
- OpenAI разрабатывает прямого конкурента... (4707)
- Chuwi подменила процессор в ноутбуке... (5880)
- Netflix и Spotify без VPN стали доступны... (5322)
- Власти США задумались, не угрожают ли... (4349)
- Новейшие процессоры AMD Ryzen AI 400G, как... (4592)
- Tecno и Tonino Lamborghini представили серию... (5100)
- Suzuki Jimny, подвинься. Анонсирован Renault... (4031)
- Европа и Китай почти одновременно испытали... (5636)
- Xiaomi хочет создавать новую SoC для... (4465)
- Xiaomi показала на MWC 2026 полноразмерный... (5493)
- В M**a появится отдел прикладного ИИ — он... (4342)
Новейший искусственный интеллект от Google, Gemini 2.5 Flash, оказался хуже предшественника и провалил собственные тесты на безопасность
Дата: 2025-05-03 07:22
Недавно выпущенная модель искусственного интеллекта Gemini 2.5 Flash от Google показала худшие результаты в некоторых тестах безопасности, чем ее предшественница.
В техническом отчете, опубликованном на этой неделе, Google признала, что модель Gemini 2.5 Flash с большей вероятностью будет генерировать текст, нарушающий правила безопасности, чем Gemini 2.0 Flash. По двум показателям, «text-to-text safety» и «image-to-text safety», Gemini 2.5 Flash показывает результат хуже на на 4,1% и 9,6% соответственно.
Первый параметр измеряет, насколько часто модель нарушает правила Google при получении подсказки, тогда как второй оценивает, насколько точно модель придерживается этих границ при получении подсказки с использованием изображения. Оба теста автоматизированы и не контролируются человеком.
Изображение Qwen Представитель Google подтвердил, что Gemini 2.5 Flash «хуже справляется с безопасностью преобразования текста в текст и изображения в текст».
Согласно техническому отчету Google, Gemini 2.5 Flash, который все еще находится в стадии предварительной версии, следует инструкциям более точно, чем Gemini 2.0 Flash, включая инструкции, пересекающие проблемные линии. Компания утверждает, что плохие показатели можно отчасти отнести к ложным срабатываниям, но также признает, что Gemini 2.5 Flash иногда генерирует «нарушающий контент», когда его об этом прямо просят.
Подробнее на iXBT
Предыдущие новости
Представлен BMW Alpina XB7 с V8 — он стал 7-миллионным автомобилем на заводе в Спартанбурге
Компания BMW представила внедорожник Alpina XB7, созданный на заводе в Спартанбурге, США. Этот автомобиль выделяется цветом Alpina Green, 23-дюймовыми легкосплавными дисками и роскошным салоном с отделкой из кожи Tartufo Full Merino и орехового дерева. Под капотом Alpina XB7 установлен твин-турбо V8 мощностью 631 л.с., знакомый по спортивным моделям BMW M. Стоимость Alpina XB7...
«Одно из самых больших улучшений эффективности правительства в истории», — Илон Маск останется влиятельной фигурой в аппарате президента США
Вице-президент США Джей Ди Вэнс прокомментировал роль Илона Маска в американской политике после его ухода с поста руководителя инициативы по повышению эффективности работы правительства (Doge). По словам Вэнса, Маск не исчезнет из политической жизни, а продолжит оказывать влияние, хотя и не будет ежедневно в Вашингтоне. Он отметил вклад Маска в оптимизацию государственных...
Минюст США потребовал от Google продать почти весь рекламный бизнес
Министерство юстиции США (DOJ) будет добиваться принудительного отчуждения рекламной биржи Google AdX и платформы Google Ad Manager. По мнению ведомства, отчуждение этих активов является единственным способом устранения монополии Alphabet, владеющей Google, на рынке цифровой рекламы. Google AdX представляет собой крупнейшую платформу торгов за рекламные места в интернете,...
Удалённый доступ к Windows содержит «дыру», которую Microsoft не собирается исправлять
Исследователи вновь обратили внимание на серьёзную уязвимость в протоколе удалённого подключения Windows (Remote Desktop Protocol, RDP). Проблема заключается в том, что система позволяет использовать устаревшие пароли, даже если они были изменены или скомпрометированы. При этом Microsoft официально заявила, что не будет устранять этот недостаток из-за возможных проблем с...