- Рождественское «чудо»: BTC сложился с 88 000... (575)
- «Парадоксальную» Fermi America подозревают в... (708)
- В Санкт-Петербурге любят Zeekr: машины... (755)
- OnePlus официально рассекретила «сверхновую... (582)
- Samsung Galaxy Z TriFold выдержал 144 000... (526)
- Новый аккумулятор вместо батарейки AA,... (543)
- Считавшаяся утерянной легендарная ОС UNIX V4... (753)
- Volvo прощается с универсалами: V60 Cross... (660)
- Редчайшую Lada (ВАЗ) 2121 первого поколения... (676)
- АвтоВАЗ раскрыл новинки Lada 2026... (517)
- Культовый мод «Хроники Миртаны: Архолос» для... (632)
- «Lifestyle 2.0. Новогодний»: в России... (534)
- Samsung Wide Fold подозрительно напоминает... (762)
- Snapdragon 8 Gen 5, 7600 мАч, IP68/IP69, 200... (703)
- Не только топовая камера: Xiaomi 17 Ultra со... (551)
- Рост цен на DRAM чуть замедлился к концу... (705)
Google, а как так получилось? Новейший чат-бот Gemini 2.5 Flash оказался хуже предшественника и провалил собственные тесты на безопасность
Дата: 2025-05-03 07:22
Недавно выпущенная модель искусственного интеллекта Gemini 2.5 Flash от Google показала худшие результаты в некоторых тестах безопасности, чем ее предшественница.
В техническом отчете, опубликованном на этой неделе, Google признала, что модель Gemini 2.5 Flash с большей вероятностью будет генерировать текст, нарушающий правила безопасности, чем Gemini 2.0 Flash. По двум показателям, «text-to-text safety» и «image-to-text safety», Gemini 2.5 Flash показывает результат хуже на на 4,1% и 9,6% соответственно.
Первый параметр измеряет, насколько часто модель нарушает правила Google при получении подсказки, тогда как второй оценивает, насколько точно модель придерживается этих границ при получении подсказки с использованием изображения. Оба теста автоматизированы и не контролируются человеком.
Изображение Modjourney Представитель Google подтвердил, что Gemini 2.5 Flash «хуже справляется с безопасностью преобразования текста в текст и изображения в текст».
Согласно техническому отчету Google, Gemini 2.5 Flash, который все еще находится в стадии предварительной версии, следует инструкциям более точно, чем Gemini 2.0 Flash, включая инструкции, пересекающие проблемные линии. Компания утверждает, что плохие показатели можно отчасти отнести к ложным срабатываниям, но также признает, что Gemini 2.5 Flash иногда генерирует «нарушающий контент», когда его об этом прямо просят.
Подробнее на iXBT
Предыдущие новости
Доступный аналог Mercedes-Benz GLS и BMW X7 от Huawei с запасом хода до 1500 км стал суперхитом. За Aito M9 2025 выстроилась многотысячная очередь
Huawei сообщила, что модель Aito M9 2025 года, представленная 20 марта, собрала свыше 50 000 заказов всего за 43 дня. Начальная стоимость автомобиля составила около 66 000 долларов. Эта модель позиционируется как более дешевый аналог Mercedes-Benz GLS и BMW X7. Ранее сообщалось, что всего за 25 дней с начала поставок было реализовано более 10 000 кроссоверов Aito M9 2025. Это...
«Эпическая победа. Теперь давайте поможем освободить остальной мир», — Дуров призывает освободить всех от «гнёта Apple, который душит инновации»
Павел Дуров прокомментировал победу Epic Games над Apple в американском суде, который подтвердил, что в американском App Store больше нет комиссии за транзакции, проведенные за пределами магазина. Отличный бой, Тим Суини и Epic Games, и эпическая победа. Благодаря вам США теперь свободны от 30-процентного гнета Apple, который душил инновации в течение 17 лет. Теперь давайте...
Очень дешёвый, компактный (5,65 дюйма) и неубиваемый смартфон с камерой ночного видения и NFC: представлен Ulefone Armor X32
Ulefone известен своими защищенными смартфонами, которые разработаны для работы в суровых условиях. Бренд только что анонсировал Ulefone Armor X32, который является его новейшим бюджетным защищенным телефоном с современными функциями. За 130 долларов США покупатели получают корпус военного класса (MIL-STD-810H) с рейтингом IP68 и IP69K по водо- и пыленепроницаемости. Это...
Lada Niva теперь потягается с Suzuki Jimny: она оказалась на 20% дешевле именитого внедорожника в ОАЭ
В Объединённых Арабских Эмиратах начались продажи автомобиля Lada Niva, о чём сообщил корреспондент издания «Автопоток» в Дубае. Трёхдверная версия внедорожника доступна по цене 64 000 дирхамов, что эквивалентно примерно 1,5 миллиона рублей. Единственным прямым конкурентом Lada Niva в ОАЭ на данный момент является Suzuki Jimny. Однако японский внедорожник стоит на 20% дороже. ...