- SK hynix начала массовое производство... (1270)
- Huawei представила флагман Pura 90 Pro Max с... (1042)
- Набирающий силу профсоюз Samsung... (1176)
- На IMEI сто рублей: новый закон может... (1414)
- Для самых мощных видеокарт: Micron начала... (1154)
- Vitality разгромила Spirit в финале IEM Rio... (1435)
- Спустя 28 лет фанаты раскрыли «один из... (1648)
- «Однодолларовый» одноплатник BeagleConnect... (1339)
- Регуляторы увидели в ИИ-модели Anthropic... (1441)
- Продажи пиратского симулятора выживания... (1218)
- Capcom похвасталась «мощным стартом»... (1151)
- Обновление iOS 26.4.1 окирпичивает iPhone,... (1063)
- Ракета Blue Origin вывела спутник на... (854)
- Huawei выпустила умные часы Watch Buds 2 со... (1305)
- Российский датамайнер нашёл в Resident Evil... (1059)
- Представлен Huawei Vision Smart Screen S7... (903)
Google, а как так получилось? Новейший чат-бот Gemini 2.5 Flash оказался хуже предшественника и провалил собственные тесты на безопасность
Дата: 2025-05-03 07:22
Недавно выпущенная модель искусственного интеллекта Gemini 2.5 Flash от Google показала худшие результаты в некоторых тестах безопасности, чем ее предшественница.
В техническом отчете, опубликованном на этой неделе, Google признала, что модель Gemini 2.5 Flash с большей вероятностью будет генерировать текст, нарушающий правила безопасности, чем Gemini 2.0 Flash. По двум показателям, «text-to-text safety» и «image-to-text safety», Gemini 2.5 Flash показывает результат хуже на на 4,1% и 9,6% соответственно.
Первый параметр измеряет, насколько часто модель нарушает правила Google при получении подсказки, тогда как второй оценивает, насколько точно модель придерживается этих границ при получении подсказки с использованием изображения. Оба теста автоматизированы и не контролируются человеком.
Изображение Modjourney Представитель Google подтвердил, что Gemini 2.5 Flash «хуже справляется с безопасностью преобразования текста в текст и изображения в текст».
Согласно техническому отчету Google, Gemini 2.5 Flash, который все еще находится в стадии предварительной версии, следует инструкциям более точно, чем Gemini 2.0 Flash, включая инструкции, пересекающие проблемные линии. Компания утверждает, что плохие показатели можно отчасти отнести к ложным срабатываниям, но также признает, что Gemini 2.5 Flash иногда генерирует «нарушающий контент», когда его об этом прямо просят.
Подробнее на iXBT
Предыдущие новости
Доступный аналог Mercedes-Benz GLS и BMW X7 от Huawei с запасом хода до 1500 км стал суперхитом. За Aito M9 2025 выстроилась многотысячная очередь
Huawei сообщила, что модель Aito M9 2025 года, представленная 20 марта, собрала свыше 50 000 заказов всего за 43 дня. Начальная стоимость автомобиля составила около 66 000 долларов. Эта модель позиционируется как более дешевый аналог Mercedes-Benz GLS и BMW X7. Ранее сообщалось, что всего за 25 дней с начала поставок было реализовано более 10 000 кроссоверов Aito M9 2025. Это...
«Эпическая победа. Теперь давайте поможем освободить остальной мир», — Дуров призывает освободить всех от «гнёта Apple, который душит инновации»
Павел Дуров прокомментировал победу Epic Games над Apple в американском суде, который подтвердил, что в американском App Store больше нет комиссии за транзакции, проведенные за пределами магазина. Отличный бой, Тим Суини и Epic Games, и эпическая победа. Благодаря вам США теперь свободны от 30-процентного гнета Apple, который душил инновации в течение 17 лет. Теперь давайте...
Очень дешёвый, компактный (5,65 дюйма) и неубиваемый смартфон с камерой ночного видения и NFC: представлен Ulefone Armor X32
Ulefone известен своими защищенными смартфонами, которые разработаны для работы в суровых условиях. Бренд только что анонсировал Ulefone Armor X32, который является его новейшим бюджетным защищенным телефоном с современными функциями. За 130 долларов США покупатели получают корпус военного класса (MIL-STD-810H) с рейтингом IP68 и IP69K по водо- и пыленепроницаемости. Это...
Lada Niva теперь потягается с Suzuki Jimny: она оказалась на 20% дешевле именитого внедорожника в ОАЭ
В Объединённых Арабских Эмиратах начались продажи автомобиля Lada Niva, о чём сообщил корреспондент издания «Автопоток» в Дубае. Трёхдверная версия внедорожника доступна по цене 64 000 дирхамов, что эквивалентно примерно 1,5 миллиона рублей. Единственным прямым конкурентом Lada Niva в ОАЭ на данный момент является Suzuki Jimny. Однако японский внедорожник стоит на 20% дороже. ...