- Бесплатная энергия из неба? Японские ученые... (42)
- Водородный гигант XCIENT Fuel Cell от... (48)
- Дубай и Microsoft строят мега-дата-центр за... (44)
- Десятилетия без перезарядки: Южная Корея... (58)
- «Мы на пороге разгадки одной из величайших... (66)
- Производительность i9 за разумные деньги?... (59)
- Учёные обнаружили, что популярные языковые... (64)
- Новые пошлины США обойдутся M**a в несколько... (189)
- Huawei представила быстрый внешний SSD,... (181)
- Астрономы обнаружили ещё один фрагмент Луны... (221)
- Volkswagen объявила об отзыве... (220)
- Европейские пользователи TikTok под... (216)
- В Швейцарии построили грузового робота LEVA,... (215)
- Volkswagen Tacqua с простым мотором и... (220)
- В Австралии запустили солнечный промышленный... (231)
- Radeon RX 9070 и RX 9070 XT больше не... (241)
Google, а как так получилось? Новейший чат-бот Gemini 2.5 Flash оказался хуже предшественника и провалил собственные тесты на безопасность
Дата: сегодня 07:22
Недавно выпущенная модель искусственного интеллекта Gemini 2.5 Flash от Google показала худшие результаты в некоторых тестах безопасности, чем ее предшественница.
В техническом отчете, опубликованном на этой неделе, Google признала, что модель Gemini 2.5 Flash с большей вероятностью будет генерировать текст, нарушающий правила безопасности, чем Gemini 2.0 Flash. По двум показателям, «text-to-text safety» и «image-to-text safety», Gemini 2.5 Flash показывает результат хуже на на 4,1% и 9,6% соответственно.
Первый параметр измеряет, насколько часто модель нарушает правила Google при получении подсказки, тогда как второй оценивает, насколько точно модель придерживается этих границ при получении подсказки с использованием изображения. Оба теста автоматизированы и не контролируются человеком.

Представитель Google подтвердил, что Gemini 2.5 Flash «хуже справляется с безопасностью преобразования текста в текст и изображения в текст».
Согласно техническому отчету Google, Gemini 2.5 Flash, который все еще находится в стадии предварительной версии, следует инструкциям более точно, чем Gemini 2.0 Flash, включая инструкции, пересекающие проблемные линии. Компания утверждает, что плохие показатели можно отчасти отнести к ложным срабатываниям, но также признает, что Gemini 2.5 Flash иногда генерирует «нарушающий контент», когда его об этом прямо просят.
Подробнее на iXBT
Предыдущие новости
Доступный аналог Mercedes-Benz GLS и BMW X7 от Huawei с запасом хода до 1500 км стал суперхитом. За Aito M9 2025 выстроилась многотысячная очередь
Huawei сообщила, что модель Aito M9 2025 года, представленная 20 марта, собрала свыше 50 000 заказов всего за 43 дня. Начальная стоимость автомобиля составила около 66 000 долларов. Эта модель позиционируется как более дешевый аналог Mercedes-Benz GLS и BMW X7. Ранее сообщалось, что всего за 25 дней с начала поставок было реализовано более 10 000 кроссоверов Aito M9 2025. Это...
«Эпическая победа. Теперь давайте поможем освободить остальной мир», — Дуров призывает освободить всех от «гнёта Apple, который душит инновации»
Павел Дуров прокомментировал победу Epic Games над Apple в американском суде, который подтвердил, что в американском App Store больше нет комиссии за транзакции, проведенные за пределами магазина. Отличный бой, Тим Суини и Epic Games, и эпическая победа. Благодаря вам США теперь свободны от 30-процентного гнета Apple, который душил инновации в течение 17 лет. Теперь давайте...
Очень дешёвый, компактный (5,65 дюйма) и неубиваемый смартфон с камерой ночного видения и NFC: представлен Ulefone Armor X32
Ulefone известен своими защищенными смартфонами, которые разработаны для работы в суровых условиях. Бренд только что анонсировал Ulefone Armor X32, который является его новейшим бюджетным защищенным телефоном с современными функциями. За 130 долларов США покупатели получают корпус военного класса (MIL-STD-810H) с рейтингом IP68 и IP69K по водо- и пыленепроницаемости. Это...
Lada Niva теперь потягается с Suzuki Jimny: она оказалась на 20% дешевле именитого внедорожника в ОАЭ
В Объединённых Арабских Эмиратах начались продажи автомобиля Lada Niva, о чём сообщил корреспондент издания «Автопоток» в Дубае. Трёхдверная версия внедорожника доступна по цене 64 000 дирхамов, что эквивалентно примерно 1,5 миллиона рублей. Единственным прямым конкурентом Lada Niva в ОАЭ на данный момент является Suzuki Jimny. Однако японский внедорожник стоит на 20% дороже. ...