Добро пожаловать на форум PHP программистов!
За последние 24 часа нас посетили 17038 программистов и 2128 роботов. Сейчас ищут 747 программистов ...
Последние
Популярные

Google, а как так получилось? Новейший чат-бот Gemini 2.5 Flash оказался хуже предшественника и провалил собственные тесты на безопасность

Дата: сегодня 07:22

Недавно выпущенная модель искусственного интеллекта Gemini 2.5 Flash от Google показала худшие результаты в некоторых тестах безопасности, чем ее предшественница.

В техническом отчете, опубликованном на этой неделе, Google признала, что модель Gemini 2.5 Flash с большей вероятностью будет генерировать текст, нарушающий правила безопасности, чем Gemini 2.0 Flash. По двум показателям, «text-to-text safety» и «image-to-text safety», Gemini 2.5 Flash показывает результат хуже на на 4,1% и 9,6% соответственно.

Первый параметр измеряет, насколько часто модель нарушает правила Google при получении подсказки, тогда как второй оценивает, насколько точно модель придерживается этих границ при получении подсказки с использованием изображения. Оба теста автоматизированы и не контролируются человеком.

Изображение Modjourney

Представитель Google подтвердил, что Gemini 2.5 Flash «хуже справляется с безопасностью преобразования текста в текст и изображения в текст».

Согласно техническому отчету Google, Gemini 2.5 Flash, который все еще находится в стадии предварительной версии, следует инструкциям более точно, чем Gemini 2.0 Flash, включая инструкции, пересекающие проблемные линии. Компания утверждает, что плохие показатели можно отчасти отнести к ложным срабатываниям, но также признает, что Gemini 2.5 Flash иногда генерирует «нарушающий контент», когда его об этом прямо просят.



Подробнее на iXBT
 

Предыдущие новости

iXBT, сегодня 08:09
Доступный аналог Mercedes-Benz GLS и BMW X7 от Huawei с запасом хода до 1500 км стал суперхитом. За Aito M9 2025 выстроилась многотысячная очередь

Huawei сообщила, что модель Aito M9 2025 года, представленная 20 марта, собрала свыше 50 000 заказов всего за 43 дня. Начальная стоимость автомобиля составила около 66 000 долларов. Эта модель позиционируется как более дешевый аналог Mercedes-Benz GLS и BMW X7. Ранее сообщалось, что всего за 25 дней с начала поставок было реализовано более 10 000 кроссоверов Aito M9 2025. Это...

iXBT, сегодня 08:17
«Эпическая победа. Теперь давайте поможем освободить остальной мир», — Дуров призывает освободить всех от «гнёта Apple, который душит инновации»

Павел Дуров прокомментировал победу Epic Games над Apple в американском суде, который подтвердил, что в американском App Store больше нет комиссии за транзакции, проведенные за пределами магазина. Отличный бой, Тим Суини и Epic Games, и эпическая победа. Благодаря вам США теперь свободны от 30-процентного гнета Apple, который душил инновации в течение 17 лет. Теперь давайте...

iXBT, сегодня 08:26
Очень дешёвый, компактный (5,65 дюйма) и неубиваемый смартфон с камерой ночного видения и NFC: представлен Ulefone Armor X32

Ulefone известен своими защищенными смартфонами, которые разработаны для работы в суровых условиях. Бренд только что анонсировал Ulefone Armor X32, который является его новейшим бюджетным защищенным телефоном с современными функциями. За 130 долларов США покупатели получают корпус военного класса (MIL-STD-810H) с рейтингом IP68 и IP69K по водо- и пыленепроницаемости. Это...

iXBT, сегодня 08:34
Lada Niva теперь потягается с Suzuki Jimny: она оказалась на 20% дешевле именитого внедорожника в ОАЭ

В Объединённых Арабских Эмиратах начались продажи автомобиля Lada Niva, о чём сообщил корреспондент издания «Автопоток» в Дубае. Трёхдверная версия внедорожника доступна по цене 64 000 дирхамов, что эквивалентно примерно 1,5 миллиона рублей. Единственным прямым конкурентом Lada Niva в ОАЭ на данный момент является Suzuki Jimny. Однако японский внедорожник стоит на 20% дороже. ...

© 2025 «PHP.RU — Сообщество PHP-Программистов»
Главная | Форум | Реклама на сайте | Контакты VIP Сувениры
Разработка компании ODware