- Норвегия почти достигла цели по полному... (108)
- Прогноз: новая платформа Apple M5 Max может... (114)
- Хакер, приговорённый к пяти годам тюрьмы за... (104)
- 120 л.с., климат-контроль, 2 подушки... (191)
- Похоже, американские санкции не работают: в... (213)
- Не только аккумулятор 10 080 мАч, но еще и... (247)
- Годовой оборот коротких видео M**a Reels... (283)
- ИИ превзошёл эволюцию в синтезе важнейших... (287)
- В России начали предлагать совершенно новые... (288)
- Snapdragon 8 Elite Gen 6 и Dimensity 9600... (338)
- Популярные белорусские кроссоверы Belgee X50... (607)
- Новое, но только формально. Представлена SoC... (597)
- Cамый прочный в классе изогнутый дисплей, да... (587)
- Дешёвый MacBook с экраном диагональю 12,9... (347)
- Новые чипы Snapdragon X2 Plus для Windows-ПК... (355)
- AMD хочет занять 25% рынка видеокарт в Китае... (342)
Кембридж и Google DeepMind предложили первый научный тест «личности» для нейросетей
Дата: сегодня 05:03
Исследовательская группа из Кембриджского университета и Google DeepMind разработала первый научно обоснованный метод оценки и формирования «личности» у больших языковых моделей (LLM), лежащих в основе популярных чат-ботов, таких как ChatGPT. Используя психологические тесты, обычно применяемые для оценки личности человека, учёные показали, что ИИ не только имитирует человеческие черты характера, но и что его «личность» можно надёжно измерить и точно сформировать.
В ходе исследования было установлено, что крупные модели наиболее точно эмулируют человеческие черты личности. Эти черты можно изменять с помощью запросов, влияя на то, как ИИ выполняет конкретные задачи.
Авторы работы предупреждают, что формирование личности у модели может сделать чат-ботов более убедительными, что вызывает опасения по поводу манипуляций. Они призывают к срочному регулированию ИИ-систем для обеспечения прозрачности и предотвращения злоупотреблений.
Иллюстрация: Grok Учёные предлагают использовать разработанный ими набор данных и код для тестирования «личности» ИИ, которые находятся в открытом доступе, для аудита и тестирования передовых моделей перед их релизом.
Для разработки метода оценки и проверки личности в ИИ-чат-ботах, исследователи протестировали, насколько поведение различных моделей в реальных задачах и тестах проверки статистически связано с их оценками по «большой пятёрке» черт, используемых в психометрическом тестировании: открытость, добросовестность, экстраверсия, доброжелательность и невротизм.
Команда адаптировала два известных теста личности – 300-вопросную версию Revised NEO Personality Inventory и более короткий Big Five Inventory – и применила их к различным LLM, используя структурированные запросы. Исследователи обнаружили, что более крупные, обученные модели дают профили тестов личности, которые являются как надёжными, так и предсказуемыми для поведения, в то время как более мелкие модели дают непоследовательные результаты.
Учёные смогли направлять личность модели по девяти уровням для каждой черты, используя тщательно разработанные запросы. Например, они могли сделать чат-бот более экстравертным или более эмоционально нестабильным – и эти изменения проявлялись в реальных задачах, таких как написание постов в социальных сетях.
Подробнее на iXBT
Предыдущие новости
OpenAI готовит новую аудио-модель в первом квартале 2026 года: компания нацелилась на собственные голосовые устройства
OpenAI планирует представить новую аудио-модель в первом квартале 2026 года, которая станет важным этапом на пути к созданию аппаратных устройств с голосовым управлением. Об этом сообщает издание The Information, ссылаясь на источники, знакомые с планами компании, включая нынешних и бывших сотрудников. По данным издания, OpenAI объединила несколько команд из отделов инженерии,...
Red Bull раскрыла дизайн своего первого гиперкара RB17 с атмосферным V10 и электромотором перед стартом продаж 2026 года
Компания Red Bull представила финальную версию своего первого гиперкара RB17, который претерпел ряд изменений по сравнению с первоначальным концептом, представленным в 2024 году. Первые официальные изображения RB17 v2.0 появились спустя менее года после утечки первых фотографий предсерийной модели. Изображение: Red Bull Racing Внешний вид RB17 заметно изменился. Автомобиль...
Глава Instagram* предсказывает доминирование ИИ-контента и предлагает «цифровые отпечататки» для реальных фото
Глава Instagram* Адам Моссери заявил о готовности платформы к наводнению ИИ-контентом. Он ожидает, что в 2026 году сгенерированные искусственным интеллектом изображения превзойдут по объёму реальные фотографии в лентах пользователей. Моссери видит в этом серьёзную проблему для авторов контента, чья уникальность и аутентичность могут быть поставлены под сомнение. «Всё, что...
IBM представила первый квантовый процессор Nighthawk и открыла ранний доступ к самому мощному Heron
IBM объявила о запуске своего первого квантового процессора архитектуры Nighthawk — IBM_Miami — и одновременно сообщила о выпуске обновлённой системы IBM_Boston, которую компания называет самым мощным вариантом IBM Quantum Heron r3 на сегодняшний день. Процессор IBM_Miami стал преемником IBM_Pittsburgh и уже доступен клиентам в формате раннего доступа в рамках тарифов Premium...