- Radeon RX 9070 XT и RX 9060 XT вдвоём заняли... (4090)
- Microsoft собирается поменьше «пичкать»... (4996)
- MSI предупреждает, что собирается повысить... (4871)
- Такой смартфон точно ни с чем не спутаешь:... (4063)
- 900 вольт, 70 кВтч, 5 лидаров, запас хода... (5266)
- Сэм Альтман предложил платить за ИИ по... (4336)
- MSI рассказала, кто виноват в дефиците... (4210)
- M**a потратит $27 млрд на облачные услуги... (4405)
- Возвращать на Землю эти корабли нет... (4800)
- Foxconn рассчитывает на рекордную выручку... (5367)
- Появилось первое видео Samsung Galaxy S26... (4105)
- Пользователь решил улучшить охлаждение... (4155)
- Судья назвала иск Маска к OpenAI на $134... (3794)
- OpenAI объяснила, почему реклама в ChatGPT... (4588)
- iOS 27 может стать обновлением без громких... (4411)
- 3 ТБ — предел: «Дом.ру» режет скорость... (4464)
Кембридж и Google DeepMind предложили первый научный тест «личности» для нейросетей
Дата: 2026-01-03 05:03
Исследовательская группа из Кембриджского университета и Google DeepMind разработала первый научно обоснованный метод оценки и формирования «личности» у больших языковых моделей (LLM), лежащих в основе популярных чат-ботов, таких как ChatGPT. Используя психологические тесты, обычно применяемые для оценки личности человека, учёные показали, что ИИ не только имитирует человеческие черты характера, но и что его «личность» можно надёжно измерить и точно сформировать.
В ходе исследования было установлено, что крупные модели наиболее точно эмулируют человеческие черты личности. Эти черты можно изменять с помощью запросов, влияя на то, как ИИ выполняет конкретные задачи.
Авторы работы предупреждают, что формирование личности у модели может сделать чат-ботов более убедительными, что вызывает опасения по поводу манипуляций. Они призывают к срочному регулированию ИИ-систем для обеспечения прозрачности и предотвращения злоупотреблений.
Иллюстрация: Grok Учёные предлагают использовать разработанный ими набор данных и код для тестирования «личности» ИИ, которые находятся в открытом доступе, для аудита и тестирования передовых моделей перед их релизом.
Для разработки метода оценки и проверки личности в ИИ-чат-ботах, исследователи протестировали, насколько поведение различных моделей в реальных задачах и тестах проверки статистически связано с их оценками по «большой пятёрке» черт, используемых в психометрическом тестировании: открытость, добросовестность, экстраверсия, доброжелательность и невротизм.
Команда адаптировала два известных теста личности – 300-вопросную версию Revised NEO Personality Inventory и более короткий Big Five Inventory – и применила их к различным LLM, используя структурированные запросы. Исследователи обнаружили, что более крупные, обученные модели дают профили тестов личности, которые являются как надёжными, так и предсказуемыми для поведения, в то время как более мелкие модели дают непоследовательные результаты.
Учёные смогли направлять личность модели по девяти уровням для каждой черты, используя тщательно разработанные запросы. Например, они могли сделать чат-бот более экстравертным или более эмоционально нестабильным – и эти изменения проявлялись в реальных задачах, таких как написание постов в социальных сетях.
Подробнее на iXBT
Предыдущие новости
OpenAI готовит новую аудио-модель в первом квартале 2026 года: компания нацелилась на собственные голосовые устройства
OpenAI планирует представить новую аудио-модель в первом квартале 2026 года, которая станет важным этапом на пути к созданию аппаратных устройств с голосовым управлением. Об этом сообщает издание The Information, ссылаясь на источники, знакомые с планами компании, включая нынешних и бывших сотрудников. По данным издания, OpenAI объединила несколько команд из отделов инженерии,...
Red Bull раскрыла дизайн своего первого гиперкара RB17 с атмосферным V10 и электромотором перед стартом продаж 2026 года
Компания Red Bull представила финальную версию своего первого гиперкара RB17, который претерпел ряд изменений по сравнению с первоначальным концептом, представленным в 2024 году. Первые официальные изображения RB17 v2.0 появились спустя менее года после утечки первых фотографий предсерийной модели. Изображение: Red Bull Racing Внешний вид RB17 заметно изменился. Автомобиль...
Глава Instagram* предсказывает доминирование ИИ-контента и предлагает «цифровые отпечататки» для реальных фото
Глава Instagram* Адам Моссери заявил о готовности платформы к наводнению ИИ-контентом. Он ожидает, что в 2026 году сгенерированные искусственным интеллектом изображения превзойдут по объёму реальные фотографии в лентах пользователей. Моссери видит в этом серьёзную проблему для авторов контента, чья уникальность и аутентичность могут быть поставлены под сомнение. «Всё, что...
IBM представила первый квантовый процессор Nighthawk и открыла ранний доступ к самому мощному Heron
IBM объявила о запуске своего первого квантового процессора архитектуры Nighthawk — IBM_Miami — и одновременно сообщила о выпуске обновлённой системы IBM_Boston, которую компания называет самым мощным вариантом IBM Quantum Heron r3 на сегодняшний день. Процессор IBM_Miami стал преемником IBM_Pittsburgh и уже доступен клиентам в формате раннего доступа в рамках тарифов Premium...