- Цены на российское ПО взлетели на 10–30 % с... (2539)
- Новый суперхит Huawei: самым продаваемым... (3219)
- Возможности WhatsApp* в Apple CarPlay... (2978)
- На выставке «Связь-2026» представлен... (2668)
- «Будущее цвета уже на подходе». Первые... (3191)
- macOS не способна работать без перерывов... (2953)
- «Призрачный шёпот»: США испытали квантовую... (3056)
- Sandisk представила SD-карту памяти Extreme... (2679)
- Новый смартфон Oppo протестирован до анонса.... (2702)
- Ограничения в Telegram и WhatsApp вернули... (2554)
- Япония собралась стать раем для... (2586)
- YouTube начал показывать на телевизорах... (2763)
- После смещения фокуса на ИИ-агентов выручка... (2372)
- Большая рамка, как у старых смартфонов, зато... (2910)
- Samsung четыре месяца подряд повышает цены... (2942)
- И снова подорожание. И без того не самые... (2486)
Кембридж и Google DeepMind предложили первый научный тест «личности» для нейросетей
Дата: 2026-01-03 05:03
Исследовательская группа из Кембриджского университета и Google DeepMind разработала первый научно обоснованный метод оценки и формирования «личности» у больших языковых моделей (LLM), лежащих в основе популярных чат-ботов, таких как ChatGPT. Используя психологические тесты, обычно применяемые для оценки личности человека, учёные показали, что ИИ не только имитирует человеческие черты характера, но и что его «личность» можно надёжно измерить и точно сформировать.
В ходе исследования было установлено, что крупные модели наиболее точно эмулируют человеческие черты личности. Эти черты можно изменять с помощью запросов, влияя на то, как ИИ выполняет конкретные задачи.
Авторы работы предупреждают, что формирование личности у модели может сделать чат-ботов более убедительными, что вызывает опасения по поводу манипуляций. Они призывают к срочному регулированию ИИ-систем для обеспечения прозрачности и предотвращения злоупотреблений.
Иллюстрация: Grok Учёные предлагают использовать разработанный ими набор данных и код для тестирования «личности» ИИ, которые находятся в открытом доступе, для аудита и тестирования передовых моделей перед их релизом.
Для разработки метода оценки и проверки личности в ИИ-чат-ботах, исследователи протестировали, насколько поведение различных моделей в реальных задачах и тестах проверки статистически связано с их оценками по «большой пятёрке» черт, используемых в психометрическом тестировании: открытость, добросовестность, экстраверсия, доброжелательность и невротизм.
Команда адаптировала два известных теста личности – 300-вопросную версию Revised NEO Personality Inventory и более короткий Big Five Inventory – и применила их к различным LLM, используя структурированные запросы. Исследователи обнаружили, что более крупные, обученные модели дают профили тестов личности, которые являются как надёжными, так и предсказуемыми для поведения, в то время как более мелкие модели дают непоследовательные результаты.
Учёные смогли направлять личность модели по девяти уровням для каждой черты, используя тщательно разработанные запросы. Например, они могли сделать чат-бот более экстравертным или более эмоционально нестабильным – и эти изменения проявлялись в реальных задачах, таких как написание постов в социальных сетях.
Подробнее на iXBT
Предыдущие новости
OpenAI готовит новую аудио-модель в первом квартале 2026 года: компания нацелилась на собственные голосовые устройства
OpenAI планирует представить новую аудио-модель в первом квартале 2026 года, которая станет важным этапом на пути к созданию аппаратных устройств с голосовым управлением. Об этом сообщает издание The Information, ссылаясь на источники, знакомые с планами компании, включая нынешних и бывших сотрудников. По данным издания, OpenAI объединила несколько команд из отделов инженерии,...
Red Bull раскрыла дизайн своего первого гиперкара RB17 с атмосферным V10 и электромотором перед стартом продаж 2026 года
Компания Red Bull представила финальную версию своего первого гиперкара RB17, который претерпел ряд изменений по сравнению с первоначальным концептом, представленным в 2024 году. Первые официальные изображения RB17 v2.0 появились спустя менее года после утечки первых фотографий предсерийной модели. Изображение: Red Bull Racing Внешний вид RB17 заметно изменился. Автомобиль...
Глава Instagram* предсказывает доминирование ИИ-контента и предлагает «цифровые отпечататки» для реальных фото
Глава Instagram* Адам Моссери заявил о готовности платформы к наводнению ИИ-контентом. Он ожидает, что в 2026 году сгенерированные искусственным интеллектом изображения превзойдут по объёму реальные фотографии в лентах пользователей. Моссери видит в этом серьёзную проблему для авторов контента, чья уникальность и аутентичность могут быть поставлены под сомнение. «Всё, что...
IBM представила первый квантовый процессор Nighthawk и открыла ранний доступ к самому мощному Heron
IBM объявила о запуске своего первого квантового процессора архитектуры Nighthawk — IBM_Miami — и одновременно сообщила о выпуске обновлённой системы IBM_Boston, которую компания называет самым мощным вариантом IBM Quantum Heron r3 на сегодняшний день. Процессор IBM_Miami стал преемником IBM_Pittsburgh и уже доступен клиентам в формате раннего доступа в рамках тарифов Premium...