- Переговоры по привлечению $300 млн оценят... (748)
- AMD достигла рекордной капитализации в $454... (1049)
- Новая статья: Darwin’s Paradox! — платформер... (802)
- «Выглядит намного лучше, чем раньше»: три... (1017)
- Тизер нового компаньона в дополнении... (789)
- Anthropic выпустила Claude Design —... (866)
- В США втихую запустили крупнейшую ветряную... (975)
- До 4 Тбайт китайской флеш-памяти со... (758)
- Европейские стартапы обещают обогнать... (924)
- Инсайдер: в Game Pass может появиться тариф... (1019)
- Глава Nvidia: у Китая уже есть всё, что... (973)
- Asus уточнила, какие блоки питания получат... (878)
- «Теплозащитный экран выглядел великолепно»:... (990)
- Google рассказала, как правильно... (1383)
- Хардкорный шутер Road to Vostok от финского... (1053)
- Microsoft переделывает «Пуск» с нуля:... (924)
Кембридж и Google DeepMind предложили первый научный тест «личности» для нейросетей
Дата: 2026-01-03 05:03
Исследовательская группа из Кембриджского университета и Google DeepMind разработала первый научно обоснованный метод оценки и формирования «личности» у больших языковых моделей (LLM), лежащих в основе популярных чат-ботов, таких как ChatGPT. Используя психологические тесты, обычно применяемые для оценки личности человека, учёные показали, что ИИ не только имитирует человеческие черты характера, но и что его «личность» можно надёжно измерить и точно сформировать.
В ходе исследования было установлено, что крупные модели наиболее точно эмулируют человеческие черты личности. Эти черты можно изменять с помощью запросов, влияя на то, как ИИ выполняет конкретные задачи.
Авторы работы предупреждают, что формирование личности у модели может сделать чат-ботов более убедительными, что вызывает опасения по поводу манипуляций. Они призывают к срочному регулированию ИИ-систем для обеспечения прозрачности и предотвращения злоупотреблений.
Иллюстрация: Grok Учёные предлагают использовать разработанный ими набор данных и код для тестирования «личности» ИИ, которые находятся в открытом доступе, для аудита и тестирования передовых моделей перед их релизом.
Для разработки метода оценки и проверки личности в ИИ-чат-ботах, исследователи протестировали, насколько поведение различных моделей в реальных задачах и тестах проверки статистически связано с их оценками по «большой пятёрке» черт, используемых в психометрическом тестировании: открытость, добросовестность, экстраверсия, доброжелательность и невротизм.
Команда адаптировала два известных теста личности – 300-вопросную версию Revised NEO Personality Inventory и более короткий Big Five Inventory – и применила их к различным LLM, используя структурированные запросы. Исследователи обнаружили, что более крупные, обученные модели дают профили тестов личности, которые являются как надёжными, так и предсказуемыми для поведения, в то время как более мелкие модели дают непоследовательные результаты.
Учёные смогли направлять личность модели по девяти уровням для каждой черты, используя тщательно разработанные запросы. Например, они могли сделать чат-бот более экстравертным или более эмоционально нестабильным – и эти изменения проявлялись в реальных задачах, таких как написание постов в социальных сетях.
Подробнее на iXBT
Предыдущие новости
OpenAI готовит новую аудио-модель в первом квартале 2026 года: компания нацелилась на собственные голосовые устройства
OpenAI планирует представить новую аудио-модель в первом квартале 2026 года, которая станет важным этапом на пути к созданию аппаратных устройств с голосовым управлением. Об этом сообщает издание The Information, ссылаясь на источники, знакомые с планами компании, включая нынешних и бывших сотрудников. По данным издания, OpenAI объединила несколько команд из отделов инженерии,...
Red Bull раскрыла дизайн своего первого гиперкара RB17 с атмосферным V10 и электромотором перед стартом продаж 2026 года
Компания Red Bull представила финальную версию своего первого гиперкара RB17, который претерпел ряд изменений по сравнению с первоначальным концептом, представленным в 2024 году. Первые официальные изображения RB17 v2.0 появились спустя менее года после утечки первых фотографий предсерийной модели. Изображение: Red Bull Racing Внешний вид RB17 заметно изменился. Автомобиль...
Глава Instagram* предсказывает доминирование ИИ-контента и предлагает «цифровые отпечататки» для реальных фото
Глава Instagram* Адам Моссери заявил о готовности платформы к наводнению ИИ-контентом. Он ожидает, что в 2026 году сгенерированные искусственным интеллектом изображения превзойдут по объёму реальные фотографии в лентах пользователей. Моссери видит в этом серьёзную проблему для авторов контента, чья уникальность и аутентичность могут быть поставлены под сомнение. «Всё, что...
IBM представила первый квантовый процессор Nighthawk и открыла ранний доступ к самому мощному Heron
IBM объявила о запуске своего первого квантового процессора архитектуры Nighthawk — IBM_Miami — и одновременно сообщила о выпуске обновлённой системы IBM_Boston, которую компания называет самым мощным вариантом IBM Quantum Heron r3 на сегодняшний день. Процессор IBM_Miami стал преемником IBM_Pittsburgh и уже доступен клиентам в формате раннего доступа в рамках тарифов Premium...