- Bitcoin переживёт обрыв почти всех морских... (4266)
- Обида на $50 млрд: Microsoft задумала подать... (4750)
- Представлен BMW i3 — первый полностью... (4726)
- Стартап Сэма Альтмана хочет привязать... (3922)
- BenQ выпустила 28-дюймовый 4K-монитор... (4512)
- 20 000 мАч, 87 Вт, встроенный кабель USB-C —... (4987)
- ИИ становится дороже: Alibaba резко подняла... (4436)
- Москвичи стали чаще звонить и писать SMS... (4426)
- Microsoft передумала принудительно добавлять... (4128)
- Samsung разморозила разработку настоящих... (4688)
- Дыра в безопасности процессоров MediaTek... (3962)
- В США разрешили ограниченное использование... (4746)
- Почти $1000 за терабайт: SSD формата M.2 на... (4382)
- Суд решил, что Apple может удалять... (3982)
- Windows 11 с двумя кнопками «Пуск»... (4250)
- Bethesda не бросит Starfield после... (4203)
Кембридж и Google DeepMind предложили первый научный тест «личности» для нейросетей
Дата: 2026-01-03 05:03
Исследовательская группа из Кембриджского университета и Google DeepMind разработала первый научно обоснованный метод оценки и формирования «личности» у больших языковых моделей (LLM), лежащих в основе популярных чат-ботов, таких как ChatGPT. Используя психологические тесты, обычно применяемые для оценки личности человека, учёные показали, что ИИ не только имитирует человеческие черты характера, но и что его «личность» можно надёжно измерить и точно сформировать.
В ходе исследования было установлено, что крупные модели наиболее точно эмулируют человеческие черты личности. Эти черты можно изменять с помощью запросов, влияя на то, как ИИ выполняет конкретные задачи.
Авторы работы предупреждают, что формирование личности у модели может сделать чат-ботов более убедительными, что вызывает опасения по поводу манипуляций. Они призывают к срочному регулированию ИИ-систем для обеспечения прозрачности и предотвращения злоупотреблений.
Иллюстрация: Grok Учёные предлагают использовать разработанный ими набор данных и код для тестирования «личности» ИИ, которые находятся в открытом доступе, для аудита и тестирования передовых моделей перед их релизом.
Для разработки метода оценки и проверки личности в ИИ-чат-ботах, исследователи протестировали, насколько поведение различных моделей в реальных задачах и тестах проверки статистически связано с их оценками по «большой пятёрке» черт, используемых в психометрическом тестировании: открытость, добросовестность, экстраверсия, доброжелательность и невротизм.
Команда адаптировала два известных теста личности – 300-вопросную версию Revised NEO Personality Inventory и более короткий Big Five Inventory – и применила их к различным LLM, используя структурированные запросы. Исследователи обнаружили, что более крупные, обученные модели дают профили тестов личности, которые являются как надёжными, так и предсказуемыми для поведения, в то время как более мелкие модели дают непоследовательные результаты.
Учёные смогли направлять личность модели по девяти уровням для каждой черты, используя тщательно разработанные запросы. Например, они могли сделать чат-бот более экстравертным или более эмоционально нестабильным – и эти изменения проявлялись в реальных задачах, таких как написание постов в социальных сетях.
Подробнее на iXBT
Предыдущие новости
OpenAI готовит новую аудио-модель в первом квартале 2026 года: компания нацелилась на собственные голосовые устройства
OpenAI планирует представить новую аудио-модель в первом квартале 2026 года, которая станет важным этапом на пути к созданию аппаратных устройств с голосовым управлением. Об этом сообщает издание The Information, ссылаясь на источники, знакомые с планами компании, включая нынешних и бывших сотрудников. По данным издания, OpenAI объединила несколько команд из отделов инженерии,...
Red Bull раскрыла дизайн своего первого гиперкара RB17 с атмосферным V10 и электромотором перед стартом продаж 2026 года
Компания Red Bull представила финальную версию своего первого гиперкара RB17, который претерпел ряд изменений по сравнению с первоначальным концептом, представленным в 2024 году. Первые официальные изображения RB17 v2.0 появились спустя менее года после утечки первых фотографий предсерийной модели. Изображение: Red Bull Racing Внешний вид RB17 заметно изменился. Автомобиль...
Глава Instagram* предсказывает доминирование ИИ-контента и предлагает «цифровые отпечататки» для реальных фото
Глава Instagram* Адам Моссери заявил о готовности платформы к наводнению ИИ-контентом. Он ожидает, что в 2026 году сгенерированные искусственным интеллектом изображения превзойдут по объёму реальные фотографии в лентах пользователей. Моссери видит в этом серьёзную проблему для авторов контента, чья уникальность и аутентичность могут быть поставлены под сомнение. «Всё, что...
IBM представила первый квантовый процессор Nighthawk и открыла ранний доступ к самому мощному Heron
IBM объявила о запуске своего первого квантового процессора архитектуры Nighthawk — IBM_Miami — и одновременно сообщила о выпуске обновлённой системы IBM_Boston, которую компания называет самым мощным вариантом IBM Quantum Heron r3 на сегодняшний день. Процессор IBM_Miami стал преемником IBM_Pittsburgh и уже доступен клиентам в формате раннего доступа в рамках тарифов Premium...