- Microsoft втихую прикрыла официальную... (424)
- Никаких проводов и отверстий: на CES 2026... (393)
- Монстр на плате: в Сеть утекли фото и... (259)
- XCite дорожает перед исчезновением? Дилеры... (302)
- Один из первых в мире компьютеров на... (297)
- Ноутбуки будут покупать заметно меньше.... (297)
- Конец эпохи Xiaomi 12 и Redmi Note 12:... (237)
- Анализ цен на видеокарты показывает, что как... (277)
- SpaceX первой в мире запустила ракету на... (253)
- Asus представила материнскую плату Pro WS... (252)
- Флагманская модель для любителей... (316)
- Квантовая система впервые начала сама... (262)
- Китайские производители чипов обязаны... (657)
- Глава Microsoft призвал не зацикливаться на... (398)
- Asus представит на CES 2026 маршрутизатор с... (554)
- Платформа AMD AM4 получает вторую жизнь.... (403)
Microsoft представила инструменты для защиты конфиденциальности в больших языковых моделях
Дата: сегодня 10:06
Microsoft представила два новых подхода к обеспечению контекстуальной целостности в больших языковых моделях (LLM): PrivacyChecker — модуль с открытым исходным кодом, работающий как «щит конфиденциальности» во время работы модели, и CI-CoT + CI-RL — метод обучения, предназначенный для обучения моделей рассуждению о конфиденциальности.
Контекстуальная целостность определяет конфиденциальность как уместность потоков информации в конкретных социальных контекстах, то есть раскрытие только той информации, которая строго необходима для выполнения данной задачи, например, записи на приём к врачу. По мнению исследователей Microsoft, современные LLM не обладают подобным контекстуальным осознанием и могут раскрывать конфиденциальную информацию, подрывая доверие пользователей.
Первый подход фокусируется на проверках во время работы модели. Эти проверки представляют собой «щит», оценивающий информацию на нескольких этапах жизненного цикла запроса. Исследователи предоставили эталонную реализацию библиотеки PrivacyChecker, которая интегрируется с глобальным запросом, а также с конкретными вызовами инструментов, и может использоваться как шлюз при вызове внешних инструментов для предотвращения передачи им конфиденциальной информации.
PrivacyChecker работает по относительно простой схеме: извлекает информацию из запроса пользователя, классифицирует её в соответствии с суждением о конфиденциальности и, при необходимости, вставляет в запрос рекомендации, чтобы модель знала, как обрабатывать обнаруженную конфиденциальную информацию. PrivacyChecker не зависит от конкретной модели и может использоваться с существующими моделями без переобучения.
Иллюстрация: Grok На статическом бенчмарке PrivacyLens было показано, что PrivacyChecker снижает утечку информации с 33,06% до 8,32% на GPT4o и с 36,08% до 7,30% на DeepSeekR1, сохраняя при этом способность системы выполнять поставленную задачу.
Второй подход, разработанный исследователями Microsoft, направлен на повышение контекстуальной целостности с использованием метода «цепочки рассуждений» (chain-of-thought prompting, CI-CoT). Обычно этот метод используется для улучшения способностей модели к решению задач, но исследователи применили его с другой целью: они заставили модель оценивать нормы раскрытия контекстной информации перед ответом. Запрос направлял модель на определение того, какие атрибуты необходимы для выполнения задачи, а какие следует скрыть.
Хотя CI-CoT оказался эффективным в снижении утечки информации на бенчмарке PrivacyLens, он также имел тенденцию давать более консервативные ответы, иногда скрывая информацию, необходимую для выполнения задачи. Для решения этой проблемы исследователи Microsoft представили этап обучения с подкреплением (reinforcement learning, CI-RL): модель «вознаграждается», когда она выполняет задачу, используя только информацию, соответствующую контекстуальным нормам, и «штрафуется», когда раскрывает информацию, неуместную в данном контексте. Это обучает модель определять не только то, как отвечать, но и следует ли включать конкретную информацию.
Комбинированный подход, CI-CoT + CI-RL, оказался столь же эффективным, как и CI-CoT, в снижении утечки информации, сохраняя при этом производительность исходной модели.
Контекстуальная целостность — новая концепция, разработанная Google DeepMind и Microsoft в контексте исследований LLM. Она определяет конфиденциальность не как всеобщее право на секретность, а как «надлежащий поток информации в соответствии с контекстуальными информационными нормами».
Подробнее на iXBT
Предыдущие новости
Birdfy представила «умные» кормушки Birdfy Feeder Vista и Hum Bloom с панорамной камерой и ИИ
Компания Birdfy анонсировала две новые модели «умных» кормушек для птиц: Birdfy Feeder Vista и Birdfy Hum Bloom. Первая представляет собой кормушку с панорамной камерой, а вторая — специальную кормушку для колибри. Обе новинки оснащены функциями, которые делают наблюдение за птицами более удобным и информативным. Birdfy Feeder Vista оснащена двумя камерами, способными снимать...
Крупнейший поставщик юридических данных внедряет агентный ИИ для судебных процессов
LexisNexis, один из крупнейших в мире поставщиков юридической информации, объявила о переходе от классических инструментов правового поиска к интегрированной ИИ-платформе, которая встраивается в повседневную работу юристов. Компания внедряет генеративный и агентный искусственный интеллект не как отдельный сервис, а как основу всей экосистемы — от исследований до подготовки...
Бета-версия Realme UI 7.0 доступна для 11 новых моделей смартфонов
Компания Realme объявила о начале 10-го этапа закрытого бета-тестирования Realme UI 7.0, добавив в список в общей сложности одиннадцать новых моделей смартфонов. В последнюю волну вошли несколько моделей Narzo, телефоны серии P и несколько моделей из номерной серии. Фото Realme Список устройств с необходимыми версиями прошивки: Realme 15 Lite 5G — RMX5000_15.0.0.1360;...
SpaceX сократила число сводимых с орбиты спутников Starlink к концу 2025 года
Количество телекоммуникационных спутников SpaceX Starlink, которые сходят с орбиты и сгорают в атмосфере, существенно сократилось за последние месяцы. В период с июня по ноябрь компания свела с орбиты 218 спутников, тогда как за предыдущие шесть месяцев было уничтожено 472 аппарата. Источник изображения:...