- Машинам Toyota и Volkswagen китайцы... (25)
- Соцсеть X запретила использовать свой... (54)
- Линию Mercedes порезали на лом, завод... (60)
- В этом году МТС отключит половину своих... (65)
- Премьера в Мариинском театре 19 июня:... (78)
- Учёные представили беспрецедентный объём... (73)
- Intel прекратила платить клиентам, чтобы те... (81)
- АвтоВАЗ радует: Lada Vesta и Aura со скидкой... (73)
- Для создания российской космической станции... (77)
- Отечественные ОС пропишут в каждый ноутбук,... (82)
- Самый продаваемый пикап в России с корнями... (87)
- 145 л.с. и китайская 6-ступенчатая... (79)
- Intel признала, что изначально разрабатывала... (69)
- Subaru дала заводскую гарантию 3 года на все... (73)
- От самого дешевого Galaxy A06 до нового... (72)
- Запуск телескопа «Нэнси Грейс Роман»... (75)
Китайский ИИ-гигант DeepSeek под подозрением в обучении на данных Google Gemini
Дата: 2025-06-05 08:56
В мае китайская компания DeepSeek выпустила обновлённую версию своей модели искусственного интеллекта R1, демонстрирующую высокие результаты в математических тестах и задачах на программирование. Компания не раскрыла источники данных, использованных для обучения модели, однако ряд исследователей предполагают, что часть данных была получена из семейства моделей Google Gemini.
Разработчик Сэм Пэч из Мельбурна, специализирующийся на оценке «эмоционального интеллекта» ИИ, опубликовал в социальной сети X данные, которые, по его утверждению, доказывают обучение модели DeepSeek R1-0528 на выводах Gemini. Пэч отметил сходство в используемой лексике и выражениях между моделью DeepSeek и Google Gemini 2.5 Pro. Другой разработчик, создатель анонимного проекта SpeechMap для оценки «свободы слова» в ИИ, также указал на сходство «мыслительных процессов» — промежуточных выводов — модели DeepSeek с трассировками Gemini.

Это не первое обвинение в адрес DeepSeek в использовании данных конкурирующих моделей. В декабре разработчики заметили, что модель DeepSeek V3 часто идентифицировала себя как ChatGPT, что указывало на возможное обучение на логах чатов OpenAI. Ранее в 2025 году OpenAI сообщила Financial Times о наличии доказательств использования DeepSeek метода дистилляции — техники обучения ИИ на основе данных более мощных моделей. По данным Bloomberg, Microsoft, тесно сотрудничающая с OpenAI, обнаружила в конце 2024 года утечку больших объёмов данных через учётные записи разработчиков OpenAI, предположительно связанные с DeepSeek.
Дистилляция — распространённая практика, однако условия обслуживания OpenAI запрещают использование выводов моделей компании для создания конкурирующих моделей. При этом, многие модели ошибочно идентифицируют себя и используют схожие фразы, что связано с «загрязнением» открытого интернета, являющегося основным источником данных для обучения ИИ. Массовое создание контента с помощью ИИ и активность ботов в социальных сетях затрудняют фильтрацию данных.
Несмотря на это, эксперты, такие как Нейтан Ламберт из исследовательского института AI2, считают, что обучение DeepSeek на данных Gemini вполне возможно. Ламберт предположил, что использование API Gemini оказалось бы для DeepSeek более эффективным, чем собственные разработки.
В ответ на проблему дистилляции компании усиливают меры безопасности. В апреле OpenAI ввела обязательную верификацию личности для доступа к некоторым продвинутым моделям, Китай в список поддерживаемых стран не входит. Google начала «резюмировать» трассировки моделей, доступных через платформу AI Studio, затрудняя обучение конкурирующих моделей на данных Gemini. Компания Anthropic также объявила о подобных мерах в мае.
Подробнее на iXBT
Предыдущие новости
«Космос-2505»: последний спутник с капсульной доставкой снимков детализацией 30 см
Десять лет назад, 5 июня 2015 года, с космодрома Плесецк стартовала ракета «Союз-2.1а», которая вывела на орбиту спутник «Космос-2505». Этот аппарат стал последним представителем семейства «Янтарь» — советских и российских спутников видовой разведки. «Космос-2505» завершил эпоху уникальной технологии доставки данных с использованием физических капсул. Спутники «Янтарь»...
Представлен другой Kia Sportage 2025 с новым дизайном
Kia представила в Европе рестайлинговый кроссовер Sportage 2025 года, который получил заметные изменения в дизайне, интерьере и технической начинке. Обновленный Sportage стал еще комфортнее и технологичнее, сохранив статус одного из самых популярных автомобилей бренда. Модель, адаптированная для европейского рынка, отличается укороченной колесной базой (2680 мм) и длиной...
Сбер рекомендует владельцам iPhone оперативно скачать новое приложение в App Store: оно вряд ли продержится там долго
Сбер подтвердил, что новое приложение СберБизнеса появилось в App Store под другим названием. Компания рекомендует скачать его как можно скорее, потому что в ближайшее время Apple, как это было неоднократно в прошлом, скорее всего, удалит его. Владельцам iOS советуем СКОРЕЕ установить новое приложение СберБизнес. Оно уже лежит в AppStore под названием «Бизнес-поток». Ссылка на...
Nvidia Blackwell ускоряет ИИ в 2,5 раза: новый рекорд производительности в обучении гигантских языковых моделей
Nvidia объявила о впечатляющих результатах своих новых чипов Blackwell в тестах MLPerf Training v5.0. Архитектура Blackwell, разработанная для удовлетворения растущих требований к производительности современных AI-приложений, продемонстрировала наивысшую производительность во всех бенчмарках, став единственной платформой, представившей результаты по всем тестам. Это особенно...