- Масштабные сокращения в Intel не скажутся на... (25)
- Google представила экспериментальный... (31)
- Samsung Galaxy S26 может получить новейшую... (34)
- Kioxia начала поставки образцов более... (31)
- Google DeepMind назвал переманивание M**a... (49)
- Раджа Кодури присоединился к Sandisk, чтобы... (42)
- Издатель PUBG купил студию разработчиков... (42)
- TeamGroup представила предназначенные для... (41)
- Режим для двух игроков появится в Elden Ring... (64)
- Аудитория ИИ-поиска в Google выросла до 100... (63)
- AdGuard и браузер Brave стали блокировать... (94)
- SoftBank развернула крупнейшую в мире... (95)
- Лимузин не для простых смертных «Чайку»... (145)
- Потерявшихся животных предлагают искать... (63)
- Представлен новый Tank 500: лазерный радар,... (70)
- Правозащитники массово жалуются в... (104)
VK опубликовала нейросеть для обработки разговорного русского языка
Дата: 2025-07-24 11:13
Компания VK (бывшая Mail.ru Group) выложила в открытый доступ модель RuModernBERT для обработки естественного русского языка. Как отмечают разработчики, она понимает длинные тексты целиком, без разбиения на фрагменты и работает локально, без внешних API, что снижает нагрузку на инфраструктуру.

В VK рассказали:
Инженеры могут использовать ее для задач в области обработки текста, в том числе для извлечения информации, анализа тональности, поиска и ранжирования в приложениях и сервисах. Модель может понять сложный или длинный запрос пользователя, например, в поисковой строке и найдет наиболее релевантную информацию, видео, товары или документы.
RuModernBERT была обучена на 2 триллионах токенов данных на русском, английском языках и коде с максимальной длиной контекста до 8,192 токенов. Для всех этапов обучения были использованы разные источники данных, в том числе книги, статьи, посты и комментарии в социальных сетях, что позволяет адаптировать ее для работы с современным текстом и учитывать разговорную речь.
RuModernBERT доступна в нескольких версиях: на 150 миллионов параметров и облегченная модель на 35 миллионов параметров. Также обновлены две дополнительные версии модели: USER и USER2. Они помогают инженерам лучше группировать и находить похожую информацию. В версии USER2 есть специальная технология, которая позволяет сократить объем данных почти без потери точности. Найти все версии модели можно на Hugging Face.
Подробнее на iXBT
Предыдущие новости
Кузова новых российских машин Tenet, которые собирают на бывшем заводе Volkswagen с немецкой системой контроля качества, показали на новых фото
На заводе «АГР Холдинг» в Калуге завершены работы по подготовке линии окраски автомобилей Tenet, адаптированной под особенности конструкции и требования эксплуатации в российских условиях, о чем мы уже сообщали. Теперь же появились новые фото, демонстрирующие окрашенные кузова. Фото «АГР Холдинг»/Максим Кадаков Процесс включает традиционные этапы: обезжиривание,...
На бывшем российском заводе Samsung начали выпускать телевизоры Dreame
Dreame Technology совместно с российской VVP Tech запустила производство телевизоров на бывшем заводе Samsung в Калужской области. Как сообщается, ТВ выпускаются в семи популярных диагоналях. VVP Tech арендует площади бывшего завода Samsung, под ее управлением находятся две производственные площадки в Московской и Калужской областях с общей площадью свыше 250 тыс. м2. Фото:...
Стёртые временем письмена прочитает «Эней» — ИИ от Google DeepMind для восстановления древних текстов и их истории
Команда Google DeepMind представила новую генеративную модель — «Эней» (Aeneas). Это невероятный по возможностям инструмент для историков и археологов. Обученный на сотнях тысяч латинских текстах, «Эней» не просто восстановит утраченные фрагменты обнаруженных надписей — он расскажет их историю и происхождение, а также примерную датировку. Источник изображения:...
Оператор «СберМобайл» запустил «Близкий круг» с бесплатными звонками
Виртуальный мобильный оператор «СберМобайл», за которым стоит Сбербанк, сообщил о запуске новой бесплатной услуги. Сервис под названием «Близкий круг» позволяет объединять в одну группу номера друзей, родственников, коллег — даже если у них разный домашний регион. Сгенерировано нейросетью Midjourney Объединить можно до 5 номеров абонентов «СберМобайла», оплачивать которые...