- 9 июля, 22 июля и 5 августа Земля ускорится... (262)
- Испанский математик и Google DeepMind... (253)
- 9 июля, 22 июля и 5 августа Земля ускорится... (282)
- Asus выпустила GeForce RTX 5070 Ti и RTX... (282)
- Самая масштабная трансформация за все 80... (295)
- $100 миллионов на спасение ИИ от... (391)
- Франция создаст многоразовый космоплан,... (343)
- Хакеры могут захватить тысячи серверов — в... (293)
- Google выпустила приложение Doppl для... (274)
- Экипаж китайской космической станции... (208)
- Китайские астронавты экипажа «Шэньчжоу-20»... (301)
- Microsoft и Apple позади: Nvidia вновь стала... (231)
- В России продают уникальные мотоциклы: два... (269)
- Тень Титана на Сатурне: уникальное... (323)
- Учёные научили кишечную палочку... (269)
- Соглашение США и Швеции открывает новые... (302)
Генерируйте на здоровье: Сбер открыл доступ к нейросетям для русского и ещё 60 языков
Дата: 2023-07-20 13:02
Команда СберБанка открыл доступ к нейросетевой модели генерации текста для русского языка ruGPT-3.5 13B. Её дообученная версия лежит в основе сервиса GigaChat. Также банк выложил новую версию модели mGPT 13B — самую большую из семейства многоязычных моделей Сбера, способную генерировать тексты на 61 языке.

Обе модели доступны на платформе HuggingFace, и их могут использовать все разработчики, модели опубликованы под открытой лицензией MIT.
Russian Generative Pretrained Transformer версии 3.5 (ruGPT-3.5 13B) — новая версия нейросети ruGPT-3 13B. Это современная модель генерации текста для русского языка на основе доработанной исследователями Сбера архитектуры GPT-3 от OpenAI. Модель ruGPT-3.5 13B содержит 13 млрд параметров и умеет продолжать тексты на русском и английском языках, а также на языках программирования. Длина контекста модели составляет 2048 токенов. Она обучена на текстовом корпусе размером около 1 ТБ, в который, помимо уже использованной для обучения ruGPT-3 большой коллекции текстовых данных из открытых источников, вошли, например, часть открытого сета с кодом The Stack от коллаборации исследователей BigCode и корпусы новостных текстов.
Также в открытом доступе опубликована многоязычная модель mGPT 13B. Версия mGPT 13B содержит 13 млрд параметров и способна продолжать тексты на 61 языке, включая языки стран СНГ и малых народов России. Длина контекста модели составляет 512 токенов. Она была обучена на 600 ГБ текстов на разных языках, собранных из очищенных и подготовленных датасетов multilingual C4 и других открытых источников.
Подробнее на iXBT
Предыдущие новости
Отечественная альтернатива Google Play: в RuStore появилась горячо ожидаемая тёмная тема... И розовая
Команда отечественного аналога Google Play — онлайн-магазина приложений RuStore для операционной системы Android — поделилась свежими новостями о проекте. В RuStore обновился дизайн В профиле пользователя появился раздел «Темы», где пользователи могут изменить оформление: теперь им доступны тёмная и розовая темы. Сгенерировано нейросетью Midjourney В разделе «Тема»...
Более 8000 авторов книг, стихов и статей выставят счёт IT-гигантам за скармливание их произведений ИИ
Более 8000 писателей и литературных деятелей, включая Маргарет Этвуд (Margaret Atwood) и Джеймса Паттерсона (James Patterson), подписали открытое письмо с требованием компенсации от компаний, использующих их произведения для обучения ИИ-моделей без ведома авторов. Источник изображения: ThankYouFantasyPictures /...
Представлен флагман ZTE nubia Z50S Pro с разогнанным Snapdragon 8 Gen 2, продвинутой камерой и ценой от $515
Компания ZTE представила флагманский смартфон nubia Z50S Pro. Устройство обладает премиальным внешним видом, в основе использует разогнанный процессор Qualcomm Snapdragon 8 Gen 2 и получило продвинутую основную камеру. Источник изображений:...
Эмулятор Dolphin всё-таки не выйдет в Steam — Valve обязала разработчиков договориться с Nintendo, но это было невозможно
Команда разработки эмулятора Dolphin, позволяющего запускать на ПК игры с консолей Nintendo GameCube и Wii, выступила с заявлением по поводу судьбы версии своей утилиты для сервиса цифровой дистрибуции Steam. Источник изображения:...