- Планшет OSCAL Pad 200 с крупным экраном для... (1273)
- Xiaomi ускоряется: месячные поставки впервые... (1041)
- Poco X7 Pro вырвался в лидеры с большим... (644)
- 8000 мАч, IP69, Snapdragon 8 Gen 5 и почти... (1229)
- Советская легенда по цене Lada Granta: в... (1103)
- В Норвегии уже почти все новые... (667)
- Новая статья: Лучшие ИИ-сервисы и приложения... (1363)
- Видеокарта MSI RTX 5090 Lightning будет... (1075)
- Без турбин и на жидком металле: раскрыты... (854)
- Пользователи Steam выбрали лучшую игру 2025... (1087)
- Omoda переписала ценники: кроссоверы Omoda... (964)
- Темные времена дефицита видеокарт... (1180)
- Владеть Lada стало дороже: АвтоВАЗ поднял... (1358)
- Microsoft втихую прикрыла официальную... (1276)
- Никаких проводов и отверстий: на CES 2026... (1266)
- Монстр на плате: в Сеть утекли фото и... (1023)
Генерируйте на здоровье: Сбер открыл доступ к нейросетям для русского и ещё 60 языков
Дата: 2023-07-20 13:02
Команда СберБанка открыл доступ к нейросетевой модели генерации текста для русского языка ruGPT-3.5 13B. Её дообученная версия лежит в основе сервиса GigaChat. Также банк выложил новую версию модели mGPT 13B — самую большую из семейства многоязычных моделей Сбера, способную генерировать тексты на 61 языке.
Сгенерировано нейросетью Midjourney Обе модели доступны на платформе HuggingFace, и их могут использовать все разработчики, модели опубликованы под открытой лицензией MIT.
Russian Generative Pretrained Transformer версии 3.5 (ruGPT-3.5 13B) — новая версия нейросети ruGPT-3 13B. Это современная модель генерации текста для русского языка на основе доработанной исследователями Сбера архитектуры GPT-3 от OpenAI. Модель ruGPT-3.5 13B содержит 13 млрд параметров и умеет продолжать тексты на русском и английском языках, а также на языках программирования. Длина контекста модели составляет 2048 токенов. Она обучена на текстовом корпусе размером около 1 ТБ, в который, помимо уже использованной для обучения ruGPT-3 большой коллекции текстовых данных из открытых источников, вошли, например, часть открытого сета с кодом The Stack от коллаборации исследователей BigCode и корпусы новостных текстов.
Также в открытом доступе опубликована многоязычная модель mGPT 13B. Версия mGPT 13B содержит 13 млрд параметров и способна продолжать тексты на 61 языке, включая языки стран СНГ и малых народов России. Длина контекста модели составляет 512 токенов. Она была обучена на 600 ГБ текстов на разных языках, собранных из очищенных и подготовленных датасетов multilingual C4 и других открытых источников.
Подробнее на iXBT
Предыдущие новости
Отечественная альтернатива Google Play: в RuStore появилась горячо ожидаемая тёмная тема... И розовая
Команда отечественного аналога Google Play — онлайн-магазина приложений RuStore для операционной системы Android — поделилась свежими новостями о проекте. В RuStore обновился дизайн В профиле пользователя появился раздел «Темы», где пользователи могут изменить оформление: теперь им доступны тёмная и розовая темы. Сгенерировано нейросетью Midjourney В разделе «Тема»...
Более 8000 авторов книг, стихов и статей выставят счёт IT-гигантам за скармливание их произведений ИИ
Более 8000 писателей и литературных деятелей, включая Маргарет Этвуд (Margaret Atwood) и Джеймса Паттерсона (James Patterson), подписали открытое письмо с требованием компенсации от компаний, использующих их произведения для обучения ИИ-моделей без ведома авторов. Источник изображения: ThankYouFantasyPictures /...
Представлен флагман ZTE nubia Z50S Pro с разогнанным Snapdragon 8 Gen 2, продвинутой камерой и ценой от $515
Компания ZTE представила флагманский смартфон nubia Z50S Pro. Устройство обладает премиальным внешним видом, в основе использует разогнанный процессор Qualcomm Snapdragon 8 Gen 2 и получило продвинутую основную камеру. Источник изображений:...
Эмулятор Dolphin всё-таки не выйдет в Steam — Valve обязала разработчиков договориться с Nintendo, но это было невозможно
Команда разработки эмулятора Dolphin, позволяющего запускать на ПК игры с консолей Nintendo GameCube и Wii, выступила с заявлением по поводу судьбы версии своей утилиты для сервиса цифровой дистрибуции Steam. Источник изображения:...