- «Насмешка над конкуренцией»: Apple дала... (256)
- Редкую Lada Forma в первозданном состоянии и... (272)
- Northrop Grumman протестировал самый мощный... (314)
- «Копейка» за копейки: в Латвии ВАЗ-2101 в... (282)
- Nothing Phone (3) показал свой нетривиальный... (377)
- Мобильные аккумуляторы Xiaomi, Baseus,... (247)
- Фитнес-браслет Xiaomi Smart Band 10 поступил... (325)
- КамАЗ, Газпром и НАМИ объединятся, чтобы... (240)
- Без России — никак. В РФ создали... (252)
- Новая «Волга» по цене нового Mercedes-Benz... (232)
- В очаровательном приключении The Plucky... (264)
- МТС назвала самые популярные смартфоны среди... (192)
- Минцифры России выпустило приложение для... (338)
- В США начали строить горизонтальный... (233)
- Марсоход Curiosity запечатлел первые... (241)
- Яндекс представил первые портативные колонки... (285)
Генерируйте на здоровье: Сбер открыл доступ к нейросетям для русского и ещё 60 языков
Дата: 2023-07-20 13:02
Команда СберБанка открыл доступ к нейросетевой модели генерации текста для русского языка ruGPT-3.5 13B. Её дообученная версия лежит в основе сервиса GigaChat. Также банк выложил новую версию модели mGPT 13B — самую большую из семейства многоязычных моделей Сбера, способную генерировать тексты на 61 языке.

Обе модели доступны на платформе HuggingFace, и их могут использовать все разработчики, модели опубликованы под открытой лицензией MIT.
Russian Generative Pretrained Transformer версии 3.5 (ruGPT-3.5 13B) — новая версия нейросети ruGPT-3 13B. Это современная модель генерации текста для русского языка на основе доработанной исследователями Сбера архитектуры GPT-3 от OpenAI. Модель ruGPT-3.5 13B содержит 13 млрд параметров и умеет продолжать тексты на русском и английском языках, а также на языках программирования. Длина контекста модели составляет 2048 токенов. Она обучена на текстовом корпусе размером около 1 ТБ, в который, помимо уже использованной для обучения ruGPT-3 большой коллекции текстовых данных из открытых источников, вошли, например, часть открытого сета с кодом The Stack от коллаборации исследователей BigCode и корпусы новостных текстов.
Также в открытом доступе опубликована многоязычная модель mGPT 13B. Версия mGPT 13B содержит 13 млрд параметров и способна продолжать тексты на 61 языке, включая языки стран СНГ и малых народов России. Длина контекста модели составляет 512 токенов. Она была обучена на 600 ГБ текстов на разных языках, собранных из очищенных и подготовленных датасетов multilingual C4 и других открытых источников.
Подробнее на iXBT
Предыдущие новости
Отечественная альтернатива Google Play: в RuStore появилась горячо ожидаемая тёмная тема... И розовая
Команда отечественного аналога Google Play — онлайн-магазина приложений RuStore для операционной системы Android — поделилась свежими новостями о проекте. В RuStore обновился дизайн В профиле пользователя появился раздел «Темы», где пользователи могут изменить оформление: теперь им доступны тёмная и розовая темы. Сгенерировано нейросетью Midjourney В разделе «Тема»...
Более 8000 авторов книг, стихов и статей выставят счёт IT-гигантам за скармливание их произведений ИИ
Более 8000 писателей и литературных деятелей, включая Маргарет Этвуд (Margaret Atwood) и Джеймса Паттерсона (James Patterson), подписали открытое письмо с требованием компенсации от компаний, использующих их произведения для обучения ИИ-моделей без ведома авторов. Источник изображения: ThankYouFantasyPictures /...
Представлен флагман ZTE nubia Z50S Pro с разогнанным Snapdragon 8 Gen 2, продвинутой камерой и ценой от $515
Компания ZTE представила флагманский смартфон nubia Z50S Pro. Устройство обладает премиальным внешним видом, в основе использует разогнанный процессор Qualcomm Snapdragon 8 Gen 2 и получило продвинутую основную камеру. Источник изображений:...
Эмулятор Dolphin всё-таки не выйдет в Steam — Valve обязала разработчиков договориться с Nintendo, но это было невозможно
Команда разработки эмулятора Dolphin, позволяющего запускать на ПК игры с консолей Nintendo GameCube и Wii, выступила с заявлением по поводу судьбы версии своей утилиты для сервиса цифровой дистрибуции Steam. Источник изображения:...