- Samsung: смартфоны Galaxy S26 получат новые... (2901)
- Совершенно новый Kia Telluride 2027 впервые... (2818)
- GigaChat Сбера обрёл голос: можно вести... (3594)
- Iridium представила миниатюрный чип PNT ASIC... (4048)
- По 5 секунд на машину: потенциально самую... (2810)
- Европейский проект Albator разработает... (4512)
- Крупный дилер подготовил «интересное... (3615)
- Астрономы впервые построили трёхмерную карту... (2873)
- Астрономы впервые построили трёхмерную карту... (2960)
- Samsung наконец выпустила настольную версию... (3897)
- Автопроизводители начали жаловаться на... (3386)
- Марк Цукерберг пообещал и дальше заваливать... (3341)
- Потери M**a на метавселенной и виртуальной... (3742)
- OpenAI собралась выйти на биржу в 2027 году... (2733)
- Заменитель Volkswagen Tiguan от Chery... (4095)
- 7800 мАч, 120 Вт, Snapdragon 8 Elite, 1,5К... (3670)
Генерируйте на здоровье: Сбер доступ к нейросетям для русского и ещё 60 языков
Дата: 2023-07-20 13:02
Команда СберБанка открыл доступ к нейросетевой модели генерации текста для русского языка ruGPT-3.5 13B. Её дообученная версия лежит в основе сервиса GigaChat. Также банк выложил новую версию модели mGPT 13B — самую большую из семейства многоязычных моделей Сбера, способную генерировать тексты на 61 языке.
Сгенерировано нейросетью Midjourney Обе модели доступны на платформе HuggingFace, и их могут использовать все разработчики, модели опубликованы под открытой лицензией MIT.
Russian Generative Pretrained Transformer версии 3.5 (ruGPT-3.5 13B) — новая версия нейросети ruGPT-3 13B. Это современная модель генерации текста для русского языка на основе доработанной исследователями Сбера архитектуры GPT-3 от OpenAI. Модель ruGPT-3.5 13B содержит 13 млрд параметров и умеет продолжать тексты на русском и английском языках, а также на языках программирования. Длина контекста модели составляет 2048 токенов. Она обучена на текстовом корпусе размером около 1 ТБ, в который, помимо уже использованной для обучения ruGPT-3 большой коллекции текстовых данных из открытых источников, вошли, например, часть открытого сета с кодом The Stack от коллаборации исследователей BigCode и корпусы новостных текстов.
Также в открытом доступе опубликована многоязычная модель mGPT 13B. Версия mGPT 13B содержит 13 млрд параметров и способна продолжать тексты на 61 языке, включая языки стран СНГ и малых народов России. Длина контекста модели составляет 512 токенов. Она была обучена на 600 ГБ текстов на разных языках, собранных из очищенных и подготовленных датасетов multilingual C4 и других открытых источников.
Подробнее на iXBT
Предыдущие новости
Приложение «Яндекс Go» научилось прогнозировать цену поездок на такси
Приложение «Яндекс Go» теперь может показывать прогноз цены за проезд на такси. В приложении появился специальный график, который помогает принять решение: стоит ли вызвать такси прямо сейчас, или, наоборот, подождать, чтобы избежать часа пик и сэкономить. То есть, можно проверить не только уровень спроса в текущий момент, но и посмотреть, как обычно меняется цена в течение...
В Совфеде предложили перезапустить производство двигателей на российских заводах Volkswagen и Hyundai
Как пишут «Известия», комитет Совета Федерации по экономполитике предложил начать выпуск газовых двигателей на простаивающих российских автомобильных заводах, где до прошлого года выпускали двигатели внутреннего сгорания (это Volkswagen и Hyundai). Для этого предполагается создать консорциум из действующих автопроизводителей. Фото: Максим Богодвид/РИА Новости Также...
Google разрабатывает ИИ-алгоритм Genesis для написания новостных статей, но о замене журналистов речи не идёт
По сообщениям сетевых источников, компания Google работает над созданием ИИ-алгоритма для написания новостных статей. Он разрабатывается под кодовым названием Genesis и уже был продемонстрирован руководству некоторых крупных изданий, таких как The New York Times, The Washington Post и The Wall Street Journal. Источник изображения: StartupStockPhotos /...
Журналист предостерёг геймеров насчёт обзоров Baldur’s Gate 3 на релизе — Larian разошлёт ключи слишком поздно
Фэнтезийная ролевая игра Baldur’s Gate 3 от бельгийской Larian Studios — проект масштабный, поэтому разработчики позаботятся, чтобы журналисты и блогеры получили ключ для обзора до релиза. Впрочем, не всё так просто. Источник изображения: Steam...