- Журналисты выяснили, кто снимет и напишет... (3806)
- На Восточном готовят «Фрегат» для запуска... (3216)
- Мощнейший пылесос Xiaomi G30 Max, который... (3104)
- 4K-телевизор E8S Pro с частотой 170 Гц и... (2102)
- Фейковый стрим с deepfake-версией Дженсена... (2237)
- Western Digital отчиталась об взлетевшей на... (2556)
- Halloween-скидка от UFO.Hosting: минус 20 %... (4332)
- Как на дизельном моторе: АвтоВАЗ рассказал,... (2473)
- Meta* объявила о рекордных убытках Reality... (3322)
- Марк Цукерберг: инвестиции Meta* в ИИ и... (4358)
- Дешёвая память закончилась: цены на DDR4 и... (3884)
- Лавкрафтианское приключение Dreadmoor от... (3856)
- Запас хода до 1500 км и разгон до 100 км/ч... (2592)
- Чтобы успели доставить машины, которые уже в... (4193)
- Первый кроссовер АвтоВАЗа — Lada Azimut —... (3945)
- Snapdragon 8 Elite 6, экраны 8,1 и 6,6... (3156)
Генерируйте на здоровье: Сбер доступ к нейросетям для русского и ещё 60 языков
Дата: 2023-07-20 13:02
Команда СберБанка открыл доступ к нейросетевой модели генерации текста для русского языка ruGPT-3.5 13B. Её дообученная версия лежит в основе сервиса GigaChat. Также банк выложил новую версию модели mGPT 13B — самую большую из семейства многоязычных моделей Сбера, способную генерировать тексты на 61 языке.
Сгенерировано нейросетью Midjourney Обе модели доступны на платформе HuggingFace, и их могут использовать все разработчики, модели опубликованы под открытой лицензией MIT.
Russian Generative Pretrained Transformer версии 3.5 (ruGPT-3.5 13B) — новая версия нейросети ruGPT-3 13B. Это современная модель генерации текста для русского языка на основе доработанной исследователями Сбера архитектуры GPT-3 от OpenAI. Модель ruGPT-3.5 13B содержит 13 млрд параметров и умеет продолжать тексты на русском и английском языках, а также на языках программирования. Длина контекста модели составляет 2048 токенов. Она обучена на текстовом корпусе размером около 1 ТБ, в который, помимо уже использованной для обучения ruGPT-3 большой коллекции текстовых данных из открытых источников, вошли, например, часть открытого сета с кодом The Stack от коллаборации исследователей BigCode и корпусы новостных текстов.
Также в открытом доступе опубликована многоязычная модель mGPT 13B. Версия mGPT 13B содержит 13 млрд параметров и способна продолжать тексты на 61 языке, включая языки стран СНГ и малых народов России. Длина контекста модели составляет 512 токенов. Она была обучена на 600 ГБ текстов на разных языках, собранных из очищенных и подготовленных датасетов multilingual C4 и других открытых источников.
Подробнее на iXBT
Предыдущие новости
Приложение «Яндекс Go» научилось прогнозировать цену поездок на такси
Приложение «Яндекс Go» теперь может показывать прогноз цены за проезд на такси. В приложении появился специальный график, который помогает принять решение: стоит ли вызвать такси прямо сейчас, или, наоборот, подождать, чтобы избежать часа пик и сэкономить. То есть, можно проверить не только уровень спроса в текущий момент, но и посмотреть, как обычно меняется цена в течение...
В Совфеде предложили перезапустить производство двигателей на российских заводах Volkswagen и Hyundai
Как пишут «Известия», комитет Совета Федерации по экономполитике предложил начать выпуск газовых двигателей на простаивающих российских автомобильных заводах, где до прошлого года выпускали двигатели внутреннего сгорания (это Volkswagen и Hyundai). Для этого предполагается создать консорциум из действующих автопроизводителей. Фото: Максим Богодвид/РИА Новости Также...
Google разрабатывает ИИ-алгоритм Genesis для написания новостных статей, но о замене журналистов речи не идёт
По сообщениям сетевых источников, компания Google работает над созданием ИИ-алгоритма для написания новостных статей. Он разрабатывается под кодовым названием Genesis и уже был продемонстрирован руководству некоторых крупных изданий, таких как The New York Times, The Washington Post и The Wall Street Journal. Источник изображения: StartupStockPhotos /...
Журналист предостерёг геймеров насчёт обзоров Baldur’s Gate 3 на релизе — Larian разошлёт ключи слишком поздно
Фэнтезийная ролевая игра Baldur’s Gate 3 от бельгийской Larian Studios — проект масштабный, поэтому разработчики позаботятся, чтобы журналисты и блогеры получили ключ для обзора до релиза. Впрочем, не всё так просто. Источник изображения: Steam...