- Тепло принятая публикой RPG с открытым миром... (5836)
- Apple начала приучать клиентов к мысли о... (5721)
- Amazon занимается разработкой очков... (5322)
- Сооснователь Oracle Ларри Эллисон отобрал у... (6017)
- Теперь Geely будет конкурировать с Toyota... (5942)
- 7000 мАч, 100 Вт, IP69 и компактный экран... (6317)
- Слепое копирование Apple, потеря... (6763)
- В NASA забанили (6729)
- Эти ракеты запускают с 1965 года. Тяжелая... (5791)
- Представлен Chery Tiggo 8 Pro Luxury... (6250)
- Samsung Galaxy S25 FE не только доступный... (6377)
- Dreame показала «самый быстрый»... (6153)
- Никакого прогресса за 6 лет. Будущий Samsung... (5947)
- Новая статья: Обзор видеокарты ASRock Intel... (6146)
- Новая статья: Обзор и тестирование... (5876)
- Microsoft отменила дань для разработчиков,... (6638)
Генерируйте на здоровье: Сбер доступ к нейросетям для русского и ещё 60 языков
Дата: 2023-07-20 13:02
Команда СберБанка открыл доступ к нейросетевой модели генерации текста для русского языка ruGPT-3.5 13B. Её дообученная версия лежит в основе сервиса GigaChat. Также банк выложил новую версию модели mGPT 13B — самую большую из семейства многоязычных моделей Сбера, способную генерировать тексты на 61 языке.
Сгенерировано нейросетью Midjourney Обе модели доступны на платформе HuggingFace, и их могут использовать все разработчики, модели опубликованы под открытой лицензией MIT.
Russian Generative Pretrained Transformer версии 3.5 (ruGPT-3.5 13B) — новая версия нейросети ruGPT-3 13B. Это современная модель генерации текста для русского языка на основе доработанной исследователями Сбера архитектуры GPT-3 от OpenAI. Модель ruGPT-3.5 13B содержит 13 млрд параметров и умеет продолжать тексты на русском и английском языках, а также на языках программирования. Длина контекста модели составляет 2048 токенов. Она обучена на текстовом корпусе размером около 1 ТБ, в который, помимо уже использованной для обучения ruGPT-3 большой коллекции текстовых данных из открытых источников, вошли, например, часть открытого сета с кодом The Stack от коллаборации исследователей BigCode и корпусы новостных текстов.
Также в открытом доступе опубликована многоязычная модель mGPT 13B. Версия mGPT 13B содержит 13 млрд параметров и способна продолжать тексты на 61 языке, включая языки стран СНГ и малых народов России. Длина контекста модели составляет 512 токенов. Она была обучена на 600 ГБ текстов на разных языках, собранных из очищенных и подготовленных датасетов multilingual C4 и других открытых источников.
Подробнее на iXBT
Предыдущие новости
Приложение «Яндекс Go» научилось прогнозировать цену поездок на такси
Приложение «Яндекс Go» теперь может показывать прогноз цены за проезд на такси. В приложении появился специальный график, который помогает принять решение: стоит ли вызвать такси прямо сейчас, или, наоборот, подождать, чтобы избежать часа пик и сэкономить. То есть, можно проверить не только уровень спроса в текущий момент, но и посмотреть, как обычно меняется цена в течение...
В Совфеде предложили перезапустить производство двигателей на российских заводах Volkswagen и Hyundai
Как пишут «Известия», комитет Совета Федерации по экономполитике предложил начать выпуск газовых двигателей на простаивающих российских автомобильных заводах, где до прошлого года выпускали двигатели внутреннего сгорания (это Volkswagen и Hyundai). Для этого предполагается создать консорциум из действующих автопроизводителей. Фото: Максим Богодвид/РИА Новости Также...
Google разрабатывает ИИ-алгоритм Genesis для написания новостных статей, но о замене журналистов речи не идёт
По сообщениям сетевых источников, компания Google работает над созданием ИИ-алгоритма для написания новостных статей. Он разрабатывается под кодовым названием Genesis и уже был продемонстрирован руководству некоторых крупных изданий, таких как The New York Times, The Washington Post и The Wall Street Journal. Источник изображения: StartupStockPhotos /...
Журналист предостерёг геймеров насчёт обзоров Baldur’s Gate 3 на релизе — Larian разошлёт ключи слишком поздно
Фэнтезийная ролевая игра Baldur’s Gate 3 от бельгийской Larian Studios — проект масштабный, поэтому разработчики позаботятся, чтобы журналисты и блогеры получили ключ для обзора до релиза. Впрочем, не всё так просто. Источник изображения: Steam...