- «200-мегапиксельный ультраночной бог». Honor... (5946)
- Google Pixel Watch 4 — самые... (5649)
- «Союз-5» готов к полёту: первая ступень... (6628)
- Луна поможет японским учёным в поисках... (4799)
- Telegram получил большое обновление:... (5863)
- OpenAI создаст в Аргентине кампус Stargate... (5319)
- Apple купит технологии компьютерного зрения... (4238)
- Lada Iskra добралась до дилеров по всей... (5260)
- Представлена «человеческая стиральная машина... (4478)
- iPhone 17 не помогает: Xiaomi опережает... (5312)
- 16 ГБ видеопамяти в очень тонком корпусе.... (4924)
- Крупнейшие интернет-магазины США перестали... (4476)
- 500 МВт и 25 млрд долларов: представлен... (4453)
- Чистый экран без вырезов, 35-миллиметровая... (4193)
- Представлен уникальный Toyota Land Cruiser... (5321)
- Представлена Hyundai Sonata 2026, теперь со... (4358)
Генерируйте на здоровье: Сбер доступ к нейросетям для русского и ещё 60 языков
Дата: 2023-07-20 13:02
Команда СберБанка открыл доступ к нейросетевой модели генерации текста для русского языка ruGPT-3.5 13B. Её дообученная версия лежит в основе сервиса GigaChat. Также банк выложил новую версию модели mGPT 13B — самую большую из семейства многоязычных моделей Сбера, способную генерировать тексты на 61 языке.
Сгенерировано нейросетью Midjourney Обе модели доступны на платформе HuggingFace, и их могут использовать все разработчики, модели опубликованы под открытой лицензией MIT.
Russian Generative Pretrained Transformer версии 3.5 (ruGPT-3.5 13B) — новая версия нейросети ruGPT-3 13B. Это современная модель генерации текста для русского языка на основе доработанной исследователями Сбера архитектуры GPT-3 от OpenAI. Модель ruGPT-3.5 13B содержит 13 млрд параметров и умеет продолжать тексты на русском и английском языках, а также на языках программирования. Длина контекста модели составляет 2048 токенов. Она обучена на текстовом корпусе размером около 1 ТБ, в который, помимо уже использованной для обучения ruGPT-3 большой коллекции текстовых данных из открытых источников, вошли, например, часть открытого сета с кодом The Stack от коллаборации исследователей BigCode и корпусы новостных текстов.
Также в открытом доступе опубликована многоязычная модель mGPT 13B. Версия mGPT 13B содержит 13 млрд параметров и способна продолжать тексты на 61 языке, включая языки стран СНГ и малых народов России. Длина контекста модели составляет 512 токенов. Она была обучена на 600 ГБ текстов на разных языках, собранных из очищенных и подготовленных датасетов multilingual C4 и других открытых источников.
Подробнее на iXBT
Предыдущие новости
Приложение «Яндекс Go» научилось прогнозировать цену поездок на такси
Приложение «Яндекс Go» теперь может показывать прогноз цены за проезд на такси. В приложении появился специальный график, который помогает принять решение: стоит ли вызвать такси прямо сейчас, или, наоборот, подождать, чтобы избежать часа пик и сэкономить. То есть, можно проверить не только уровень спроса в текущий момент, но и посмотреть, как обычно меняется цена в течение...
В Совфеде предложили перезапустить производство двигателей на российских заводах Volkswagen и Hyundai
Как пишут «Известия», комитет Совета Федерации по экономполитике предложил начать выпуск газовых двигателей на простаивающих российских автомобильных заводах, где до прошлого года выпускали двигатели внутреннего сгорания (это Volkswagen и Hyundai). Для этого предполагается создать консорциум из действующих автопроизводителей. Фото: Максим Богодвид/РИА Новости Также...
Google разрабатывает ИИ-алгоритм Genesis для написания новостных статей, но о замене журналистов речи не идёт
По сообщениям сетевых источников, компания Google работает над созданием ИИ-алгоритма для написания новостных статей. Он разрабатывается под кодовым названием Genesis и уже был продемонстрирован руководству некоторых крупных изданий, таких как The New York Times, The Washington Post и The Wall Street Journal. Источник изображения: StartupStockPhotos /...
Журналист предостерёг геймеров насчёт обзоров Baldur’s Gate 3 на релизе — Larian разошлёт ключи слишком поздно
Фэнтезийная ролевая игра Baldur’s Gate 3 от бельгийской Larian Studios — проект масштабный, поэтому разработчики позаботятся, чтобы журналисты и блогеры получили ключ для обзора до релиза. Впрочем, не всё так просто. Источник изображения: Steam...