- xAI нанимает известных писателей для... (1819)
- Художественное топтание снега... (3061)
- Без точного адреса и полного имени: в «Почте... (2448)
- Индонезия разбанила чат-бота Grok, но под... (3433)
- Ноутбуки Apple MacBook Pro с процессорами M5... (2403)
- Инсайдер огорчил фанатов, которые ждали Аду... (1907)
- Япония сделала шаг к добыче редкоземов со... (2136)
- Seagate сильно отстала от Western Digital по... (2313)
- «Его возможности удивят всех», — Илон Маск... (2055)
- «10 минут до зарядки в городе и 20 минут на... (3308)
- Оперативная память станет дороже золота?... (2227)
- В Китае повысили налоги на интернет и... (2576)
- Тонкий корпус, батарея на 7000 мАч, IP65 и... (2728)
- Тонкий корпус, батарея на 7000 мАч, IP65 и... (2232)
- «Ски-тест» для мобильных: названы операторы... (2843)
- В России начали принимать заказы на новый... (3027)
Генерируйте на здоровье: Сбер доступ к нейросетям для русского и ещё 60 языков
Дата: 2023-07-20 13:02
Команда СберБанка открыл доступ к нейросетевой модели генерации текста для русского языка ruGPT-3.5 13B. Её дообученная версия лежит в основе сервиса GigaChat. Также банк выложил новую версию модели mGPT 13B — самую большую из семейства многоязычных моделей Сбера, способную генерировать тексты на 61 языке.
Сгенерировано нейросетью Midjourney Обе модели доступны на платформе HuggingFace, и их могут использовать все разработчики, модели опубликованы под открытой лицензией MIT.
Russian Generative Pretrained Transformer версии 3.5 (ruGPT-3.5 13B) — новая версия нейросети ruGPT-3 13B. Это современная модель генерации текста для русского языка на основе доработанной исследователями Сбера архитектуры GPT-3 от OpenAI. Модель ruGPT-3.5 13B содержит 13 млрд параметров и умеет продолжать тексты на русском и английском языках, а также на языках программирования. Длина контекста модели составляет 2048 токенов. Она обучена на текстовом корпусе размером около 1 ТБ, в который, помимо уже использованной для обучения ruGPT-3 большой коллекции текстовых данных из открытых источников, вошли, например, часть открытого сета с кодом The Stack от коллаборации исследователей BigCode и корпусы новостных текстов.
Также в открытом доступе опубликована многоязычная модель mGPT 13B. Версия mGPT 13B содержит 13 млрд параметров и способна продолжать тексты на 61 языке, включая языки стран СНГ и малых народов России. Длина контекста модели составляет 512 токенов. Она была обучена на 600 ГБ текстов на разных языках, собранных из очищенных и подготовленных датасетов multilingual C4 и других открытых источников.
Подробнее на iXBT
Предыдущие новости
Приложение «Яндекс Go» научилось прогнозировать цену поездок на такси
Приложение «Яндекс Go» теперь может показывать прогноз цены за проезд на такси. В приложении появился специальный график, который помогает принять решение: стоит ли вызвать такси прямо сейчас, или, наоборот, подождать, чтобы избежать часа пик и сэкономить. То есть, можно проверить не только уровень спроса в текущий момент, но и посмотреть, как обычно меняется цена в течение...
В Совфеде предложили перезапустить производство двигателей на российских заводах Volkswagen и Hyundai
Как пишут «Известия», комитет Совета Федерации по экономполитике предложил начать выпуск газовых двигателей на простаивающих российских автомобильных заводах, где до прошлого года выпускали двигатели внутреннего сгорания (это Volkswagen и Hyundai). Для этого предполагается создать консорциум из действующих автопроизводителей. Фото: Максим Богодвид/РИА Новости Также...
Google разрабатывает ИИ-алгоритм Genesis для написания новостных статей, но о замене журналистов речи не идёт
По сообщениям сетевых источников, компания Google работает над созданием ИИ-алгоритма для написания новостных статей. Он разрабатывается под кодовым названием Genesis и уже был продемонстрирован руководству некоторых крупных изданий, таких как The New York Times, The Washington Post и The Wall Street Journal. Источник изображения: StartupStockPhotos /...
Журналист предостерёг геймеров насчёт обзоров Baldur’s Gate 3 на релизе — Larian разошлёт ключи слишком поздно
Фэнтезийная ролевая игра Baldur’s Gate 3 от бельгийской Larian Studios — проект масштабный, поэтому разработчики позаботятся, чтобы журналисты и блогеры получили ключ для обзора до релиза. Впрочем, не всё так просто. Источник изображения: Steam...