- «Мы ждали экипаж Ax-4 с нетерпением». С... (268)
- Фанаты Xbox 360 получили от Microsoft... (520)
- У Lada Azimut насчитали десятки более... (256)
- Запас хода почти 1200 км, аудиосистема... (280)
- Российские геймеры не смогли зайти в Steam в... (266)
- Microsoft выведет антивирусное ПО за пределы... (301)
- Google Assistant скоро уступит место... (308)
- SpaceX: мощнейший взрыв Starship и пожар не... (192)
- «Аномалия Starship», уничтожившая... (282)
- Вместо Xcite — Lada Iskra: на площадке в... (227)
- В Китае стартовали продажи электрических... (327)
- Вот во что превратилась самая большая ракета... (447)
- Новая статья: Обзор HUAWEI MatePad Pro... (451)
- Больше Camry, мощнее Camry, роскошнее Camry... (499)
- Китайцы представили 64-ядерный процессор с... (411)
- Новый крупный патч добавил в Warhammer... (387)
Генерируйте на здоровье: Сбер открыл доступ к нейросетям для русского и ещё 60 языков
Дата: 2023-07-20 13:02
Команда СберБанка открыл доступ к нейросетевой модели генерации текста для русского языка ruGPT-3.5 13B. Её дообученная версия лежит в основе сервиса GigaChat. Также банк выложил новую версию модели mGPT 13B — самую большую из семейства многоязычных моделей Сбера, способную генерировать тексты на 61 языке.

Обе модели доступны на платформе HuggingFace, и их могут использовать все разработчики, модели опубликованы под открытой лицензией MIT.
Russian Generative Pretrained Transformer версии 3.5 (ruGPT-3.5 13B) — новая версия нейросети ruGPT-3 13B. Это современная модель генерации текста для русского языка на основе доработанной исследователями Сбера архитектуры GPT-3 от OpenAI. Модель ruGPT-3.5 13B содержит 13 млрд параметров и умеет продолжать тексты на русском и английском языках, а также на языках программирования. Длина контекста модели составляет 2048 токенов. Она обучена на текстовом корпусе размером около 1 ТБ, в который, помимо уже использованной для обучения ruGPT-3 большой коллекции текстовых данных из открытых источников, вошли, например, часть открытого сета с кодом The Stack от коллаборации исследователей BigCode и корпусы новостных текстов.
Также в открытом доступе опубликована многоязычная модель mGPT 13B. Версия mGPT 13B содержит 13 млрд параметров и способна продолжать тексты на 61 языке, включая языки стран СНГ и малых народов России. Длина контекста модели составляет 512 токенов. Она была обучена на 600 ГБ текстов на разных языках, собранных из очищенных и подготовленных датасетов multilingual C4 и других открытых источников.
Подробнее на iXBT
Предыдущие новости
Отечественная альтернатива Google Play: в RuStore появилась горячо ожидаемая тёмная тема... И розовая
Команда отечественного аналога Google Play — онлайн-магазина приложений RuStore для операционной системы Android — поделилась свежими новостями о проекте. В RuStore обновился дизайн В профиле пользователя появился раздел «Темы», где пользователи могут изменить оформление: теперь им доступны тёмная и розовая темы. Сгенерировано нейросетью Midjourney В разделе «Тема»...
Более 8000 авторов книг, стихов и статей выставят счёт IT-гигантам за скармливание их произведений ИИ
Более 8000 писателей и литературных деятелей, включая Маргарет Этвуд (Margaret Atwood) и Джеймса Паттерсона (James Patterson), подписали открытое письмо с требованием компенсации от компаний, использующих их произведения для обучения ИИ-моделей без ведома авторов. Источник изображения: ThankYouFantasyPictures /...
Представлен флагман ZTE nubia Z50S Pro с разогнанным Snapdragon 8 Gen 2, продвинутой камерой и ценой от $515
Компания ZTE представила флагманский смартфон nubia Z50S Pro. Устройство обладает премиальным внешним видом, в основе использует разогнанный процессор Qualcomm Snapdragon 8 Gen 2 и получило продвинутую основную камеру. Источник изображений:...
Эмулятор Dolphin всё-таки не выйдет в Steam — Valve обязала разработчиков договориться с Nintendo, но это было невозможно
Команда разработки эмулятора Dolphin, позволяющего запускать на ПК игры с консолей Nintendo GameCube и Wii, выступила с заявлением по поводу судьбы версии своей утилиты для сервиса цифровой дистрибуции Steam. Источник изображения:...