- Keychron представила беспроводную игровую... (392)
- «Вложу всю свою страсть, энергию и душу»:... (460)
- Аналитики уверены, что Apple не будет... (442)
- Snap объявила о сокращении 1000 человек... (416)
- Китайский робот Unitree R1 появился на... (384)
- Intel рассказала, каким должен быть игровой... (395)
- Компания Science бывшего президента... (391)
- Нет худа без добра: украденные хакерами... (527)
- Еврокомиссия сочла плату WhatsApp за доступ... (378)
- Microsoft получит 30 тыс. ИИ-ускорителей... (355)
- Аналитики: спустя два с половиной года... (544)
- Европейское приложение для верификации... (534)
- Lexar: геймеры готовы жертвовать объёмом... (580)
- Переработанная функция Windows Recall всё... (343)
- Spotify и звукозаписывающие компании... (626)
- Rolls-Royce анонсировала роскошный... (553)
Генерируйте на здоровье: Сбер открыл доступ к нейросетям для русского и ещё 60 языков
Дата: 2023-07-20 13:02
Команда СберБанка открыл доступ к нейросетевой модели генерации текста для русского языка ruGPT-3.5 13B. Её дообученная версия лежит в основе сервиса GigaChat. Также банк выложил новую версию модели mGPT 13B — самую большую из семейства многоязычных моделей Сбера, способную генерировать тексты на 61 языке.
Сгенерировано нейросетью Midjourney Обе модели доступны на платформе HuggingFace, и их могут использовать все разработчики, модели опубликованы под открытой лицензией MIT.
Russian Generative Pretrained Transformer версии 3.5 (ruGPT-3.5 13B) — новая версия нейросети ruGPT-3 13B. Это современная модель генерации текста для русского языка на основе доработанной исследователями Сбера архитектуры GPT-3 от OpenAI. Модель ruGPT-3.5 13B содержит 13 млрд параметров и умеет продолжать тексты на русском и английском языках, а также на языках программирования. Длина контекста модели составляет 2048 токенов. Она обучена на текстовом корпусе размером около 1 ТБ, в который, помимо уже использованной для обучения ruGPT-3 большой коллекции текстовых данных из открытых источников, вошли, например, часть открытого сета с кодом The Stack от коллаборации исследователей BigCode и корпусы новостных текстов.
Также в открытом доступе опубликована многоязычная модель mGPT 13B. Версия mGPT 13B содержит 13 млрд параметров и способна продолжать тексты на 61 языке, включая языки стран СНГ и малых народов России. Длина контекста модели составляет 512 токенов. Она была обучена на 600 ГБ текстов на разных языках, собранных из очищенных и подготовленных датасетов multilingual C4 и других открытых источников.
Подробнее на iXBT
Предыдущие новости
Отечественная альтернатива Google Play: в RuStore появилась горячо ожидаемая тёмная тема... И розовая
Команда отечественного аналога Google Play — онлайн-магазина приложений RuStore для операционной системы Android — поделилась свежими новостями о проекте. В RuStore обновился дизайн В профиле пользователя появился раздел «Темы», где пользователи могут изменить оформление: теперь им доступны тёмная и розовая темы. Сгенерировано нейросетью Midjourney В разделе «Тема»...
Более 8000 авторов книг, стихов и статей выставят счёт IT-гигантам за скармливание их произведений ИИ
Более 8000 писателей и литературных деятелей, включая Маргарет Этвуд (Margaret Atwood) и Джеймса Паттерсона (James Patterson), подписали открытое письмо с требованием компенсации от компаний, использующих их произведения для обучения ИИ-моделей без ведома авторов. Источник изображения: ThankYouFantasyPictures /...
Представлен флагман ZTE nubia Z50S Pro с разогнанным Snapdragon 8 Gen 2, продвинутой камерой и ценой от $515
Компания ZTE представила флагманский смартфон nubia Z50S Pro. Устройство обладает премиальным внешним видом, в основе использует разогнанный процессор Qualcomm Snapdragon 8 Gen 2 и получило продвинутую основную камеру. Источник изображений:...
Эмулятор Dolphin всё-таки не выйдет в Steam — Valve обязала разработчиков договориться с Nintendo, но это было невозможно
Команда разработки эмулятора Dolphin, позволяющего запускать на ПК игры с консолей Nintendo GameCube и Wii, выступила с заявлением по поводу судьбы версии своей утилиты для сервиса цифровой дистрибуции Steam. Источник изображения:...