- Новая альтернатива МКС: орбитальную станцию... (2286)
- Новая альтернатива МКС: анонсирована... (3237)
- TSMC готова наладить выпуск 3-нм чипов в... (3124)
- Honor вслед за Xiaomi повышает цены из-за... (2472)
- 10 000 мА·ч ,100 Вт по проводу и 80 Вт без... (3117)
- Xiaomi 17 Ultra с новейшей оптикой Leica и... (3545)
- OpenAI готовится привлечь до $100 млрд,... (2793)
- Дефицит памяти разогнал Micron — квартальный... (2738)
- Оптимистичный прогноз Micron по выручке... (2951)
- Трансляции кинопремии «Оскар» официально... (3450)
- Платформа YouTube получила эксклюзивные... (3344)
- Вышла Gemini 3 Flash — новая базовая модель... (4354)
- Google раскрыла уязвимость Windows 11 —... (4136)
- Sapphire выпустит Radeon RX 9070 XT Nitro+... (2842)
- Состоялся релиз российской ОС «МСВСфера»... (4196)
- 400 тонн переработанного урана в... (3616)
«Я — большая, плоская, серая компьютерная плата». Яндекс выложил рекордную нейросеть для создания текстов
Дата: 2022-06-23 11:45
Команда Яндекса выложила в открытый доступ нейросеть YaLM 100B для создания и обработки текстов на русском и английском языках.
Как отмечают в пресс-службе, это самая большая GPT-подобная модель, опубликованная в свободном доступе. Теперь её могут использовать разработчики и исследователи со всего мира.
YaLM 100В содержит 100 млрд параметров — больше, чем какая-либо из существующих моделей для русского языка. Это позволяет использовать её для решения большого круга задач, связанных с обработкой естественного языка. В Яндексе рассказали:
Языковые модели из семейства YaLM определяют принцип построения текста и генерируют новые, опираясь на законы лингвистики и свои знания о мире. Например, они способны придумывать идеи для рекламных кампаний, создавать описания товаров и видео. С их помощью можно генерировать любые тексты (стихи, ответы, поздравления и так далее), а также классифицировать их, например, по стилю речи.
Команда Яндекса использует нейросети YaLM более чем в 20 проектах, в том числе в фирменном поиске и голосовом помощнике Алисе.
Модель обучали на суперкомпьютерах Яндекса, которые были признаны самыми мощными в Восточной Европе. В процессе обучения YaLM 100B обработала около 2 ТБ текстов из открытых датасетов и интернета на английском и русском языках. Модель предоставляется по открытой лицензии Apache 2.0 и доступна на GitHub.
Подробнее на iXBT
Предыдущие новости
Опубликованы официальные характеристики и тесты видеокарты Intel Arc A380
В сети появились официальные характеристики видеокарты Intel Arc A380. Судя по ним, графический чип выполнен по техпроцессу TSMC N6. Чип оснащён 1024 ядрами FP32 (каждое ядро ??Xe имеет по 128 ядер FP32) и 6 ГБ памяти GDDR6 с тактовой частотой 16 Гбит/с. Шина данных — 96 бит, что даёт на выходе пропускную способность в 192 ГБ/с. Теплопакет карты находится в диапазоне от 75 Вт...
Илон Маск опечален: заводы Tesla в Германии и Техасе выкачивают из компании миллиарды долларов
Заводы производителя электромобилей Tesla в Германии и американском штате Техас создают убытки «на миллиарды долларов», заявил основатель компании Илон Маск. Оба предприятия столкнулись с проблемами в наращивании производства, в частности из-за нарушения логистических цепочек. «Заводы в Берлине и Остине представляют собой сейчас гигантские печи для денег», – сказал глава...
General Motors привлечёт искусственный интеллект к техосмотру машин
General Motors сообщила о стратегических инвестициях в израильский стартап Uveye, который специализируется на разработке систем диагностики автомобилей. Эти системы включают в себя набор датчиков и алгоритмы искусственного интеллекта — они позволяют быстро выявлять неисправные детали и проблемы с техническим состоянием. Источник изображения:...
NASA выделило $5 млн на разработку трёх проектов ядерных реакторов для космических баз
NASA заключило три контракта общей стоимостью $5 млн на разработку ядерных реакторов для снабжения ближних и дальних космических баз электричеством и теплом. Конкурсная программа рассчитана на 12 месяцев, после чего наилучший проект перейдёт в фазу создания прототипа. На основе перспективного реактора также могут создать ядерную двигательную установку для полётов как в...