- Индия приближается к пилотируемым полётам:... (2329)
- Starlink снизит орбиты более 4 000... (2514)
- Китай в Совбезе ООН обвинил Starlink в... (2299)
- Гибридные клетки человека и растения... (2942)
- Tesla резко сократила на 99% закупки... (2682)
- «Москвичи» подорожали в России с 1 января... (2852)
- NASA Artemis II: первый пилотируемый полёт к... (1985)
- «Да, атомные электростанции 5090 всё ещё... (2040)
- Да, 7000 мАч и «телевик», но всё-таки уже... (2129)
- Новая статья: Лучшие игры 2025 года: выбор... (2024)
- Норвежская компания готовит к запуску в 2026... (2854)
- Япония готовит миссию MMX к спутникам Марса:... (2998)
- Новый тип ветрогенераторов для питания... (2884)
- США тестируют «заряжающее» шоссе: во Флориде... (2424)
- Космические силы США готовят новую базу для... (2072)
- Стеклянная память будущих дата-центров:... (2365)
«Я — большая, плоская, серая компьютерная плата». Яндекс выложил рекордную нейросеть для создания текстов
Дата: 2022-06-23 11:45
Команда Яндекса выложила в открытый доступ нейросеть YaLM 100B для создания и обработки текстов на русском и английском языках.
Как отмечают в пресс-службе, это самая большая GPT-подобная модель, опубликованная в свободном доступе. Теперь её могут использовать разработчики и исследователи со всего мира.
YaLM 100В содержит 100 млрд параметров — больше, чем какая-либо из существующих моделей для русского языка. Это позволяет использовать её для решения большого круга задач, связанных с обработкой естественного языка. В Яндексе рассказали:
Языковые модели из семейства YaLM определяют принцип построения текста и генерируют новые, опираясь на законы лингвистики и свои знания о мире. Например, они способны придумывать идеи для рекламных кампаний, создавать описания товаров и видео. С их помощью можно генерировать любые тексты (стихи, ответы, поздравления и так далее), а также классифицировать их, например, по стилю речи.
Команда Яндекса использует нейросети YaLM более чем в 20 проектах, в том числе в фирменном поиске и голосовом помощнике Алисе.
Модель обучали на суперкомпьютерах Яндекса, которые были признаны самыми мощными в Восточной Европе. В процессе обучения YaLM 100B обработала около 2 ТБ текстов из открытых датасетов и интернета на английском и русском языках. Модель предоставляется по открытой лицензии Apache 2.0 и доступна на GitHub.
Подробнее на iXBT
Предыдущие новости
Опубликованы официальные характеристики и тесты видеокарты Intel Arc A380
В сети появились официальные характеристики видеокарты Intel Arc A380. Судя по ним, графический чип выполнен по техпроцессу TSMC N6. Чип оснащён 1024 ядрами FP32 (каждое ядро ??Xe имеет по 128 ядер FP32) и 6 ГБ памяти GDDR6 с тактовой частотой 16 Гбит/с. Шина данных — 96 бит, что даёт на выходе пропускную способность в 192 ГБ/с. Теплопакет карты находится в диапазоне от 75 Вт...
Илон Маск опечален: заводы Tesla в Германии и Техасе выкачивают из компании миллиарды долларов
Заводы производителя электромобилей Tesla в Германии и американском штате Техас создают убытки «на миллиарды долларов», заявил основатель компании Илон Маск. Оба предприятия столкнулись с проблемами в наращивании производства, в частности из-за нарушения логистических цепочек. «Заводы в Берлине и Остине представляют собой сейчас гигантские печи для денег», – сказал глава...
General Motors привлечёт искусственный интеллект к техосмотру машин
General Motors сообщила о стратегических инвестициях в израильский стартап Uveye, который специализируется на разработке систем диагностики автомобилей. Эти системы включают в себя набор датчиков и алгоритмы искусственного интеллекта — они позволяют быстро выявлять неисправные детали и проблемы с техническим состоянием. Источник изображения:...
NASA выделило $5 млн на разработку трёх проектов ядерных реакторов для космических баз
NASA заключило три контракта общей стоимостью $5 млн на разработку ядерных реакторов для снабжения ближних и дальних космических баз электричеством и теплом. Конкурсная программа рассчитана на 12 месяцев, после чего наилучший проект перейдёт в фазу создания прототипа. На основе перспективного реактора также могут создать ядерную двигательную установку для полётов как в...