- Китай полностью доминирует на российском... (493)
- Toyota вернулась в российский топ-10:... (623)
- Учёные из Китайского университета науки и... (422)
- Geely больше не будет продавать акции Volvo,... (538)
- Робот-пылесос ILIFE T20s обеспечит 70 дней... (509)
- Роботы-пылесос ILIFE T20s обеспечит 70 дней... (403)
- Лаборатория реактивного движения NASA... (460)
- Waymo запустила беспилотные такси для всех... (513)
- В третьем квартале объёмы поставок... (373)
- Сомнений не осталось: Li L6 стал главным... (512)
- Тайвань отрицает, что SpaceX призвала... (661)
- Конкурент Boeing 787 Dreamliner с 400... (472)
- Мировые продажи подключаемых гибридных... (510)
- Nissan, которая увольняет тысячи сотрудников... (506)
- M**a вынуждена поменять для ЕС методы показа... (590)
- SoftBank построит самый мощный... (511)
«Я — большая, плоская, серая компьютерная плата». Яндекс выложил рекордную нейросеть для создания текстов
Дата: 2022-06-23 11:45
Команда Яндекса выложила в открытый доступ нейросеть YaLM 100B для создания и обработки текстов на русском и английском языках.
Как отмечают в пресс-службе, это самая большая GPT-подобная модель, опубликованная в свободном доступе. Теперь её могут использовать разработчики и исследователи со всего мира.
YaLM 100В содержит 100 млрд параметров — больше, чем какая-либо из существующих моделей для русского языка. Это позволяет использовать её для решения большого круга задач, связанных с обработкой естественного языка. В Яндексе рассказали:
Языковые модели из семейства YaLM определяют принцип построения текста и генерируют новые, опираясь на законы лингвистики и свои знания о мире. Например, они способны придумывать идеи для рекламных кампаний, создавать описания товаров и видео. С их помощью можно генерировать любые тексты (стихи, ответы, поздравления и так далее), а также классифицировать их, например, по стилю речи.
Команда Яндекса использует нейросети YaLM более чем в 20 проектах, в том числе в фирменном поиске и голосовом помощнике Алисе.
Модель обучали на суперкомпьютерах Яндекса, которые были признаны самыми мощными в Восточной Европе. В процессе обучения YaLM 100B обработала около 2 ТБ текстов из открытых датасетов и интернета на английском и русском языках. Модель предоставляется по открытой лицензии Apache 2.0 и доступна на GitHub.
Подробнее на iXBT
Предыдущие новости
Опубликованы официальные характеристики и тесты видеокарты Intel Arc A380
В сети появились официальные характеристики видеокарты Intel Arc A380. Судя по ним, графический чип выполнен по техпроцессу TSMC N6. Чип оснащён 1024 ядрами FP32 (каждое ядро ??Xe имеет по 128 ядер FP32) и 6 ГБ памяти GDDR6 с тактовой частотой 16 Гбит/с. Шина данных — 96 бит, что даёт на выходе пропускную способность в 192 ГБ/с. Теплопакет карты находится в диапазоне от 75 Вт...
Илон Маск опечален: заводы Tesla в Германии и Техасе выкачивают из компании миллиарды долларов
Заводы производителя электромобилей Tesla в Германии и американском штате Техас создают убытки «на миллиарды долларов», заявил основатель компании Илон Маск. Оба предприятия столкнулись с проблемами в наращивании производства, в частности из-за нарушения логистических цепочек. «Заводы в Берлине и Остине представляют собой сейчас гигантские печи для денег», – сказал глава...
General Motors привлечёт искусственный интеллект к техосмотру машин
General Motors сообщила о стратегических инвестициях в израильский стартап Uveye, который специализируется на разработке систем диагностики автомобилей. Эти системы включают в себя набор датчиков и алгоритмы искусственного интеллекта — они позволяют быстро выявлять неисправные детали и проблемы с техническим состоянием. Источник изображения:...
NASA выделило $5 млн на разработку трёх проектов ядерных реакторов для космических баз
NASA заключило три контракта общей стоимостью $5 млн на разработку ядерных реакторов для снабжения ближних и дальних космических баз электричеством и теплом. Конкурсная программа рассчитана на 12 месяцев, после чего наилучший проект перейдёт в фазу создания прототипа. На основе перспективного реактора также могут создать ядерную двигательную установку для полётов как в...