- TSMC готова вложить $250 млрд в производство... (6998)
- TSMC готова потратить на технопарк в Аризоне... (6746)
- Разработчики Forza Horizon 6 «наградили»... (7325)
- Microsoft недосчитается десятков миллиардов... (7449)
- Microsoft не сможет выручить на... (6931)
- Бывший главный исследователь Илья Суцкевер... (7152)
- Microsoft рассчитывала превратить $13 млрд в... (5827)
- Microsoft рассчитывала заработать $92 млрд... (6517)
- Google случайно показала грядущий ИИ Omni,... (6983)
- Google может представить на I/O 2026 новую... (7044)
- Даже лучшие ИИ «сыпятся» на длинных задачах:... (7682)
- Исследователи Microsoft предупредили, что... (6203)
- На iPhone появилось сквозное шифрования для... (7263)
- В iOS 26.5 появилось сквозное шифрования для... (6631)
- Новая статья: Обзор игрового QD-OLED... (6713)
- Новая статья: Обзор сервера ASUS... (9678)
«Я — большая, плоская, серая компьютерная плата». Яндекс выложил рекордную нейросеть для создания текстов
Дата: 2022-06-23 11:45
Команда Яндекса выложила в открытый доступ нейросеть YaLM 100B для создания и обработки текстов на русском и английском языках.
Как отмечают в пресс-службе, это самая большая GPT-подобная модель, опубликованная в свободном доступе. Теперь её могут использовать разработчики и исследователи со всего мира.
YaLM 100В содержит 100 млрд параметров — больше, чем какая-либо из существующих моделей для русского языка. Это позволяет использовать её для решения большого круга задач, связанных с обработкой естественного языка. В Яндексе рассказали:
Языковые модели из семейства YaLM определяют принцип построения текста и генерируют новые, опираясь на законы лингвистики и свои знания о мире. Например, они способны придумывать идеи для рекламных кампаний, создавать описания товаров и видео. С их помощью можно генерировать любые тексты (стихи, ответы, поздравления и так далее), а также классифицировать их, например, по стилю речи.
Команда Яндекса использует нейросети YaLM более чем в 20 проектах, в том числе в фирменном поиске и голосовом помощнике Алисе.
Модель обучали на суперкомпьютерах Яндекса, которые были признаны самыми мощными в Восточной Европе. В процессе обучения YaLM 100B обработала около 2 ТБ текстов из открытых датасетов и интернета на английском и русском языках. Модель предоставляется по открытой лицензии Apache 2.0 и доступна на GitHub.
Подробнее на iXBT
Предыдущие новости
Опубликованы официальные характеристики и тесты видеокарты Intel Arc A380
В сети появились официальные характеристики видеокарты Intel Arc A380. Судя по ним, графический чип выполнен по техпроцессу TSMC N6. Чип оснащён 1024 ядрами FP32 (каждое ядро ??Xe имеет по 128 ядер FP32) и 6 ГБ памяти GDDR6 с тактовой частотой 16 Гбит/с. Шина данных — 96 бит, что даёт на выходе пропускную способность в 192 ГБ/с. Теплопакет карты находится в диапазоне от 75 Вт...
Илон Маск опечален: заводы Tesla в Германии и Техасе выкачивают из компании миллиарды долларов
Заводы производителя электромобилей Tesla в Германии и американском штате Техас создают убытки «на миллиарды долларов», заявил основатель компании Илон Маск. Оба предприятия столкнулись с проблемами в наращивании производства, в частности из-за нарушения логистических цепочек. «Заводы в Берлине и Остине представляют собой сейчас гигантские печи для денег», – сказал глава...
General Motors привлечёт искусственный интеллект к техосмотру машин
General Motors сообщила о стратегических инвестициях в израильский стартап Uveye, который специализируется на разработке систем диагностики автомобилей. Эти системы включают в себя набор датчиков и алгоритмы искусственного интеллекта — они позволяют быстро выявлять неисправные детали и проблемы с техническим состоянием. Источник изображения:...
NASA выделило $5 млн на разработку трёх проектов ядерных реакторов для космических баз
NASA заключило три контракта общей стоимостью $5 млн на разработку ядерных реакторов для снабжения ближних и дальних космических баз электричеством и теплом. Конкурсная программа рассчитана на 12 месяцев, после чего наилучший проект перейдёт в фазу создания прототипа. На основе перспективного реактора также могут создать ядерную двигательную установку для полётов как в...