- Anthropic выиграла суд у издателей: обучать... (887)
- Минус 8 ГБ памяти, плюс две буквы D в... (463)
- Google масштабно переделала приложение... (337)
- M**a выпустила VR-гарнитуру Quest 3S Xbox... (525)
- Госдума РФ приняла закон об обязательной... (625)
- Xbox скоро настигнет новая волна массовых... (361)
- Tecno выпустила бюджетный смартфон Spark Go... (520)
- Путин подписал закон о создании... (751)
- Выяснилась причина крушения частного... (370)
- Всё идёт по плану: первый пуск новой ракеты... (474)
- Новый геймплейный трейлер раскрыл дату... (719)
- Nvidia представила самый медленный GeForce... (122)
- Nvidia представила самую медленную... (657)
- «Поможет тысячам людей»: в России начнут... (609)
- Нью-Йорк построит гигаваттную АЭС для ИИ ЦОД... (841)
- Первый в мире спутник с радаром P-диапазона... (408)
Видеокамеры больше не нужны? Новая нейросеть Nvidia генерирует видеоролики по текстовым описаниям и в высоком разрешении
Дата: 2023-04-21 22:33
Компания Nvidia представила новое решение в сфере искусственного интеллекта — нейросеть Video LDM, которая позволяет генерировать видеоролики по текстовому описанию, причём в высоком разрешении. В проекте принимают участие специалисты Nvidia и разработчики из Корнеллского университета.

Отмечается, что нейросеть создаёт ролики с разрешением до 2048×1280 пикселей и частотой в 24 кадра. У ИИ-модели есть 4,1 млрд параметров, 2,7 млрд из них использовали для видеороликов, по которым «тренировали» нейросеть.
Используемый в нейросети механизм Latent Diffusion Models позволяет обходиться без мощного и дорого аппаратного обеспечения, а для работы используется движок Stable Diffusion. Таким образом, Video LDM генерирует ролики покадрово.
Помимо этого, система умеет генерировать видео сцен вождения с разрешением 1024 × 512 пикселей и длительность до 5 минут.
На сайте Nvidia есть целый ряд видео, которые показывают возможности нового ИИ, есть короткие и более длинные ролики. При этом публичной версии Video LDM пока нет, также неясно, когда она появится в общем доступе. Пока что это лишь исследовательский проект, а не коммерческий.
Полноценная презентация ожидается в рамках Конференции по машинному зрению и распознаванию образов, она пройдёт 18–22 июня в Ванкувере, Канада.
Подробнее на iXBT
Предыдущие новости
Владельцы Huawei P60 смогут сдать свои смартфоны и получить Huawei P70 за полцены. Компания запустила услугу Value Preservation & Renewal Service
Компания Huawei запустила услугу, которая должна сделать пользователей её смартфонов более лояльными к бренду. В рамках услуги Value Preservation & Renewal Service владельцы флагманских смартфонов Huawei P60 смогут обновиться до моделей следующего поколения за полцены. Проще говоря, владелец P60 сможет прийти в магазин Huawei, сдать свой смартфон и получить скидку 50% на...
Чат-бот Bard от Google научился писать и отлаживать код на C++, Java, Javascript, Python и других языках
В чат-боте Bard от Google появилась возможность генерировать и отлаживать исходный код на 20 языках программирования. В списке есть C++, Go, Java, Javascript, Python и Typescript. Помимо этого, ИИ умеет выдавать текстовые подсказки, переводить код на разные языки программирования и экспортировать это в Colab. Источник: Google В компании заявили, что чат-бот будет ссылаться на...
До конца июня в Steam выйдет ещё четыре игры Ubisoft, включая Far Cry 6 и Rainbow Six Extraction
Ubisoft продолжает постепенное возвращение в Steam. Как подметил пользователь Chairmanchuck с форума ResetEra, в цифровом магазине Valve появились страницы ещё четырёх игр французского издательства. Источник изображений:...
Seagate начала поставлять жёсткие диски ёмкостью более 30 Тбайт на базе HAMR
Seagate сообщила, что начала поставки жёстких дисков ёмкостью 30+ Тбайт, основанных на технологии термомагнитной записи (HAMR), одному из своих клиентов в сфере облачных центров обработки данных. Диски являются окончательными квалификационными образцами, и компания собирается огласить выручку от продаж своих систем Corvault на базе HAMR в ближайшие недели. Источник...