- В Россию привезут китайский Toyota RAV4:... (543)
- Sony прокачала апскейлер PSSR для PS5 Pro,... (441)
- В видеокартах GeForce RTX 5000 наконец... (450)
- Galaxy S26 Ultra нашёл первого хозяина почти... (615)
- Дорогие ПК спровоцировали ренессанс... (486)
- Инновации Samsung не зашли покупателям.... (545)
- Nvidia GeForce3 отмечают четвертьвековой... (604)
- Император не одобряет: игроки разгромили DLC... (482)
- Илон Маск: Tesla построит заводы на Луне к... (489)
- Японская Buffalo объявила о прекращении... (459)
- Активность Солнца грозит лунной миссии... (474)
- «Нива» для диких лесов: в Брянске готовят к... (492)
- Мировые продажи смартфонов откатятся на 13... (485)
- Мощный конкурент Tank 500 и Land Cruiser —... (649)
- Исход основателей из xAI продолжается — Тоби... (661)
- Honor представит ультратонкий смартфон Magic... (643)
Видеокамеры больше не нужны? Новая нейросеть Nvidia генерирует видеоролики по текстовым описаниям и в высоком разрешении
Дата: 2023-04-21 22:33
Компания Nvidia представила новое решение в сфере искусственного интеллекта — нейросеть Video LDM, которая позволяет генерировать видеоролики по текстовому описанию, причём в высоком разрешении. В проекте принимают участие специалисты Nvidia и разработчики из Корнеллского университета.
Источник: Nvidia Отмечается, что нейросеть создаёт ролики с разрешением до 2048×1280 пикселей и частотой в 24 кадра. У ИИ-модели есть 4,1 млрд параметров, 2,7 млрд из них использовали для видеороликов, по которым «тренировали» нейросеть.
Используемый в нейросети механизм Latent Diffusion Models позволяет обходиться без мощного и дорого аппаратного обеспечения, а для работы используется движок Stable Diffusion. Таким образом, Video LDM генерирует ролики покадрово.
Помимо этого, система умеет генерировать видео сцен вождения с разрешением 1024 × 512 пикселей и длительность до 5 минут.
На сайте Nvidia есть целый ряд видео, которые показывают возможности нового ИИ, есть короткие и более длинные ролики. При этом публичной версии Video LDM пока нет, также неясно, когда она появится в общем доступе. Пока что это лишь исследовательский проект, а не коммерческий.
Полноценная презентация ожидается в рамках Конференции по машинному зрению и распознаванию образов, она пройдёт 18–22 июня в Ванкувере, Канада.
Подробнее на iXBT
Предыдущие новости
Владельцы Huawei P60 смогут сдать свои смартфоны и получить Huawei P70 за полцены. Компания запустила услугу Value Preservation & Renewal Service
Компания Huawei запустила услугу, которая должна сделать пользователей её смартфонов более лояльными к бренду. В рамках услуги Value Preservation & Renewal Service владельцы флагманских смартфонов Huawei P60 смогут обновиться до моделей следующего поколения за полцены. Проще говоря, владелец P60 сможет прийти в магазин Huawei, сдать свой смартфон и получить скидку 50% на...
Чат-бот Bard от Google научился писать и отлаживать код на C++, Java, Javascript, Python и других языках
В чат-боте Bard от Google появилась возможность генерировать и отлаживать исходный код на 20 языках программирования. В списке есть C++, Go, Java, Javascript, Python и Typescript. Помимо этого, ИИ умеет выдавать текстовые подсказки, переводить код на разные языки программирования и экспортировать это в Colab. Источник: Google В компании заявили, что чат-бот будет ссылаться на...
До конца июня в Steam выйдет ещё четыре игры Ubisoft, включая Far Cry 6 и Rainbow Six Extraction
Ubisoft продолжает постепенное возвращение в Steam. Как подметил пользователь Chairmanchuck с форума ResetEra, в цифровом магазине Valve появились страницы ещё четырёх игр французского издательства. Источник изображений:...
Seagate начала поставлять жёсткие диски ёмкостью более 30 Тбайт на базе HAMR
Seagate сообщила, что начала поставки жёстких дисков ёмкостью 30+ Тбайт, основанных на технологии термомагнитной записи (HAMR), одному из своих клиентов в сфере облачных центров обработки данных. Диски являются окончательными квалификационными образцами, и компания собирается огласить выручку от продаж своих систем Corvault на базе HAMR в ближайшие недели. Источник...