- Астрономы могли наблюдать рождение... (608)
- Starlink Илона Маска уже доступен в 155... (755)
- 450 000 GPU, 392 000 км оптоволокна и 1,3... (720)
- Neuralink запустит массовое чипирование... (653)
- Li Auto продала уже 1,5 млн... (642)
- Лучший Android-смартфон в мире для съемки... (656)
- Новый Tesla Semi заряжается при мощности 1,2... (663)
- На пороге миллиона: поставки автомобилей... (715)
- 102 инфракрасных оттенка космоса: телескоп... (694)
- Samsung делает кухонную технику ещё умнее:... (769)
- Новейший Honor Win с огромным аккумулятором,... (695)
- Super Mini LED, от 75 до 98 дюймов, 6/128... (671)
- Acemagic показала ламповый мини-ПК Retro X5... (711)
- LG создала монстра для геймеров: первый... (858)
- Dreame хочет стать второй Xiaomi: компания... (539)
- Гигантский аккумулятор 10080 мАч в тонком... (656)
Китай и правда понесло: представлена нейросеть OmniHuman-1, которая создаёт максимально живые видео по фотографиям
Дата: 2025-02-05 10:07
В ByteDance разработали систему искусственного интеллекта, которая преобразует фотографии в максимально реалистичные видеоролики.
Новая система под названием OmniHuman-1 генерирует видеоролики в полный рост, на которых люди жестикулируют и двигаются в соответствии с речью, превосходя предыдущие модели искусственного интеллекта, которые могли анимировать только лица или верхнюю часть тела.
Кадр из видео «В последние годы сквозная человеческая анимация претерпела заметные улучшения, — заявили в ByteDance. — Однако существующие методы по-прежнему с трудом масштабируются в качестве больших общих моделей генерации видео, что ограничивает их потенциал в реальных приложениях».
Команда обучила OmniHuman-1 на более чем 18 700 часах человеческих видеоданных, используя новый подход, который объединяет несколько типов входных данных — текст, аудио и движения тела. Эта стратегия обучения «всеобщих условий» позволяет ИИ обучаться на гораздо более крупных и разнообразных наборах данных, чем предыдущие методы.
«Наша главная идея заключается в том, что включение в процесс обучения множественных кондиционирующих сигналов, таких как текст, аудио и поза, может значительно сократить потери данных», — пояснила исследовательская группа.
В ходе тестирования OmniHuman-1 превзошла существующие системы сразу по нескольким показателям качества. Огромное количество примеров можно найти по этой ссылке.
Ранее китайская технологическая компания Alibaba выпустила новую версию своей модели искусственного интеллекта Qwen 2.5-Max, которая, по словам представителей компании, превзошла высоко оцененную модель DeepSeek-V3. А DeepSeek сообщила о запуске новейшей ИИ-модели Janus-Pro-7B.
Подробнее на iXBT
Предыдущие новости
В России продают Toyota Land Cruiser Prado с холодильником и подогревами
Автомобиль Toyota Land Cruiser Prado, выпущенный 2019 году, выставили на продажу в России. Владелец утверждает, что автомобиль имеет «чистую историю», а реальный пробег составляет 82 тысячи километров. Внедорожник оснащен системой полного привода и автоматической коробкой передач. Дизельный двигатель объемом 2,8 литра развивает мощность до 177 л.с. В описании говорится, что...
«Лаборатория Касперского» впервые нашла в App Store троян — он ищет фотографии паролей и отправляет их куда-то
Эксперты «Лаборатории Касперского» обнаружили в магазинах Apple App Store и Google Play троянец SparkCat, внедрённый в поддельные приложения: службы обмена сообщениями, помощники с искусственным интеллектом, сервисы доставки еды и клиенты криптовалютных бирж. Встроенный в эти приложения вредоносный фреймворк сканирует сохранённые на устройствах фотографии, находит...
Alphabet потратит $75 млрд «на ускорение прогресса» в 2025 году — больше M**a, но меньше Microsoft
Корпорация Alphabet, в состав которой входит компания Google, отчиталась на этой неделе о финансовых итогах четвёртого квартала прошлого года. Совокупная выручка выросла на 12 % до $96,47 млрд, но оказалась ниже прогнозов аналитиков. Рост выручки в облачном сегменте на 30 % до $11,96 млрд тоже не оправдал ожиданий инвесторов, но в этом году компания собирается выделить $75...
Первый в мире мотоцикл с горизонтально-оппозитным 8-цилиндровым мотором Great Wall Soul S2000 снова поступает в продажу
Great Wall объявила, что вторая партия мотоциклов Soul S2000 поступит в продажу 7 февраля. Первая партия, представленная 26 октября, включала три модификации стоимостью от 30 500 до 40 300 долларов. Мотоцикл получил габариты 2660 х 950 х 1540 мм с колесной базой 1810 мм. Оснащение включает 12,3-дюймовый сенсорный дисплей, автомобильный чип Snapdragon 8155, поддержку...