- Арест за арестом: причиной возгорания в... (697)
- ИИ спас США от рецессии, став единственным... (837)
- Новая Xbox на бумаге выглядит намного мощнее... (630)
- Китайская компания Topfeel представила две... (1299)
- Вероятно, Snapdragon 8 Elite Gen 5 обходится... (649)
- Марсианские пылевые вихри движутся быстрее,... (456)
- Какая видеокарта нужна для игры в... (757)
- Пожар уничтожил 858 ТБ данных и парализовал... (681)
- Пользователи ChatGPT снова могут удалять... (720)
- Microsoft получила доступ к 100 000 Nvidia... (645)
- AMD представила Solarflare X4 — новые... (835)
- Athena1 от SiPearl — самый защищённый... (780)
- Классификация Урана и Нептуна как «ледяных... (806)
- Ferrari представила платформу Elettrica с... (694)
- Арт-директор Halo покинул студию после 17... (706)
- Dimensity 9500, 7500 мА•ч,... (866)
Китай и правда понесло: представлена нейросеть OmniHuman-1, которая создаёт максимально живые видео по фотографиям
Дата: 2025-02-05 10:07
В ByteDance разработали систему искусственного интеллекта, которая преобразует фотографии в максимально реалистичные видеоролики.
Новая система под названием OmniHuman-1 генерирует видеоролики в полный рост, на которых люди жестикулируют и двигаются в соответствии с речью, превосходя предыдущие модели искусственного интеллекта, которые могли анимировать только лица или верхнюю часть тела.

«В последние годы сквозная человеческая анимация претерпела заметные улучшения, — заявили в ByteDance. — Однако существующие методы по-прежнему с трудом масштабируются в качестве больших общих моделей генерации видео, что ограничивает их потенциал в реальных приложениях».
Команда обучила OmniHuman-1 на более чем 18 700 часах человеческих видеоданных, используя новый подход, который объединяет несколько типов входных данных — текст, аудио и движения тела. Эта стратегия обучения «всеобщих условий» позволяет ИИ обучаться на гораздо более крупных и разнообразных наборах данных, чем предыдущие методы.
«Наша главная идея заключается в том, что включение в процесс обучения множественных кондиционирующих сигналов, таких как текст, аудио и поза, может значительно сократить потери данных», — пояснила исследовательская группа.
В ходе тестирования OmniHuman-1 превзошла существующие системы сразу по нескольким показателям качества. Огромное количество примеров можно найти по этой ссылке.
Ранее китайская технологическая компания Alibaba выпустила новую версию своей модели искусственного интеллекта Qwen 2.5-Max, которая, по словам представителей компании, превзошла высоко оцененную модель DeepSeek-V3. А DeepSeek сообщила о запуске новейшей ИИ-модели Janus-Pro-7B.
Подробнее на iXBT
Предыдущие новости
В России продают Toyota Land Cruiser Prado с холодильником и подогревами
Автомобиль Toyota Land Cruiser Prado, выпущенный 2019 году, выставили на продажу в России. Владелец утверждает, что автомобиль имеет «чистую историю», а реальный пробег составляет 82 тысячи километров. Внедорожник оснащен системой полного привода и автоматической коробкой передач. Дизельный двигатель объемом 2,8 литра развивает мощность до 177 л.с. В описании говорится, что...
«Лаборатория Касперского» впервые нашла в App Store троян — он ищет фотографии паролей и отправляет их куда-то
Эксперты «Лаборатории Касперского» обнаружили в магазинах Apple App Store и Google Play троянец SparkCat, внедрённый в поддельные приложения: службы обмена сообщениями, помощники с искусственным интеллектом, сервисы доставки еды и клиенты криптовалютных бирж. Встроенный в эти приложения вредоносный фреймворк сканирует сохранённые на устройствах фотографии, находит...
Alphabet потратит $75 млрд «на ускорение прогресса» в 2025 году — больше M**a, но меньше Microsoft
Корпорация Alphabet, в состав которой входит компания Google, отчиталась на этой неделе о финансовых итогах четвёртого квартала прошлого года. Совокупная выручка выросла на 12 % до $96,47 млрд, но оказалась ниже прогнозов аналитиков. Рост выручки в облачном сегменте на 30 % до $11,96 млрд тоже не оправдал ожиданий инвесторов, но в этом году компания собирается выделить $75...
Первый в мире мотоцикл с горизонтально-оппозитным 8-цилиндровым мотором Great Wall Soul S2000 снова поступает в продажу
Great Wall объявила, что вторая партия мотоциклов Soul S2000 поступит в продажу 7 февраля. Первая партия, представленная 26 октября, включала три модификации стоимостью от 30 500 до 40 300 долларов. Мотоцикл получил габариты 2660 х 950 х 1540 мм с колесной базой 1810 мм. Оснащение включает 12,3-дюймовый сенсорный дисплей, автомобильный чип Snapdragon 8155, поддержку...