- Началась важная неделя для Apple: ожидается... (603)
- 925 л.с., полный привод и сверхбыстрая... (525)
- Snapdragon 8 Elite Gen 5, топовая камера,... (420)
- Oppo Find X9 Pro работает дольше Xiaomi 17... (425)
- AMD FSR 4, улучшения графики и оптимизации:... (509)
- iPhone 18 Pro получит камеру с переменной... (518)
- 3000 циклов, до 1000 км на одном зарядке в... (518)
- Журналисты показали, как волшебное... (473)
- В отечественном мессенджере Max обновились... (623)
- «Инферит» представил российские 2U-серверы... (503)
- Быстро набрал обороты: российский бренд... (586)
- Tank 300 начнут выпускать в России — уже... (536)
- OpenAI растёт быстрее всех — но теперь никто... (502)
- SpaceX показала вживую носовую часть... (537)
- В России представлен обновленный Haval H3:... (449)
- Стирально-сушильная машина с двумя... (491)
Китай и правда понесло: представлена нейросеть OmniHuman-1, которая создаёт максимально живые видео по фотографиям
Дата: 2025-02-05 10:07
В ByteDance разработали систему искусственного интеллекта, которая преобразует фотографии в максимально реалистичные видеоролики.
Новая система под названием OmniHuman-1 генерирует видеоролики в полный рост, на которых люди жестикулируют и двигаются в соответствии с речью, превосходя предыдущие модели искусственного интеллекта, которые могли анимировать только лица или верхнюю часть тела.

«В последние годы сквозная человеческая анимация претерпела заметные улучшения, — заявили в ByteDance. — Однако существующие методы по-прежнему с трудом масштабируются в качестве больших общих моделей генерации видео, что ограничивает их потенциал в реальных приложениях».
Команда обучила OmniHuman-1 на более чем 18 700 часах человеческих видеоданных, используя новый подход, который объединяет несколько типов входных данных — текст, аудио и движения тела. Эта стратегия обучения «всеобщих условий» позволяет ИИ обучаться на гораздо более крупных и разнообразных наборах данных, чем предыдущие методы.
«Наша главная идея заключается в том, что включение в процесс обучения множественных кондиционирующих сигналов, таких как текст, аудио и поза, может значительно сократить потери данных», — пояснила исследовательская группа.
В ходе тестирования OmniHuman-1 превзошла существующие системы сразу по нескольким показателям качества. Огромное количество примеров можно найти по этой ссылке.
Ранее китайская технологическая компания Alibaba выпустила новую версию своей модели искусственного интеллекта Qwen 2.5-Max, которая, по словам представителей компании, превзошла высоко оцененную модель DeepSeek-V3. А DeepSeek сообщила о запуске новейшей ИИ-модели Janus-Pro-7B.
Подробнее на iXBT
Предыдущие новости
В России продают Toyota Land Cruiser Prado с холодильником и подогревами
Автомобиль Toyota Land Cruiser Prado, выпущенный 2019 году, выставили на продажу в России. Владелец утверждает, что автомобиль имеет «чистую историю», а реальный пробег составляет 82 тысячи километров. Внедорожник оснащен системой полного привода и автоматической коробкой передач. Дизельный двигатель объемом 2,8 литра развивает мощность до 177 л.с. В описании говорится, что...
«Лаборатория Касперского» впервые нашла в App Store троян — он ищет фотографии паролей и отправляет их куда-то
Эксперты «Лаборатории Касперского» обнаружили в магазинах Apple App Store и Google Play троянец SparkCat, внедрённый в поддельные приложения: службы обмена сообщениями, помощники с искусственным интеллектом, сервисы доставки еды и клиенты криптовалютных бирж. Встроенный в эти приложения вредоносный фреймворк сканирует сохранённые на устройствах фотографии, находит...
Alphabet потратит $75 млрд «на ускорение прогресса» в 2025 году — больше M**a, но меньше Microsoft
Корпорация Alphabet, в состав которой входит компания Google, отчиталась на этой неделе о финансовых итогах четвёртого квартала прошлого года. Совокупная выручка выросла на 12 % до $96,47 млрд, но оказалась ниже прогнозов аналитиков. Рост выручки в облачном сегменте на 30 % до $11,96 млрд тоже не оправдал ожиданий инвесторов, но в этом году компания собирается выделить $75...
Первый в мире мотоцикл с горизонтально-оппозитным 8-цилиндровым мотором Great Wall Soul S2000 снова поступает в продажу
Great Wall объявила, что вторая партия мотоциклов Soul S2000 поступит в продажу 7 февраля. Первая партия, представленная 26 октября, включала три модификации стоимостью от 30 500 до 40 300 долларов. Мотоцикл получил габариты 2660 х 950 х 1540 мм с колесной базой 1810 мм. Оснащение включает 12,3-дюймовый сенсорный дисплей, автомобильный чип Snapdragon 8155, поддержку...