- SpaceX и Tesla вложат $55 млрд в... (2108)
- Прототип тихого сверхзвукового лайнера NASA... (2246)
- Как тебе такое, Илон Маск? Китайская BYD... (2025)
- Активисты ополчились на IPO компании SpaceX... (2478)
- Google Chrome для Android научился не... (5129)
- В Китае создали первый в мире беспилотный... (2051)
- Невероятный мод Zagreus’ Journey для Hades 2... (2723)
- Видео: серийная версия робота Atlas... (1972)
- Власти США намерены вмешаться в цепочки... (2165)
- LG Display показала Tandem OLED с удвоенным... (3556)
- Издатели: Цукерберг лично одобрил массовое... (2662)
- Частные инвесторы нашли способ вложиться в... (2094)
- Студия разработчиков MindsEye уволила 90 %... (2353)
- Акции Intel достигли исторического... (1991)
- Учёные предсказали скорое появление... (1654)
- Xiaomi представила беспроводную игровую мышь... (1700)
Китай и правда понесло: представлена нейросеть OmniHuman-1, которая создаёт максимально живые видео по фотографиям
Дата: 2025-02-05 10:07
В ByteDance разработали систему искусственного интеллекта, которая преобразует фотографии в максимально реалистичные видеоролики.
Новая система под названием OmniHuman-1 генерирует видеоролики в полный рост, на которых люди жестикулируют и двигаются в соответствии с речью, превосходя предыдущие модели искусственного интеллекта, которые могли анимировать только лица или верхнюю часть тела.
Кадр из видео «В последние годы сквозная человеческая анимация претерпела заметные улучшения, — заявили в ByteDance. — Однако существующие методы по-прежнему с трудом масштабируются в качестве больших общих моделей генерации видео, что ограничивает их потенциал в реальных приложениях».
Команда обучила OmniHuman-1 на более чем 18 700 часах человеческих видеоданных, используя новый подход, который объединяет несколько типов входных данных — текст, аудио и движения тела. Эта стратегия обучения «всеобщих условий» позволяет ИИ обучаться на гораздо более крупных и разнообразных наборах данных, чем предыдущие методы.
«Наша главная идея заключается в том, что включение в процесс обучения множественных кондиционирующих сигналов, таких как текст, аудио и поза, может значительно сократить потери данных», — пояснила исследовательская группа.
В ходе тестирования OmniHuman-1 превзошла существующие системы сразу по нескольким показателям качества. Огромное количество примеров можно найти по этой ссылке.
Ранее китайская технологическая компания Alibaba выпустила новую версию своей модели искусственного интеллекта Qwen 2.5-Max, которая, по словам представителей компании, превзошла высоко оцененную модель DeepSeek-V3. А DeepSeek сообщила о запуске новейшей ИИ-модели Janus-Pro-7B.
Подробнее на iXBT
Предыдущие новости
В России продают Toyota Land Cruiser Prado с холодильником и подогревами
Автомобиль Toyota Land Cruiser Prado, выпущенный 2019 году, выставили на продажу в России. Владелец утверждает, что автомобиль имеет «чистую историю», а реальный пробег составляет 82 тысячи километров. Внедорожник оснащен системой полного привода и автоматической коробкой передач. Дизельный двигатель объемом 2,8 литра развивает мощность до 177 л.с. В описании говорится, что...
«Лаборатория Касперского» впервые нашла в App Store троян — он ищет фотографии паролей и отправляет их куда-то
Эксперты «Лаборатории Касперского» обнаружили в магазинах Apple App Store и Google Play троянец SparkCat, внедрённый в поддельные приложения: службы обмена сообщениями, помощники с искусственным интеллектом, сервисы доставки еды и клиенты криптовалютных бирж. Встроенный в эти приложения вредоносный фреймворк сканирует сохранённые на устройствах фотографии, находит...
Alphabet потратит $75 млрд «на ускорение прогресса» в 2025 году — больше M**a, но меньше Microsoft
Корпорация Alphabet, в состав которой входит компания Google, отчиталась на этой неделе о финансовых итогах четвёртого квартала прошлого года. Совокупная выручка выросла на 12 % до $96,47 млрд, но оказалась ниже прогнозов аналитиков. Рост выручки в облачном сегменте на 30 % до $11,96 млрд тоже не оправдал ожиданий инвесторов, но в этом году компания собирается выделить $75...
Первый в мире мотоцикл с горизонтально-оппозитным 8-цилиндровым мотором Great Wall Soul S2000 снова поступает в продажу
Great Wall объявила, что вторая партия мотоциклов Soul S2000 поступит в продажу 7 февраля. Первая партия, представленная 26 октября, включала три модификации стоимостью от 30 500 до 40 300 долларов. Мотоцикл получил габариты 2660 х 950 х 1540 мм с колесной базой 1810 мм. Оснащение включает 12,3-дюймовый сенсорный дисплей, автомобильный чип Snapdragon 8155, поддержку...