- Бум ИИ спасает мировую экономику от... (827)
- Представитель МВФ признал, что бум ИИ... (804)
- GAC не планирует уходить с российского... (695)
- В России бум новых авто: за месяц на рынок... (863)
- В России всплеск новых авто: за месяц на... (971)
- Эффектную отстыковку «Союза МС-27» от МКС... (718)
- В США арестовали организаторов контрабанды... (630)
- В США задержаны двое подозреваемых в... (704)
- Nvidia вернётся в Китай: Трамп разрешил... (792)
- Трамп согласился разрешить Nvidia поставлять... (617)
- «Планов нет»: Google резко опровергла слухи... (692)
- Google ответила на утверждения СМИ о том,... (630)
- Google ответила на утверждения СМИ о том,... (845)
- Honor готовит к выпуску «робот-смартфон» с... (870)
- Прототип нового BMW X7 2027 замечен по... (815)
- Дешевый седан Nissan Versa 2027 раскрыт... (1029)
Китай и правда понесло: представлена нейросеть OmniHuman-1, которая создаёт максимально живые видео по фотографиям
Дата: 2025-02-05 10:07
В ByteDance разработали систему искусственного интеллекта, которая преобразует фотографии в максимально реалистичные видеоролики.
Новая система под названием OmniHuman-1 генерирует видеоролики в полный рост, на которых люди жестикулируют и двигаются в соответствии с речью, превосходя предыдущие модели искусственного интеллекта, которые могли анимировать только лица или верхнюю часть тела.
Кадр из видео «В последние годы сквозная человеческая анимация претерпела заметные улучшения, — заявили в ByteDance. — Однако существующие методы по-прежнему с трудом масштабируются в качестве больших общих моделей генерации видео, что ограничивает их потенциал в реальных приложениях».
Команда обучила OmniHuman-1 на более чем 18 700 часах человеческих видеоданных, используя новый подход, который объединяет несколько типов входных данных — текст, аудио и движения тела. Эта стратегия обучения «всеобщих условий» позволяет ИИ обучаться на гораздо более крупных и разнообразных наборах данных, чем предыдущие методы.
«Наша главная идея заключается в том, что включение в процесс обучения множественных кондиционирующих сигналов, таких как текст, аудио и поза, может значительно сократить потери данных», — пояснила исследовательская группа.
В ходе тестирования OmniHuman-1 превзошла существующие системы сразу по нескольким показателям качества. Огромное количество примеров можно найти по этой ссылке.
Ранее китайская технологическая компания Alibaba выпустила новую версию своей модели искусственного интеллекта Qwen 2.5-Max, которая, по словам представителей компании, превзошла высоко оцененную модель DeepSeek-V3. А DeepSeek сообщила о запуске новейшей ИИ-модели Janus-Pro-7B.
Подробнее на iXBT
Предыдущие новости
В России продают Toyota Land Cruiser Prado с холодильником и подогревами
Автомобиль Toyota Land Cruiser Prado, выпущенный 2019 году, выставили на продажу в России. Владелец утверждает, что автомобиль имеет «чистую историю», а реальный пробег составляет 82 тысячи километров. Внедорожник оснащен системой полного привода и автоматической коробкой передач. Дизельный двигатель объемом 2,8 литра развивает мощность до 177 л.с. В описании говорится, что...
«Лаборатория Касперского» впервые нашла в App Store троян — он ищет фотографии паролей и отправляет их куда-то
Эксперты «Лаборатории Касперского» обнаружили в магазинах Apple App Store и Google Play троянец SparkCat, внедрённый в поддельные приложения: службы обмена сообщениями, помощники с искусственным интеллектом, сервисы доставки еды и клиенты криптовалютных бирж. Встроенный в эти приложения вредоносный фреймворк сканирует сохранённые на устройствах фотографии, находит...
Alphabet потратит $75 млрд «на ускорение прогресса» в 2025 году — больше M**a, но меньше Microsoft
Корпорация Alphabet, в состав которой входит компания Google, отчиталась на этой неделе о финансовых итогах четвёртого квартала прошлого года. Совокупная выручка выросла на 12 % до $96,47 млрд, но оказалась ниже прогнозов аналитиков. Рост выручки в облачном сегменте на 30 % до $11,96 млрд тоже не оправдал ожиданий инвесторов, но в этом году компания собирается выделить $75...
Первый в мире мотоцикл с горизонтально-оппозитным 8-цилиндровым мотором Great Wall Soul S2000 снова поступает в продажу
Great Wall объявила, что вторая партия мотоциклов Soul S2000 поступит в продажу 7 февраля. Первая партия, представленная 26 октября, включала три модификации стоимостью от 30 500 до 40 300 долларов. Мотоцикл получил габариты 2660 х 950 х 1540 мм с колесной базой 1810 мм. Оснащение включает 12,3-дюймовый сенсорный дисплей, автомобильный чип Snapdragon 8155, поддержку...