- Павел Дуров заявил, что его арест год назад... (27)
- Космическая «маршрутка»: корабль SpaceX... (25)
- Опубликованы официальные изображения Skoda... (27)
- В «Авито» заработала беспроцентная рассрочка... (28)
- ASRock выпустила X870 LiveMixer WiFi —... (32)
- Это не отзыв: АвтоВАЗ проводит кампанию по... (28)
- «Прогресс» на Байконуре готовится к старту:... (58)
- Дизайн Sony Xperia 10 VII слили на до... (50)
- Российские компании стали больше тратить на... (47)
- Xiaomi 16 Pro получит очень яркий и... (57)
- «Речь не о погоне за деньгами»: глава CI... (57)
- «Всё равно за ужин платишь ты»: глава Nvidia... (64)
- Смартфоны Oukitel WP300, WP53 Pro и WP55 Pro... (53)
- Власти японского города собрались запретить... (64)
- Три рекорда за три дня: благодаря Silksong... (104)
- ФСБ и МВД накрыли крупнейший в Рунете сервис... (75)
Первая в России нейросеть для генерации полноценного видео: Сбер представил Kandinsky Video
Дата: 2023-11-22 13:06
Команда Сбербанка представила свою новую разработку в области нейросетей. Как отмечает пресс-служба, Kandinsky Video стала первой в России генеративной моделью для создания полноценных видеороликов по текстовому описанию.

Модель генерирует видеоряд продолжительностью до восьми секунд с частотой 30 кадров в секунду. Об этом в ходе международной конференции AI Journey рассказал первый заместитель председателя правления Сбербанка Александр Ведяхин.
Архитектура Kandinsky Video состоит из двух блоков: первый отвечает за создание ключевых кадров, из которых складывается структура сюжета видео, а второй — за генерацию интерполяционных кадров, которые позволяют достичь плавности движений в финальном видео. В основе двух блоков лежит новая модель синтеза изображений по текстовым описаниям Kandinsky 3.0.

Формат сгенерированного видео представляет собой непрерывную сцену с движением как объекта, так и фона. Именно это отличает видеоролики, синтезированные моделью Kandinsky Video, от анимационных видеороликов, в которых динамика достигается за счёт моделирования пролёта камеры относительно статичной сцены.
Нейросеть создаёт видеоролики с разрешением 512 х 512 пикселей и различным соотношением сторон. Модель обучена на наборе данных из более чем 300 тыс. пар «текст — видео». Генерация видео занимает до трёх минут.
Александр Ведяхин рассказал:
Недавно мы обучили Kandinsky создавать анимационные видео по текстовому описанию, а уже сегодня представляем модель совершенно другого уровня — первую в России модель по генерации полноценных видеороликов по тексту. Это важный вклад в развитие российских генеративных нейросетей. У пользователей появится ещё больше возможностей для креатива и реализации своих творческих задумок любой направленности. Люди смогут создавать уникальные видеоролики абсолютно бесплатно. Наша модель, как и большинство других в линейке Сбера, будет доступна в open source. Мы верим, что искусственный интеллект сможет открыть перед людьми новые супервозможности и создать инструменты, которыми они будут пользоваться для решения своих задач.
Оценить возможности нейросети Kandinsky Video можно на платформе fusionbrain.ai и в Telegram-боте, где можно оставить заявку на доступ.
Подробнее на iXBT
Предыдущие новости
«Москвич» стабильно входит в топ самых продаваемых брендов в России, но в количественном выражении результат не позволяет метить в лидеры
Опубликованы данные по продажам автомобилей на российском рынке с 13 по 19 ноября, которые предоставили эксперты агентства «Автостат» со ссылкой на данные АО «ППК». Первое место удерживает бренд Lada, продажи которого составили 6693 машины. Это позволило АвтоВАЗу занять почти треть российского рынка новых машин (29,7%). Следом идут китайские бренды Haval (2305 шт.), Chery...
Вместо тысячи слов и вопросов: размещать видеоролики к объявлениям в «Авито» теперь могут все
Команда популярного сервиса частных объявлений «Авито» сообщила о запуске для всех пользователей возможности добавления коротких видеороликов к объявлениям. Ранее сервис тестировался на ограниченном числе пользователей и для некоторых категорий товаров. В пресс-службе рассказали: На Авито размещено более 170 миллионов активных объявлений, а ежедневная аудитория превышает 19...
Цена успеха: работники техасского завода Tesla рассказали о массовом травматизме
Гигантский завод Tesla в Остине имеет решающее значение для планов Илона Маска (Elon Musk) продавать 20 млн автомобилей в год. Однако, по словам нынешних и бывших работников, на заводе регулярно происходят опасные инциденты. В 2022 году травмы на техасском заводе Tesla получал каждый 21-й рабочий, гласят официальные данные, которые автопроизводитель предоставил в...
Тим Кук признался, что готовит себе преемника на пост главы Apple, но на пенсию пока не собирается
Генеральный директор Apple Тим Кук (Tim Cook) дал 45-минутное интервью британской певице Дуа Липе (Dua Lipa) в эфире подкаста BBC. Разговор был сосредоточен на биографических фактах и рассуждениях о тенденциях развития технологической отрасли, но попутно глава компании признался, что серьёзно подходит к процессу подготовки преемника, и хотел бы в этой роли видеть выходца...