Майкрософт показал алгоритм для оживления фото. Из одного кадра делает видео и его не отличить от реальности

19 Апрель

Инженеры Microsoft анонсировали выход нейросети нового поколения. VASA-1 способна заставить статичную фотографию стать видео — изображение сможет петь, говорить и двигаться.

Генеративный ИИ работает на основе снимка и аудиозаписи голоса реципиента. Алгоритмы трансформируют статику в реалистичные видеоролики. Более того, VASA-1 способна работать с портретами в любом художественном стиле.

В одном из демо-видео создатели показали, как Мона Лиза читает рэп:

VASA-1 воссоздает выражение лица в полной динамике. Сгенерированные видео получаются очень правдоподобно, эмоциональное состояние персонажа автор промта может задать заранее.

Пока нейросеть создает видео с относительно невысоким разрешением, 512х512 пикселей и частотой 45 кадров в секунду. Позднее эти ограничения будут сняты:

В открытый доступ нейросеть еще не выкладывали. В Microsoft беспокоятся, что при помощи VASA-1 пользователи станут делать неэтичные видео.

Новости СМИ2

Майкрософт показал алгоритм для оживления фото. Из одного кадра делает видео и его не отличить от реальности

Ученые показали, за сколько лет пропадут следы цивилизации, если человечество исчезнет

Книги обязательные к прочтению

10 недорогих часов, за которые не будет стыдно

Шнурки больше не завязываем и не заправляем в обувь: шнуровка навсегда за пять минут

Находка археологов в тайге. На берегу реки нашли древний корабль скрепленный кованными гвоздями