Video by Eerie

Microsoft представила нейросетевую модель VASA, которая может «оживлять» фотографии в очень реалистичном виде. То есть вы загружаете портретное фото и звуковую дорожку, а получаете видео говорящего лица с точной синхронизацией губ со звуком, естественной мимикой и реалистичными движениями головы. Генерацию можно даже контролировать, задавая эмоцию, расстояние от камеры, направление взгляда и т.д. Сейчас VASA в закрытом тестировании, позже выпустят для всех желающих. Становится всё сложение различать, что реально, а что – нет