(至于有人说的对口型,以为是老技术,那就完全没理解EMO模型的精髓,只要认真看了链接里的全部示例,就能明白两者是完全不一样方向和效果。)
阿里EMO是用音频驱动照片生成视频,给定一个人物肖像和一段语音,即可生成给定人物肖像输出给定语音的视频。与以往的对口型不同,包括了人物的神态和头部动作,十分逼真。具体演示效果可见网页链接可以让赫本讲故事,可以让蒙娜丽莎读课文,可...