发布于: 雪球转发:0回复:0喜欢:0
回复@花匠秀: 今天被一字的连累了//@花匠秀:回复@花匠秀:EMO不是Sora,也不需要比较,两者的目标也完全不同。Sora是文字构建场景,是立体的应用,很宏大的构想,但里距离能用十万八千里,应该很多人体验过GPT3.5吧,Sora目前可能还不到GPT2的水平。EMO是非常具体的点级别的应用,核心是用音频驱动视频,他的优点是已经达到生产力级别,在音乐、互动游戏为主的短视频层面能够形成颠覆。
(至于有人说的对口型,以为是老技术,那就完全没理解EMO模型的精髓,只要认真看了链接里的全部示例,就能明白两者是完全不一样方向和效果。)
引用:
2024-02-29 08:59
阿里EMO是用音频驱动照片生成视频,给定一个人物肖像和一段语音,即可生成给定人物肖像输出给定语音的视频。与以往的对口型不同,包括了人物的神态和头部动作,十分逼真。
具体演示效果可见网页链接
可以让赫本讲故事,可以让蒙娜丽莎读课文,可...