回复@花匠秀: 今天被一字的连累了//@花匠秀:回复@花匠秀:EMO不是Sora，也不需要比较，两者的目标也完全不同。S...

发布于:2024-03-01 15:28

雪球

转发：0

回复：0

喜欢：0

回复@花匠秀: 今天被一字的连累了//@花匠秀:回复@花匠秀:EMO不是Sora，也不需要比较，两者的目标也完全不同。Sora是文字构建场景，是立体的应用，很宏大的构想，但里距离能用十万八千里，应该很多人体验过GPT3.5吧，Sora目前可能还不到GPT2的水平。EMO是非常具体的点级别的应用，核心是用音频驱动视频，他的优点是已经达到生产力级别，在音乐、互动游戏为主的短视频层面能够形成颠覆。
（至于有人说的对口型，以为是老技术，那就完全没理解EMO模型的精髓，只要认真看了链接里的全部示例，就能明白两者是完全不一样方向和效果。）

引用：

2024-02-29 08:59

阿里EMO是用音频驱动照片生成视频，给定一个人物肖像和一段语音，即可生成给定人物肖像输出给定语音的视频。与以往的对口型不同，包括了人物的神态和头部动作，十分逼真。
具体演示效果可见网页链接
可以让赫本讲故事，可以让蒙娜丽莎读课文，可...

作者：用户1686584998

引用：