//@您说的-对-:回复@hadro:逻辑严密才是首位的吧 有主脉络然后用计算机能理解的语言描述
$昆仑万维(SZ300418)$ 凑个热闹也来说下sora。Sora是一个扩散模型;输入一个噪声patch,它被训练来预测原始的“干净”patch。在这项工作中,OpenAI发现扩散Transformer可以作为视频模型有效扩展。文生图用的就是扩散模型。也就意味着文生视频是在文生图的基础上研发的。那么意味着谁家的文生...