Sora重磅发布,AI产业迈入新阶段!

发布于: 雪球转发:0回复:0喜欢:1

$鼎捷软件(SZ300378)$ $海光信息(SH688041)$ 2月16日,OpenAI发布首个文生视频工具Sora

1)Sora支持生成一分钟的高质量视频。

AI视频生成技术已出现一年多,此前发布的Runway Gen2、Pika等AI视频工具仅支持十秒以内的视频生成,Sora最高支持生成一分钟的1080p视频,且视频更加真实、人物更人性化,表现惊艳。

2)Sora理解事物在物理世界的存在方式。

根据OpenAI介绍,Sora能够生成具有多个角色、特定运动类型以及细节准确的复杂场景视频,Sora不仅理解用户提示词的要求,而且理解事物在物理世界的存在方式。NVIDIA高级研究科学家Jim Fan表示,Sora是由数据驱动的物理引擎,或采用虚幻引擎5进行训练。

3)Sora是采用Transformer架构的扩散模型。

根据OpenAI介绍,Sora是采用Transformer架构的扩散模型,生成过程从类似静态噪声的视频开始,通过多个步骤消除噪声,最终生成清晰的视频。OpenAI表示,扩展视频生成模型是构建物理世界通用模拟器的有前途的途径。

4)Sora将图片和视频转化为补丁,从而可以用更广泛的数据训练。

OpenAI将图片和视频数据转化为统一的表示方式——补丁(patches)来进行训练,补丁类似于大语言模型中的tokens,并且可以高度扩展。通过统一数据的表示方式,Sora可以用更广泛的数据训练,使生成的视频更加真实。

5)Sora目前正进行安全测试,最早或于8月向公众开放。

OpenAI表示目前Sora处于安全测试阶段,仅向有限的创作者开放。根据彭博社报道,GPT-4经过6个月的测试后正式向公众开放,参考GPT-4,预计Sora或将于8月向公众开放。

AI视频工具将打开更为广阔的AI应用市场,算力厂商将持续受益

视频/3D/游戏是AIGC技术最复杂、应用前景最广阔的方向。AI视频生成工具可以大幅减少实景拍摄、降低视频制作成本,Sora的发布或将成为AI视频应用的里程碑事件,有望打开更为广阔的AI应用市场,看好其在短视频、游戏、电影等领域的应用。

此外,考虑到视频数据量相对文本和图片有几何级的提升,AI视频生成对训练和推理的算力需求将大幅提升,OpenAI、Meta等巨头在算力领域持续布局,也侧面反映了未来对于算力的旺盛需求,算力厂商有望持续受益。