Sora:视频创作新纪元,投资者的新机遇?

发布于: 雪球转发:0回复:0喜欢:0

OpenAI 发布的首款文生视频模型 Sora 最近在美国爆火,官方演示视频发布后,短短几天就获得了数百万的播放量。这个模型通过对视频使用 DALL·E 3 的重述提示词技术,以提高文本保真度及视频整体质量,并利用 GPT 将简短提示转换为较长的详细描述,使其自身拥有较准确的语义理解能力。同时,该模型拥有模拟物理世界中人物、动物及环境等复杂场景演绎的能力,能在同一视频中设计出多个镜头,并保持角色和视觉风格的一致性。简单来说,这是一款可以直接通过人工智能由文字或者语言直接生成视频的模型,且官方并没有把它叫做视频模型,而是称为世界模拟器,也就是说,从这一刻开始拟合更多真实物理定律的数字孪生世界将走进人类社会。

Sora 主要有三个优点:第一、超长视频,可以生成长达 60 秒的连贯视频,突破了以往文本生成视频模型只能生成 4 秒连贯视频的限制。第二、多视角切换,可以在一个视频中包含多个镜头角度,包括多角度镜头和一镜到底,展现场景中的光影关系、物体之间的物理遮挡和碰撞关系,镜头转换流畅。第三、多模态输入处理,可以接受文字、图片、视频的输入提示,能够根据图像创建视频或补充现有视频,还能沿时间线向前或向后扩展视频。

若 Sora 成为视频创作领域的超级应用,将带来巨大的网络设备升级需求。同时随着谷歌最新多模态大模型 Gemini 1.5 以及英伟达本地聊天机器人 Chat with RTX 在近期陆续发布,我们认为 AI 发展趋势已经愈发明确,其中带来的投资机会也愈发清晰。

算力或成为 AI 时代最确定的赛道。产业专家也表示训练类似当前 Sora 的文生视频模型,最起码需要 8 千-1 万片以上 H100,是文本 GPT 的 10 倍以上,如考虑后续模型升级和推理,算力需求将会更大。人工智能的发展将对算力提出更高要求,算力网络基础设施需求有望持续提升。根据中国信通院数据,2022 年全球计算设备算力总规模达到 906EFlops(每秒浮点运算次数),同比增长 47%,预计 2030 年全球算力规模将达到 56ZFlps,平均年均增长 65%。 2022 年我国算力规模稳步扩张,智能算力保持强劲增长,近 6 年累计出货超过 2091 万台通用服务器,82 万台 AI 服务器,计算设备算力总规模到 302EFlops,其中智能算力规模持续高速增长,增速达 72%,在我国算力占比超过 59%。

算力产业链涉及环节较多,行业需求有望全面提升。AI 算力产业链涉及环节较多,按照算力基础设施构成来看,包括 AI 芯片及服务器、交换机及光模块、IDC 机房及上游产业链等。其中,随着训练和推理需求提升,AI 芯片及服务器需求将率先放量;AI 算力对数据中心内部数据流量较大,光模块速率及数量均有显著提升,交换机的端口数及端口速率也有相应的增长;IDC 也有望进入需求释放阶段。相关机构预测,未来五年,硬件将成为中国人工智能最大的细分市场,占人工智能总投资的 50%以上。2026 年,中国在人工智能硬件市场的 IT 投资将超过 150 亿美元,接近美国人工智能硬件的市场规模,五年复合年增长率 16.5%。服务器作为硬件市场的主要组成部分,预计将占总投入的 80%以上。

多模态模型迭代节奏加快,推动内容创作领域发展,数字经济大时代或即将到来。伴随行业内公司多模态模型推出节奏加快,以 Sora 为代表的多模态模型输入输出能力迭代有望持续降低内容创作门槛,解放内容生产力,打造新型内容产品,推动内容创作领域发展,并扩大影响范围,延伸至教育、营销、游戏、娱乐等领域,推动多行业发展。

本次 Sora 的发布意味着 AI 在视频技术领域取得突破性进展。随着 AI 在多模态领域陆续实现飞跃式发展,相关领域及产业在带动下也将迎来深度变革。作为普通人的我们,面对变革浪潮的到来或可以选择积极拥抱变化,通过选择合适的投资标的,分享变革浪潮带来的时代红利。

##英伟达突发跳水!市值蒸发5600亿#