【光大海外】GPT-4o后续影响:推理端降本+多模态+低延迟带来AI应用转折点

发布于: 雪球转发:0回复:0喜欢:0

【特别提示】本订阅号中所涉及的证券研究信息,均取自于光大证券已正式外发研究报告,由光大证券海外研究团队(TMT/消费/医药/制造等)编写,仅面向光大证券专业投资者客户,用作新媒体形势下研究动态的宣传。研究报告有时效性,任何研究报告内容仅代表报告外发时特定时点的研究信息汇总,任何关于研究报告、研究观点的解读,请联系对口销售或具体研究员。非光大证券专业投资者客户,请勿订阅、接收或使用本订阅号中的任何信息。本订阅号难以设置访问权限,若给您造成不便,敬请谅解。光大证券研究所不会因关注、收到或阅读本订阅号推送内容而视相关人员为光大证券的客户。

报告发布信息

报告标题:《GPT-4o后续影响:推理端降本+多模态+低延迟带来AI应用转折点——OpenAI春季产品发布会点评》

报告发布日期:2024年5月14日

分析师:付天姿 CFA,FRM(执业证书编号:S0930517040002)

联系人:宾特丽亚

相关研报

【光大海外】M4芯片空降史上最强iPad,AI性能核心升级

【光大海外】微软Copilot面向更多用户开放,提质增效与商业模式持续性得到验证

【光大海外&互联网】谷歌正式发布Gemini,应用端和硬件端积极布局

【光大海外】探讨GPTs背后的产业逻辑:拉开AIGC应用生态的帷幕

【光大海外】美股AIGC应用端全产业链布局,商业化箭在弦上

微软“AI+操作系统”初见雏形,生态壁垒是AIGC核心竞争力

【光大海外】23Q3美股互联网巨头财报:顺周期业务回暖,AI商业化路径清晰

【光大海外&互联网】23Q2美股互联网巨头业绩点评

要点

事件:美国东部时间5月13日,OpenAI举办了2024年春季产品发布会,发布新的支持语音对话的多模态模型GPT-4o。GPT-4o 将会逐步在Chat Completions API、Assistants API、Batch API和ChatGPT服务中可用。

GPT-4o性能提升,API调用成本显著下降。1)多语种、多模态性能提升:GPT-4o在文本理解和代码生成能力上与GPT-4 Turbo相当,但在多语种支持、音频和视频理解能力上有了明显的增强。2)API调用价格下降一半:相比GPT-4 Turbo,GPT-4o每百万tokens输入价格从10美元下调至5美元,输出价格从30美元下调至15美元。3)多语种tokens消耗降低GPT-4o在20种语言中使用了更高效的token生成器,中文tokens消耗降低30%。4)推理速度大幅提升:GPT-4o推理速度是GPT-4 Turbo的两倍,同时API速率限制提高至每分钟一千万tokens,为GPT-4 Turbo的五倍。

当前GPT-4o API调用存在一定的限制。1无法基于GPT-4o训练定制化模型。2)上下文长度与GPT-4 Turbo一致,为128,000个tokens。3)训练数据截至23M10,相比GPT-4 Turbo的23M12数据时效性略有不足。4)仅支持无语音的每秒2-4帧视频输入,暂不支持语音输入,不支持图像生成功能。

GPT-4o多模态模型显著降低延迟。根据OpenAI官方博客,GPT-4o可以在最快232毫秒、平均320毫秒内响应音频输入,与人类对话的反应速度基本一致,相比GPT-4 Turbo的平均5.4秒响应时间提升明显。传统语音模型需要整合语音转录、文本处理、文本转语音三个模型,存在高延迟和信息丢失的问题。GPT-4o将文本、音频和视频整合成统一的多模态模型,以GPT-4级别的高性能进行实时对话。同时,GPT-4o的语音理解能力大幅提高,可以直接观察音调、多个扬声器或背景噪音,也可以输出笑声、歌声或表达情感。

GPT-4o展现出的低成本、低延迟特性将对整个行业产生连锁效应1)推理端降本有望大幅提振应用端需求。当前GPT-4o已面向付费版用户和企业版用户开放,未来将免费向所有用户开放,验证推理端成本持续下降。AI应用的性价比提升将开辟更多商业化路径,推理成本降低有望带动应用端的飞轮效应。2)AI商业化竞争由模型端扩散至基础设施架构。GPT-4o低延迟背后受到模型性能、基础设施架构、网络延迟、数据处理方式等多种因素的影响。

投资建议:高性能模型免费开放,推理端降本速度超预期,使更多AI应用在商业上可行,建议关注:1)微软GPT-4o的低延迟将直接提升Copilot等AI生产力工具的使用体验,有望加速AI应用的货币化。2苹果智能手机是GPT-4o语音助手的最佳载体。苹果与OpenAI达成合作,或将在IOS18中引入ChatGPT,未来结合M4 AI芯片有望推出性能强大的本地语音助手。

具备多模态能力和情感处理能力的AI语音助手有望融入AR/VR、教育、情感陪伴等场景,建议关注:1)AI+VR/AR:可穿戴设备引入多模态模型与环境发生交互,促进AR应用的创新,关注苹果Meta2)AI+教育:AI的交互式特点在口语训练、模拟辩论等垂类场景具备独特优势,关注多邻国

风险提示:AI技术研发和产品迭代不及预期;AI行业竞争加剧风险;商业化进展不及预期风险;国内外政策风险。

免责声明

本订阅号是光大证券股份有限公司研究所(以下简称“光大证券研究所”)海外研究团队依法设立、独立运营的官方唯一订阅号。其他任何以光大证券研究所XX研究团队名义注册的、或含有“光大证券研究”、与光大证券研究所品牌名称等相关信息的订阅号均不是光大证券研究所海外研究团队的官方订阅号。

本订阅号所刊载的信息均基于光大证券研究所已正式发布的研究报告,仅供在新媒体形势下研究信息、研究观点的及时沟通交流,其中的资料、意见、预测等,均反映相关研究报告初次发布当日光大证券研究所的判断,可能需随时进行调整,本订阅号不承担更新推送信息或另行通知的义务。如需了解详细的证券研究信息,请具体参见光大证券研究所发布的完整报告。

在任何情况下,本订阅号所载内容不构成任何投资建议,任何投资者不应将本订阅号所载内容作为投资决策依据,本公司也不对任何人因使用本订阅号所载任何内容所引致的任何损失负任何责任。

本订阅号所载内容版权仅归光大证券股份有限公司所有。任何机构和个人未经书面许可不得以任何形式翻版、复制、转载、刊登、发表、篡改或者引用。如因侵权行为给光大证券造成任何直接或间接的损失,光大证券保留追究一切法律责任的权利。