发布于: 雪球转发:0回复:0喜欢:1

“上周,OpenAI 发布了GPT-4o mini,这是其旗舰大型语言模型 GPT-4o 的更小、更具成本效益的版本。在针对 Python 编码的 HumanEval 基准测试中,GPT-4o mini 得分为 87.2%,而 Anthropic 的 Claude 3 Opus 得分为84.9% ,谷歌的 Gemini 1.5 Pro 得分为82.6% 。GPT -4o 的较大版本得分为90.2 % 。

GPT-4o mini 的性能比竞争对手更便宜。基于大约每个输出令牌产生三个输入令牌,GPT-4o mini每推理一百万个令牌的成本仅为 0.26 美元,比一些旗舰型号便宜得多,其中一些旗舰型号的性能较差。例如,GPT-4o 和 Gemini 1.5 Pro 的成本分别为 7.50 美元和5.25 美元,而Gemini 1.5 Flash 等小型型号和 GPT-3.5 Turbo 等较旧型号的成本分别为每百万个令牌 0.53 美元和 0.75 美元。OpenAI 计划用 GPT-4o mini 取代 GPT-3.5 Turbo,作为基础型号,为免费版 ChatGPT 提供支持。

随着开发人员将 AI 大规模地融入到更多产品中,最大化性能可能会让位于效率和成本节约。GPT-4o mini 表明,OpenAI 不仅在高端产品中提供了一流的性能,而且还提供了成本低到足以证明大规模部署合理的模型。成本节约的影响可能是深远的,因为“足够好”的模型成本约为旗舰模型的 5%,可以鼓励在工作流程和组织中部署代理 AI。”——ARK研究员。

$苹果(AAPL)$