“上周，OpenAI 发布了GPT-4o mini，这是其旗舰大型语言模型 GPT-4o 的更小、更具成本效益的版本。在...

发布于:2024-07-23 13:03

雪球

转发：0

回复：0

喜欢：1

“上周，OpenAI 发布了GPT-4o mini，这是其旗舰大型语言模型 GPT-4o 的更小、更具成本效益的版本。在针对 Python 编码的 HumanEval 基准测试中，GPT-4o mini 得分为 87.2%，而 Anthropic 的 Claude 3 Opus 得分为84.9% ，谷歌的 Gemini 1.5 Pro 得分为82.6% 。GPT -4o 的较大版本得分为90.2 % 。

GPT-4o mini 的性能比竞争对手更便宜。基于大约每个输出令牌产生三个输入令牌，GPT-4o mini每推理一百万个令牌的成本仅为 0.26 美元，比一些旗舰型号便宜得多，其中一些旗舰型号的性能较差。例如，GPT-4o 和 Gemini 1.5 Pro 的成本分别为 7.50 美元和5.25 美元，而Gemini 1.5 Flash 等小型型号和 GPT-3.5 Turbo 等较旧型号的成本分别为每百万个令牌 0.53 美元和 0.75 美元。OpenAI 计划用 GPT-4o mini 取代 GPT-3.5 Turbo，作为基础型号，为免费版 ChatGPT 提供支持。

随着开发人员将 AI 大规模地融入到更多产品中，最大化性能可能会让位于效率和成本节约。GPT-4o mini 表明，OpenAI 不仅在高端产品中提供了一流的性能，而且还提供了成本低到足以证明大规模部署合理的模型。成本节约的影响可能是深远的，因为“足够好”的模型成本约为旗舰模型的 5%，可以鼓励在工作流程和组织中部署代理 AI。”——ARK研究员。

$苹果(AAPL)$

作者：种一棵树的时间