OpenAI最新推初小模型GPT-4o Mini:在数学推理和编码方面表现出现

发布于: 雪球转发:0回复:0喜欢:0

多知7月19日消息,OpenAI今日宣布推出了小模型 —— GPT-4o Mini,其价格更实惠且性能更精简。OpenAI 表示,升级后的模型即日起向免费用户和付费 ChatGPT Plus 和 Team 用户推出,并将于下周向企业客户推出。

GPT-4o mini以其低成本和低延迟使广泛的任务成为可能, 能够处理大量上下文信息,支持文本和视觉输入输出需要高效、低成本智能解决方案的企业和技术开发者客户支持聊天机器人、数据提取和分析工具等。

据OpenAI介绍,GPT-4o mini支持API中的文本和视觉,未来将支持文本、图像、视频和音频的输入和输出。该模型具有128K令牌的上下文窗口,每个请求支持最多16K输出tokens,并拥有截至2023年10月的知识。得益于与GPT-4o共享的改进分词器,处理非英语文本现在更加经济实惠。

根据OpenAI的数据,在大规模多任务语言理解(MMLU)基准测试中,GPT- 4o Mini的得分为82%,超过了其他小型模型和GPT-3.5 Turbo。MMLU测试测量了包括数学和法律在内的57门学科的语言模型的能力。这款小模型将取代ChatGPT中的GPT-3.5 Turbo,免费、Plus和团队用户现在可以使用新模型。

其中,数学和编码能力:GPT- 4o Mini在数学推理和编码任务方面表现出色,优于市场上以前的小型号。在测量数学推理的MGSM测试中,GPT- 4o Mini得分为87%,而Gemini Flash得分为75.5%,Claude Haiku得分为71.7%。GPT- 4o Mini在衡量编码性能的HumanEval中得分为87.2%,而Gemini Flash得分为71.5%,Claude Haiku得分为75.9%。

OpenAI表示:“我们设想的未来是,模型可以无缝集成到每个应用程序和每个网站上。GPT- 4o Mini为开发人员更高效、更经济地构建和扩展强大的人工智能应用铺平了道路。”

对于企业而言,较小的模型可能适合自动执行大量基本任务,而较大的模型可能可以处理更复杂的任务。一些企业可能会在一个应用程序中同时使用两者。因此,目前,很多大模型企业也都在推轻量级的小模型。

《教育科技这一年·2022》+《培训行业这一年·2021》+《教育科技行业图谱2022-2023》,重磅发售!套装优惠价169元,闭眼入!迅速点击文末“阅读原文”购买,手慢无!

点击阅读原文购买↓