OpenAI发布GPT-4o和语音版ChatGPT助手,人机交互的全新AI时代

发布于: 雪球转发:0回复:0喜欢:0

$科创芯片ETF基金(SH588290)$ $科创信息ETF(SH588260)$

#1⃣️5月14日,OpenAI在官网正式发布新旗舰模型GPT-4o,其中o代表的是omni,即“全能”。GPT-4o在多模态、数学推理等各方面比GPT-4更强,速度更快,开发者接口的价格则只有一半。

GPT-4o主要特点:

①多模态输入输出:GPT-4o能够接受文本、音频和视频的任意组合作为输入,并生成文本、音频和图像的任意组合作为输出。

②响应速度:GPT-4o对音频输入的响应时间可以快到232毫秒,平均为320毫秒,这与人类在对话中的响应时间相近,提供了更即时的互动体验。此前GPT-4的语音响应约5.4秒。

③性能和成本优势:在处理英语文本和代码方面,GPT-4o的性能与GPT-4 Turbo相当,但在处理非英语文本时有显著改进。同时,使用API的成本降低50%。

④视频和音频理解:与现有模型相比,GPT-4o在视觉和音频理解方面有更好的表现。

2⃣️#OpenAI通过GPT-4o打造的语音版ChatGPT助手 语音版ChatGPT助手可以与用户跨音频、视频进行交流,例如,让GPT-4o进行实时翻译、唱歌、做数学题等。

GPT-4o的文本和图像功能已经在ChatGPT中开放使用,免费注册用户也可以体验该功能。开发人员通过API可以访问GPT-4o 的文本和视觉功能。

未来几周内,OpenAI会在ChatGPT Plus中推出新版语音模式GPT-4o的alpha版。

3⃣️GPT-4o意味着:大模型多模态能力再次迎来跨越,视屏对话理解、实时响应更适用于移动端用户场景,未来,AI助手将发挥出更强大的能力,深刻影响教育、翻译、移动终端等行业。

风险提示:AI应用落地不及预期,市场竞争加剧,相关公司业绩不及预期等

资料来源:国海证券

#游戏驿站狂飙!头号牛散重回社媒# $上证指数(SH000001)$

@今日话题 @雪球基金 @明大教主 @华安基金-许大卫 @ETF热榜追基