发布于: iPhone转发:0回复:0喜欢:0
$平治信息(SZ300571)$
[玫瑰]OpenAI发布会【建投传媒互联网】
#GPT-4o更拟人的原生多模态
GPT-4o是跨文本/视觉/音频端到端训练的新模型
1)语音交互几乎零延迟:不同于原ChatGPT语音转文本-文本生成-文本转语音的语音功能。
2)性能赶超GPT-4 Turbo:英语文本和代码能力相近,多语言、音频和视觉功能实现新高。
#C端免费开放/B端API价格低
1)C端:文本图像功能已集成至ChatGPT免费开放,支持 3D 重建、漫画分镜等。语音模式将于未来几周向Plus用户开放,可通过摄像头识别外界事物,实时翻译+解题辅导等。
2)B端:相比GPT-4 Turbo,速度提高一倍,单位时间调用次数是原来的5倍,价格为50%。还将通过 API 向部分合作方推出GPT-4o 更多音频和视频功能。
#其他产品更新
将向 Plus 用户推出 macOS 应用,此外今年还将推出 OpenAI 的Windows 版本。
建投传媒互联网团队