Open AI 春季发布会速递-GPT4.0o 本次发布会上发布了模型chatGPT4.0o，视觉语音文本全能的多模态大模型。发布会视频链接：网页链接官网介绍：网页链...

发布于:2024-05-14 02:32

雪球

转发：0

回复：5

喜欢：1

本次发布会上发布了模型chatGPT4.0o，视觉语音文本全能的多模态大模型。

发布会视频链接：网页链接

官网介绍：网页链接

本次发布的模型核心为更自然的人机交互，可以接受文本、语音和视频任意组合作为输入，并实时以文本、语音和视频给予反馈。

个人感觉最为惊艳的点在于和GPT-4o视频聊天，摄像头作为最直接的输入口，让GPT拥有了眼本次发布的模型核心为更自然的人机交互，可以接受文本、语音和视频任意组合作为输入，并实时以文本、语音和视频给予反馈。

使用者和GPT4.0o进行视频聊天。

GPT4.0o通过摄像头指导使用者解决数学题。

还有什么输入方式能比摄像头+语音更直接快捷呢？可以预见未来AI硬件标配CIS和语音芯片。

全部讨论

05-14 03:07

刚看完了演示，摄像头为眼睛，语音为沟通媒介，使得手机和电脑如同一个伴侣助手，非常棒。不过就这个能力，以及语音芯片，科大讯飞做出来没有任何问题！$科大讯飞(SZ002230)$

05-14 08:48

客观的来看，科大讯飞在今天openai发布会的很多技术科大讯飞都有，能够对标的地方相差并不遥远，所以说科大讯飞的努力的方向应该是正确的，加油讯飞。