Open AI 春季发布会速递-GPT4.0o

发布于: 雪球转发:0回复:5喜欢:1

本次发布会上发布了模型chatGPT4.0o,视觉语音文本全能的多模态大模型。

发布会视频链接网页链接

官网介绍:网页链接

本次发布的模型核心为更自然的人机交互,可以接受文本、语音和视频任意组合作为输入,并实时以文本、语音和视频给予反馈。

个人感觉最为惊艳的点在于和GPT-4o视频聊天,摄像头作为最直接的输入口,让GPT拥有了眼本次发布的模型核心为更自然的人机交互,可以接受文本、语音和视频任意组合作为输入,并实时以文本、语音和视频给予反馈。

使用者和GPT4.0o进行视频聊天。

GPT4.0o通过摄像头指导使用者解决数学题。

还有什么输入方式能比摄像头+语音更直接快捷呢?可以预见未来AI硬件标配CIS和语音芯片。

$韦尔股份(SH603501)$ $中科蓝讯(SH688332)$ $科大讯飞(SZ002230)$

全部讨论

05-14 03:07

刚看完了演示,摄像头为眼睛,语音为沟通媒介,使得手机和电脑如同一个伴侣助手,非常棒。不过就这个能力,以及语音芯片,科大讯飞做出来没有任何问题!$科大讯飞(SZ002230)$

客观的来看,科大讯飞在今天openai发布会的很多技术科大讯飞都有,能够对标的地方相差并不遥远,所以说科大讯飞的努力的方向应该是正确的,加油讯飞。