发布于: 修改于: Android转发:0回复:0喜欢:2
OpenAI 正式发布GPT-4o,感觉很惊艳,反应速度处理能力得到大幅提升,硬件端有一定想象力。
发布会要点:
1.新的 GPT-4o 模型:打通任何文本、音频和图像的输入,相互之间可以直接生成,无需中间转换
2.GPT-4o 语音延迟大幅降低,能在 232 毫秒内回应音频输入,平均为 320 毫秒,这与对话中人类的响应时间相似。
3.GPT-4o 向所有用户免费开放
4.GPT-4o API,比 GPT 4-Turbo 快 2 倍,价格便宜 50%
5.惊艳的实时语音助手演示:对话更像人、能实时翻译,识别表情,可以通过摄像头识别画面写代码分析图表
6.ChatGPT 新 UI,更简洁
7.一个新的 ChatGPT 桌面应用程序,适用于 macOS,Windows 版本今年晚些时候推出
【国盛计算机】OpenAI发布GPT-4o,多模态实时交互能力重大突破
太平洋时间5月13日10点,OpenAI召开春季更新发布会,直播发布GPT-4o发布会直播展示惊艳多模态交互能力,可以进行实时视频交互。GPT-4o(“o”代表“omni全能”)接受文本、音频和图像的任意组合作为输入,直播中GPT-4O展示了实时语音交流能力,响应极快,并且可以识别用户的语音情绪,语音有情感,还能用不同语言和多人同时交互。在语音的同时可以与视频实时交互,演示了一边聊天一边解答手写数学问题,以及实时交流阅读代码,指导编程、视频聊天等能力。GPT-4o 的文本和图像功能今天开始在 ChatGPT 中推出。GPT-4o会 在免费套餐中提供,向 Plus 用户提供高达 5 倍的消息限制。在未来几周内OpenAI将在 ChatGPT Plus 中推出带有 GPT-4o 的新版本语音模式。开发人员现在可以在 API 中将 GPT-4o 作为文本和视觉模型进行访问。与 GPT-4 Turbo 相比,GPT-4o 的速度快 2 倍,价格减半,速率限制高出 5 倍。我们认为,GPT-4o是迈向更自然的人机交互的重大进步,新功能带来了崭新的多模态交互能力,通过新的端到端模型实现了体验上的新突破,有望在各类终端实现用户体验的最大化,利好智能终端Agent、机器人等方向。
【中信电子】OpenAI 推出最新人工智能模型 GPT-4o,多模态交互能力亮眼
[太阳]OpenAI 推出最新人工智能模型 GPT-4o,GPT-4o在 GPT-4 的基础上改进了文本、视频和音频功能,多模态交互能力亮眼。在 API 中,GPT-4o 的价格是 GPT-4-turbo 的一半,速度是其两倍。OpenAI 将在免费版中提供 GPT-4o,并为 Plus 用户提供高达 5 倍的消息限制。
[玫瑰]我们在今晚的直播中看到了GPT-4o强大的多模态交互能力(可以一边和用户对话,一边做数学题、指导编程,在对话过程中可以实现实时交流且交流情感更为充沛自然,灵活切换各种语言)。我们之前谈到,AI落地终端过程中远期的最佳形态可能是AR眼镜,现阶段从技术成熟度和产品完整度上看,理想形态可能是智能眼镜(兼备视觉和听觉交互能力),其次是耳机和音箱(尽管缺乏视觉交互能力,但更容易落地)。今晚The Information所报道的“Meta也在考虑开发搭载摄像头的AI辅助耳机以实现识别物体和翻译外语”,其实也是想进一步挖掘AI在耳机上的应用场景。
[玫瑰]此外,据彭博社报道,苹果公司(Apple Inc.)已接近与OpenAI达成协议,在iPhone上使用其技术。上述知情人士表示,双方一直在敲定一项协议的条款,以便在下一代iPhone操作系统iOS 18中使用ChatGPT功能。我们同样看好苹果通过自研+外部合作的方式为用户提供良好的使用体验。
[庆祝]我们坚定看好AI落地IoT产品大趋势。基于这一逻辑,我们建议关注:
上游主芯片厂商:恒玄科技瑞芯微晶晨股份全志科技北京君正乐鑫科技中科蓝讯等。
终端厂商:漫步者安克创新国光电器传音控股等。
中游组装厂商:歌尔股份佳禾智能天键股份华勤技术亿道信息等。
[庆祝]我们同样看好苹果AI主线,基于这一逻辑,我们建议关注立讯精密鹏鼎控股瑞声科技高伟电子思泉新材水晶光电等产业链标的。
📞中信电子团队 徐涛/胡叶倩雯/梁楠/唐佳
光大科技】OPENAI发布大模型GPT-4o,语音视频交互震撼全球
北京时间2024年5月14日凌晨,OPENAI召开春季发布会,发布会亮点如下:
1、未来OpenAI 做产品免费优先,为的就是让更多的人能使用。
2、OpenAI 此次发布了桌面版本的程序和更新后的 UI,其使用起来更简单,也更自然。
3、GPT-4 之后,OpenAI 发布新版本的大模型GPT-4o。GPT-4o里的“o”是Omni的缩写,也就是“全能”的意思,接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像输出。
4、实时语音对话:GPT-4o可以在短至232毫秒、平均320毫秒的时间内响应音频输入,与人类在对话中的反应速度一致。GPT-4o 在语言不通的两个人之间充当翻译机,听到英语就翻译成意大利语,听到意大利语就翻译成英语。
5、GPT-4o API相比较GPT-4 Turbo,价格5折,速度提高一倍,单位时间调用次数是原来的5倍!GPT4-o与ChatGPT Plus会员版所有的能力,包括视觉、联网、记忆、执行代码、GPT Store等都将对所有用户免费开放!
6、Brockman还发布5分钟视频,让两个ChatGPT互相对话,一个是旧版APP ChatGPT,只知道对话,另一个则是新版网页ChatGPT,具备视觉等新能力。TA们从Brockman的衣着开始聊起,旧版不断提出新的问题,新版都一一解答。最后两个ChatGPT根据刚才聊天的内容,直接开启了对唱模式。
投资建议:
1、光模块:中际旭创新易盛天孚通信
2、国产算力:海光信息寒武纪
3、华为昇腾产业链:神州数码烽火通信软通动力润建股份恒为科技恒铭达利和兴
4、服务器:工业富联浪潮信息中科曙光、华勤技术、中兴通讯协创数据
5、铜互连、连接器和线缆线束:沃尔核材、立讯精密等;
6、PCB/覆铜板:生益科技沪电股份深南电路胜宏科技奥士康
7、封测:通富微电、长电科技;
8、苹果供应链:鹏鼎控股、立讯精密、水晶光电、中石科技等;
9、AI终端:传音控股(AI手机)、漫步者(AI耳机/AI音箱)、联想集团(AI PC);
10、AI应用:金山办公、虹软科技、新国都等;
11、AI虚拟人:洲明科技;
12、AI机器人:奥比中光、珠城科技。
【人工智能第一团队|民生计算机】 OpenAI 正式发布最新大模型 GPT-4o有什么意义?
1、本次发布的并非单个AI应用,而是发布最新的旗舰大模型GPT-4o,本质是一次大模型升级发布会。2、GPT-4o相对于此前版本升级主要集中在改善人机交互体验,核心目的在于逼近人机交互的终极目标,更像真人交互的AI Agent(智能助理),包括几个方面:3、和真人交互一样全模态统一:GPT-4o中o是omnimodel前缀首字母,指本次发布是文字、语音、图片、视频全模态统一的模型,可以接受任意模态组合输入,并生成任意组合模态输出。4、和真人交互一样实时无延迟:在语音对话中,没有此前版本大模型的延迟,而且可以随时插嘴,模型实时响应。5、和真人交互一样看懂、听懂情绪与语气:模型可以听懂人的情绪、甚至人的喘息成都呼吸。模型输出语气情绪也可以与真人一模一样。6、GPT4o更此前最新版本收费不同,全球免费使用,GPT-4o API 比 GPT4-turbo 快 2 倍,价格便宜 50%。7、此次GPT-4o发布核心在于赋予大模型更实用的交互体验与低廉价格,意在加速打开各类应用场景。8、拥有多模态卡位的AI终端会是核心受益者,包括AI手机、AI PC、(摄像头+耳机)等AI多模态创新终端等。OpenAI 推出最新人工智能模型 GPT-4o,多模态交互能力亮眼OpenAI 推出最新人工智能模型 GPT-4o,GPT-4o在 GPT-4 的基础上改进了文本、视频和音频功能,多模态交互能力亮眼。在 API 中,GPT-4o 的价格是 GPT-4-turbo 的一半,速度是其两倍。OpenAI 将在免费版中提供 GPT-4o,并为 Plus 用户提供高达 5 倍的消息限制。我们在今晚的直播中看到了GPT-4o强大的多模态交互能力(可以一边和用户对话,一边做数学题、指导编程,在对话过程中可以实现实时交流且交流情感更为充沛自然,灵活切换各种语言)。我们之前谈到,AI落地终端过程中远期的最佳形态可能是AR眼镜,现阶段从技术成熟度和产品完整度上看,理想形态可能是智能眼镜(兼备视觉和听觉交互能力),其次是耳机和音箱(尽管缺乏视觉交互能力,但更容易落地)。今晚The Information所报道的“Meta也在考虑开发搭载摄像头的此外,据彭博社报道,苹果公司(Apple Inc.)已接近与OpenAI达成协议,在iPhone上使用其技术。上述知情人士表示,双方一直在敲定一项协议的条款,以便在下一代iPhone操作系统iOS 18中使用ChatGPT功能。我们同样看好苹果通过自研+外部合作的方式为用户提供良好的使用体验。我们坚定看好AI落地IoT产品大趋势。基于这一逻辑,我们建议关注:上游主芯片厂商:恒玄科技瑞芯微晶晨股份全志科技北京君正乐鑫科技中科蓝讯等。终端厂商:漫步者安克创新国光电器传音控股等。中游组装厂商:歌尔股份佳禾智能天键股份华勤技术亿道信息等。我们同样看好苹果AI主线,基于这一逻辑,我们建议关注立讯精密鹏鼎控股瑞声科技高伟电子思泉新材水晶光电等产业链标的。