发布于: Android转发:0回复:1喜欢:0
【人工智能第一团队|民生计算机】重磅预测:OpenAI下周究竟会发布什么神秘产品?
我们认为OpenAI新品发布会或带来全新AI应用潮流,结合OpenAI最新专利Voice Engine和奥特曼的最新访谈,我们认为新品发布会有以两大可能:
1)类似《Her》或者钢铁侠贾维斯一样的全能语音AI Agent,通过语言可以实现收发邮件、打电话、处理日常事务等各类工作(自行规划推理完成);
2)GPT4模型出现分化,出现极高性价比的GPT4-Lite(极致的推理性价比)以及代表人类最高大模型水平的旗舰款GPT4(不会出现GPT5)
OpenAI于2024年3月19日提交Voice Engine专利申请,并于4月29日获得受理,该专利主要包括以下功能:
1)处理语音命令,并在文本和语音之间转换;
2)用于创建和生成基于自然语言提示、文本、语音、视觉提示、图像和/或视频的语音和音频输出的计算机软件;
3)用于构建数字语音助手的计算机软件;
4)用于生成音频和/或语音以响应用户提示的计算机软件;
5)用作应用程序编程接口(API)的计算机软件;
6)用于开发全球计算机网络、无线网络和电子通信网络的语音服务交付和自然语言理解技术的计算机软件开发工具。
奥特曼在5月12日最新访谈对语音AI代理提出了以下观点:
1)奥特曼认为语音交互是通向未来交互方式的一个重要线索,如果能够实现真正优质的语音互动体验,那将是一种与计算机互动的全新方式,目前AI确实显得有些笨拙,响应速度不够快,且缺乏流畅和自然的感觉。我们致力于让这些方面的体验得到显著提升;
2)奥特曼期望拥有的是一种始终处于激活状态且极易使用的设备,它可以通过语音、文字,或者更理想的状态,通过其他方式理解我的需求。我设想有一个系统能够全天候地辅助我,尽可能多地收集上下文信息,成为世界上最出色的助理,不断地帮助我提升自我;
3)人工智能不是用户的简单延伸,而是一个始终可访问、始终卓越、能力超群的助理或高管。智能体不只是机械地执行命令,它能够进行推理。
4)暂时不进入音乐产业。
风险提示:技术落地不及预期

全部讨论

aopenai将发布智能助手,ai助手,多模态,语音,视频
OpenAI认为,具有视觉和听觉功能的助手有可能像智能手机一样带来变革。它可以观察用户所处的环境信息,提供建议,潜在的用例如充当家庭教师、翻译标志、修理汽车等等
佳发教育发布了基于人工智能技术的"理化生实验AI解决方案""体育教育AI解决方案""英语机考AI解决方案"三款产品。其中英语机考AI产品,基于语音识别、自然语言处理能力,通过AI英语学习助手小灵老师的课标认知与引导能力,帮助学生实现个性化学习与辅导