Open AI新发布的GPT-4O改变了什么?有多强?

发布于: 雪球转发:0回复:0喜欢:0

本文首发于“单仁行”公号,订阅“单仁行”公号

从企业家的角度探究商业本质

01

对于AIGC的从业者来说,昨天可能是一夜未眠。

在昨天凌晨1点,OpenAI在官网上直播了26分钟的发布会,推出了新的大模型GPT-4O。

虽然GPT-5并没有发布,但直播演示的GPT-4O在文字、音频、视频的强大交互能力,让人感受到了AI的快速进化,

要知道距离ChatGPT问世满打满算才17个月,OpenAI已经掏出了像科幻电影里的超级AI,而且号称“完全免费,人人可用”,多少有点吓人了。

这个新的GPT-4O,到底强在哪里呢?

02

第一个是强大的多模态交互能力。

根据官网的介绍,GPT-4o是面向未来人机交互范式的全新大模型,具有文本、语音、图像三种模态的理解力。

也就是说我们可以是用传统的文字去输入,也可以是语音去交流,还可以直接打个视频,我们可以用任意组合直接跟AI进行互动。

AI也会根据我们输入的形式立马生成文本、音频和图像的任意组合进行反馈。

所有的互动都是实时发生的,也就是AI的反应会非常快,最短是232毫秒,而且还带有感情,很通人性。

我给大家简单看一个演示视频,GPT-4o来指挥并且判定“石头剪刀布”的游戏。

大家看完有什么感受?

像我们所有人的手机里都会有一个类似Siri的语音助手,我们去对比就能发现,GPT-4o对于场景和情绪的识别能力基本上跟真人没什么区别。

它能够从我们的语气和动作中充分理解我们现在的状态,然后给予热烈的回应,

我们再来看一个视频,这是两个AI自己在进行互动。

我都怀疑OpenAI之所以能把成本降低一半,是不是就是平常让AI们自己去互动完成了训练。

所以,我们不光是从能力角度上觉得它拥有“智慧”了,更是从交流感受上觉得它竟然有“人情味”了,这也就意味着GPT-4o可以提供一种前所未有的交互性沉浸感。

我看完的第一个感受就是,智能语音助手这个赛道要被颠覆了,什么小爱、Siri、天猫精灵跟GPT-4o根本比不了。

但反过来想一想,如果我们的手机、汽车能够率先搭载GPT-4o,会不会就是未来的AI手机、AI汽车重要的拼图?这不得卖爆了?

我的第二个感受就是,像心理咨询师、红娘、社交交友这些需要强情绪交互的赛道,马上一定会迎来颠覆。
GPT-4o既能通过训练掌握比人脑更多的知识,又能提供强大的情绪价值,还能24小时上班,随叫随到,这还要人来做服务干嘛?

这些都会成为一个全新的蓝海市场。

03

第二个的地方,就是GPT-4o在理解和生成图像方面的处理能力。

GPT-4o给了17个场景的演示,包括海报、头像、角色、品牌的实时设计、视频和多人会议的总结梳理。

举个例子,我可以找两个模版,搭配公司需要的元素,让GPT-4o马上生成产品海报,我只需要在脑海里设计,告诉它怎么修改就行,执行动作全部都不用人去做。

再比如说,我拍了一段很长的视频,开了一场多人会议,我已经忘记里面具体讲什么了,我都可以交给GPT-4o去给我总结梳理中间的要点。

我还可以让GPT-4o去进行实时的3D渲染。

大家都知道,这些都是跟企业生产活动密切相关的工作,比如说设计物料、品牌形象、会议纪录。

过去可能没有哪一个AI能够完全满足企业需要的复杂步骤,要么就是要等很久,要么就是训练难度高,让AI理解我要什么很困难。

但现在就不一样了,GPT-4o在理解和生成图像方面的处理能力非常强,我们很多不可能靠AI去进行的任务都有了解法。

而且,OpenAI还做了一件事,他们基于macOS的操作系统推出了ChatGPT的桌面应用程序。

什么意思呢?

只要我电脑是苹果的,我都可以在电脑中随时唤醒ChatGPT,包括跟他语音对话,让它知道我现在在做什么,无缝衔接到我的工作流当中。

同样,GPT-4o也在进行类似的应用开发,直接集成到电脑里进行使用。

这是OpenAI第一次在一个模型中集成了所有模态,并且大幅提升了大模型的应用场景和实用性。

比较遗憾的是,因为“墙”的原因,国内大部分企业和个人是没办法用到了。

04

当然,看完GPT-4o的发布,我现在也非常的庆幸。

因为在研发专业营销大模型文思子牙的时候,我们同样也是选择了集成,没有想着偷懒,或者是觉得哎呀,那个功能太麻烦了,用户用的少,我们就不要了。

我们也是集成了所有模态,并且进行了专项训练。

首先是给AI训练专业的营销知识,把过去近百年营销这门学科的知识进行系统训练,先让AI成为营销专家。

第二步就是在训练文思子牙完整营销知识体系的同时,也给每个企业建立一个专业的训练库。
因为对企业营销来说,要把自己品牌理念、产品结构,市场定位、目标对象、渠道、所有的应用场景和客户关心的问题深度链接起来,才能形成一个系统。

比如说我是A公司,我有什么样的业务,什么样的背景可以进行提前的输入,当我问了问题之后,还可以给文思子牙的回答打分,让文思子牙进行回归计算,能够去根据企业特点需求进行再训练。

逐步让每个公司能够训练出一套符合自身业务特点和营销逻辑的系统,细分成不同的产品品类,以及每个产品的应用场景。

第三步就是多模态的集成。

在文思子牙当中,我们可以结合文思子牙专业的营销内容生成,实现从“直播(短视频)创意、内容生成、数字人视频生成、关键词生成、矩阵全平台发布、数据分析、线索管理”的一整套工作闭环。

也就是把企业营销需要的创意、内容、脚本、图片、视频、剪辑、一建分发、全平台矩阵、数据监控、线索管理全部进行集成,形成一整套的工作闭环,并且根据单仁牛商的案例库和对全域矩阵营销的研究,让每个作品都能通过平台检验,发挥出效果。

所以,当今天Open AI也是在朝着这个方向去落地,加强大模型的应用场景和实用性的时候,我们也确实感到了兴奋和危机感。

兴奋的是未来的AI进化一定是越来越快,并且是不断贴合我们现实的需要,AI一定会深刻改变我们每一个行业,每一个企业。

感到危机的是Open AI的野心很大,它是直接在通用大模型的基础上去进行多模态的集成,我们是在大模型和专业营销领域的基础上去进行集成和应用开发,我们也需要去进化,不断去迭代。

当然,今天就是谷歌的开发者大会,接下来还有很多顶尖公司对于AI的研究和会议发布,我们持续关注,明天再继续分享。

责任编辑 | 罗英凡

图片均来源于网络

本文不构成任何投资建议,股市有风险,投资需谨慎

■ 免责声明

本文涉及有关上市公司的内容,为作者依据上市公司根据其法定义务公开披露的信息(包括但不限于临时公告、定期报告和官方互动平台等)作出的个人分析与判断;文中的信息或意见不构成任何投资或其他商业建议,市值观察不对因采纳本文而产生的任何行动承担任何责任。