爆火背后,AI Agent的想象力在哪

发布于: 雪球转发:0回复:0喜欢:1

如果你饿了,你的AI小助理可以直接打开外卖APP,并且调用支付程序支付;你告诉它你病了,小助理会结合你的身体指标,调出互联网数据,经过分析且确定结果后帮你在APP上下单买药或者请假……

看到没有,它不只是完成你的指令,只要你说出想做什么,它可以通过独立思考后连接相关服务和工具去规划并逐步完成给定目标。如果这些都能实现,想象一下你的生活将会多么便捷,这就是AI Agent。

所谓AI Agent,就是一个更智能的“小度”,它可以自主使用工具并且执行任务。

如今,我们似乎置身于AI技术快速发展的十字路口上,GPT Store、英伟达ACE、Vision Pro、Rabbit R1、AI pin、钉钉个人助理等AI Agent或者承载AI Agent的平台密集出现,让AI市场的竞争战况更加焦灼。但现在AI Agent尚属于发展初期,Agent的数据结构应该如何,网络隐私和安全问题又将如何处理……

01

AI Agent爆火后,所有应用都需要被AI重构

AI Agent的想象力到底在哪?

“大语言模型只能编个贪吃蛇,而AI Agent可以整出一个‘王者荣耀’。”这是网上盛传的回答,这似乎并不夸张。比尔·盖茨也曾说过,“谁能主宰AI Agent,那才是大事。因为你将永远不用去搜索网站或者亚马逊。”

Agent发展时间并不长,去年上半年,AutoGPT横空出世,并成为Github历史上涨星最快的项目。它是Github上由OpenAI推出的一个免费开源项目,在AutoGPT中只需为其提供一个AI名称、描述和五个目标,AutoGPT就可以自己完成项目。它可以读写文件、浏览网页、审查自己提示的结果以及将其与所说的提示历史记录相结合。所以更多人在了解与体验AutoGPT的同时,也逐渐知道了AI Agent。

紧接着在5月,Agent公司Cognosys获得200万美元的种子轮融资,由Alphabet风险投资部门GV(Google Ventures)的SangeenZeb领投。该公司打造的是一种基于Web的Agent产品,目的是优化工作流程、推进决策并提升各个领域的效能。

GPT-4发布以后,OpenAI并没有停下来。去年11月,OpenAI发布AI Agent初级形态产品GPTs,同时还推出了相应的制作工具GPT Builder。用户仅仅通过跟GPT Builder聊天,把想要的GPT功能描述一遍,就能生成专属GPT。专属GPT可以在日常生活、特定任务、工作或家庭中更为适用。

一时之间,业内人士突然醒悟,ChatGPT其实只是一个试用版,GPTs才是OpenAI推出的真正的AI产品。这也印证了Altman在开发者大会所说,“我们正在孕育新物种,它们正在迅速增殖”。OpenAI用了半年多的时间,就从全世界最好的基础大模型提供商变成了全世界最好的AI应用提供商。

Agent的应用前景,也吸引了大量创业者投身其中。据相关媒体统计,去年下半年在海外拿到知名创投机构投资的Agent项目超20家,涉及零售、房地产、旅游、客户服务、人力资源、金融、制造业等多个领域,比如亚马逊Alexa、Aktify、Regie.ai等等,某位大佬所说的“所有应用都需要被AI重构”,似乎并不夸张。

像OpenAI、微软谷歌这类科技巨头在AI Agent在底层技术、架构以及具体产品应用等方面都较为完善有着天然的先发优势。

国外AI Agent发展如火如荼,国内也没闲着,毕竟AI Agent的能力也是AIGC下一阶段冲刺的关键。国内创投圈也在密切关注着相关创业公司的进展。甚至有投资人调侃,“大模型都没搞明白,又来了个AI Agent”。这是一个不可错过的机会,大厂、创业公司都强势入局,虎视眈眈。

02

阿里腾讯、钉钉等争相入场,华为天才少年也来了

2024年会是AI Agent的元年吗?

几个月前大家还都在看海外的Agent项目,但现在很多国产Agent项目已“上桌”,与人类日常生活与办公场景密切结合的AI Agent被寄予厚望也不难理解。冲刺一波浪潮的,首当其冲的就是互联网大厂们。

目前,阿里腾讯、华为等科技大厂相继推出Agent产品,Agent越来越多。2月20日,在OPPO AI战略发布会上,OPPO认为AI手机将是继功能机、智能机之后,手机行业的第三个重大的变革阶段。同时,OPPO发布了1+N智能体生态战略,这一生态由AI超级智能体和AI Pro开发平台组成。

1月9日,在钉钉2024年度产品发布会-我的超级助理活动上,钉钉发布了全新7.5版本,并推出有机会对标GPTs的智能化产品——AI助理,让每个人、每家企业定制个性化、专属超级助理。

值得注意的是,就在1月初,AI公司斑头雁智能科技官宣完成近千万美元A轮融资,用于继续深入打造企业级AI Agent产品BetterYeah AI。这家公司来头不小,由钉钉创始团队成员、原副总裁张毅(花名陶钧)创立,另外两位联创也来自原钉钉核心团队,公司还吸引了一批曾任职阿里达摩院、字节等公司的核心技术人才加入。截至目前,该公司累计完成2轮融资,融资额合计人民币1亿元。

今年,手握AI Agent的大厂一定不会坐以待毙,“厮杀”定会比去年竞争更激烈。去年年底,华为诺亚方舟实验室、UCL、牛津大学等机构的研究者提出了盘古智能体框架(Pangu-Agent)尝试来解决AI智能体面临的挑战。

与此同时,华为的一位天才少年的动作也备受外界关注。早在7月,华为“天才少年”李博杰离职开始创业做了一个AI Agent的项目,陪伴类的AI Agent。在加入华为之前,他是中科大少年班的成员。

再回到12月,百度也是大招不断。18日,百度宣布“灵境矩阵”平台全新升级为“文心大模型智能体平台”。据悉背靠文心大模型,灵境矩阵已有超过3万开发者申请入驻。目前,已有法律智能助手、TreeMind树图、职场密码AI智能简历等众多智能体通过灵境矩阵跑通从开发到分发再到变现的路径。

还有昆仑万维,它正式发布了“天工SkyAgents”平台,具备从感知到决策,从决策到执行的自主学习和独立思考能力。用户可以通过自然语言构建自己的单个或多个“私人助理”。并且将不同任务模块化,通过操作系统模块的方式,实现执行包括问题预设、指定回复、知识库创建与检索、意图识别、文本提取、http请求等任务。

AI发展至今,怎会少了字节的身影。时间拉回到8月,字节推出了基于云雀模型开发的AI工具豆包,定位是用户的智能伙伴,既能帮助用户提升效率完成各种工作任务,又能高情商聊天提供各种感情建议,还能创建AI智能体进行自由对话。

目前该产品主打智能体创建,打开看应用就能看到项目的“创建AI智能体”字样,用户可以在这里简单创建并发布面向各种应用场景的AI智能体。

同月,与此同时,一家聚焦于Agent方向的创业公司澜码科技也进入大众视野——公司已获得IDG资本、联新资本、Atom Capital等头部机构的数千万人民币A轮融资。澜码方向是基于底层⼤语⾔模型,开发新一代Agent平台,目前已经与金山办公等多家上市公司和独角兽企业达成战略合作。

可以看到,大家似乎都在秀关于AI Agent的“肌肉”,7月,阿里云魔搭社区推出国内首个大型模型调用工具魔搭GPT(ModelScopeGPT)。使用这款工具,用户可以一键发送指令调用魔搭社区中的其他AI模型,从而实现大大小小的模型共同协作,进而完成复杂的任务。

现在的形势是,投资人开会活动几乎无人不聊AI,不聊Agent,创业项目也在走向Agent。AI Agent甚至被称为“大模型下一场战事”,“颠覆”与“变革”是AI市场的状态。但是,即便目前以出现不少数量与形态的大模型产品。但从开始的拼参数、拼服务,到现在的拼行业落地,至少在国内,大模型始终没有找到一个清晰的商业模式。

03

从实验室走向应用,落地难何解?

“AI Agent的想象力不言而喻。但现在的情况是大家都在说自己是做Agent的,那么现阶段Agent到底能做什么,感觉没人敢明说细说”,AI技术爱好者李响向朋湖网表示。

多位业内人士都曾表示,虽然与大模型相比,Agent更贴近产业,也能让客户的每笔钱都花得更值,但不论是对客户还是对开发商,Agent带来的收益是否迈过了成本的门槛仍是未知数。Agent的发展基于大模型,而当前大模型赛道的特点是技术门槛高、资金投入多、商业模式尚且发展不成熟。

首先,现有的技术条件下,如何解决大模型幻觉是大模型走向全面产业应用的难点。所谓大模型幻觉,主要指的是模型输出了和现实世界不一致的内容,例如捏造事实、分不清虚构与现实、相信谣言和传说等,也就是我们常说的“一本正经的胡说八道”。

这个问题若不解决,在实际应用场景中,这不仅会影响模型的准确性和稳定性,还制约了大模型在真实场景中的广泛应用的可靠性,这就还有很长的一步路走。

众所周知,AI Agent发展的前提条件是多模态。在很多情况下,如智能客服场景,用户可能会通过多种方式提供信息,多模态具有很好的感知价值。但至今在解决一些逻辑、推理等核心问题上,Agent的能力还有些弱。因此,Agent各模块之间如何配合、多个Agent如何交互、人类与Agent如何互动等方面,Agent技术尚处于早期阶段,

其次,如何控制高昂的调用成本是摆在AI Agent面前的另一大难题。接入Agent后,所有需要处理的业务场景,都会转化成需要底层大模型理解的数据,产生高昂的推理成本。举个例子,斯坦福的虚拟小镇框架开源后,每个Agent一天就需要消耗20美金的Token数,比用人成本还要高。

第三,国内智能算力较为短缺的现状下,各家大模型在持续投入人力、算力、资金并实现商业化落地方面,可能会面临较大挑战。因此,Agent想要真正实现规模化落地,道阻且长。

还有很重要的一点,Agent如何保证用户的数据安全和隐私。Agent一旦投入应用,势必会接触到客户的核心数据,倘若数据泄漏,可能让用户和社会蒙受巨大损失。

最近AI的发展速度速度如火箭般,对于投资人来说是一个难得的机会,但是当前尚处于资本寒冬,“AI Agent虽然火热,但毕竟尚处于早期阶段,我们还是很慎重”,华南某知名投资人表示。这是一个很残酷的现实,看项目的大有人在,投项目的屈指可数。

这已经不是一个PPT融资的时代了,AI Agent玩家想要成功融资并不容易。再前沿的技术,也只有落地走通盈利模式才能实现价值。对于AI玩家来说,AI Agent的未来一定是一场马拉松,只有扎实做好大模型技术和找到商业化落地的路径,才能在未来有机会不被赶下“牌桌”。