联想混合式人工智能,解困大模型下放之路

发布于: 雪球转发:0回复:0喜欢:0

陈庆春/文

这一次,大模型真正放下“身家”,从云上走到终端。

4月18日,联想科技创新大会上发布了一款真正具备五大特征的AI PC新品。这五大特征包括:1、内置个人大模型与用户自然交互的智能体;2、本地异构算力(CPU/GPU/NPU);3、个人知识库;4、开放人工智能应用生态;5、个人数据和隐私安全保护。

这一产品的发布意味着,大模型终于以合适的体积,找到与之相匹配的硬件性能,包括通常所说的内存、显卡、整体算力以及硬件级数据安全,最终发挥其应有价值,而非打着“下放终端”的名义,却依然与云端暗通沟渠。

在发布现场,高通公司总裁兼CEO克里斯蒂亚诺·安蒙、英特尔CEO帕特·基辛格和AMD董事会主席兼CEO苏姿丰均对此产品予以盛赞:AI PC将真正在端侧释放大模型为个人带来的生产力和创造力。他们也十分认同联想AI PC背后的支撑力——混合式人工智能。安蒙甚至说到:“混合式人工智能是AI的未来。”

混合式人工智能,就是公共大模型、个人大模型、企业大模型的混合并用。最早由联想集团在去年10月份正式提出,其意图便是希望充分发挥大模型的价值,让人工智能走下云端,走进千家万户、走进千行百业,实现AI普惠。此次联想重磅推出的个人智能体联想小天,其对端侧大模型易用性与精准性的变革,更是加注了这一意图的实现。

联想AI PC是混合式人工智能落地终端的首个产品,它所带来的行业冲击也将引发更深次的AI伦理和技术平权的思考:混合式人工智能或将能剔除AI威胁论、AI霸权论,削减AI滥用,带来“负责任的AI”、“无歧视的AI”,让AI平权成为可能。

正如此次大会的主题“ 让世界充满AI”,这也是联想集团董事长兼CEO杨元庆在会上强调的愿景。

大模型“焦虑症”

导演陆川,在联想科技创新大会上分享了一段他看到SORA后的焦虑:

ChatGPT一出现,我就感到一个新时代可能来临了,当我看了Sora系统生成的视频,确实焦虑了;就像是习武之人,别人在练“降龙十八掌”,而我在天天打沙袋。完全不是一个维度。元庆您能理解那种感觉吧?

(左为导演陆川,右为联想集团董事长兼CEO杨元庆)

自2022年底chatGPT一鸣惊人,到今年初SORA火爆出圈,生成式AI一直被看作是AI最终战胜人类的开始,但至今为止能使用到SORA的人类却少之又少,像陆川这样的人倒是不计其数。无论是在个体用户端还是产业端,生成式AI的高超能力与落地使用之间,一度陷入尴尬。

陆川说,他让团队从去年三月开始潜心研究AI的各类技术。一年后也就是4月18日在联想科技创新大会上,他展示了一个全部用AI技术制作的短片,十分震撼。这个短片实际的制作时间仅用了2天,但如果算上一年的学习成本,却也是一笔不小的投入。

大模型的使用者纷纷陷入焦虑,大模型的发明者们也好不到哪儿去,他们不断喊出,大模型应该加速走下云端、走到终端,才能真正发挥它应有的价值。谷歌阿里等中外大模型厂商从今年起已加大端侧大模型的投入力度,并推出相关模型,如谷歌Gemma 2B端侧大模型,但大多是雷声大、雨点小,真正落地终端还存在诸多障碍。

公共大模型因为体积问题,很难在端侧落地,即便是压缩后的端侧大模型对硬件要求也极高。比如Gemma2B至少需要硬件配备8GB以上显存(GPU)才可以被调用,而手机目前是没有独立显存的。就算是PC,也需要匹配过硬的性能,也就是联想一直强调的五大特征聚齐才能是真正的AI PC,联想自己也才是刚刚才发布这样的AI PC。

大模型无法下放到终端,意味着人工智能无法做到真的懂你,也就谈不上“智能”,而只是一项技术,就像陆川那样需要先学习1年的时间,这个门槛很高。因为人工智能是由数据、算力、算法共同驱动完成的一项技术,如果不下放到终端,人工智能就没有可用的个性化数据,这是它“不智能”的关键,再强的算力、算法也是枉然。

如果想要公共大模型在尽可能完整的数据基础上做闭环推理、决策,个人或企业还需要将自己的数据资料上传到云端,这就又涉及到数据安全和隐私保护层面。用户上传数据之后,就必然允许这些要素成为公共信息的一部分。这在把保护客户信息当作天条的金融服务行业中,是不可想象的。

除此之外,大模型本身在技术层面也存在很多局限性。今天的大模型没有真正地理解语言和理解世界,也没有推理和规划能力。它只是根据高维语义空间的联合概率模型,来连接它之前见过的海量信息片段。举个例子,我们问大模型, 在150和250之间,有多少质数?它完全无法理解。如果你跟它说,你先把150到250之间的所有质数列出来,然后再数一数总共有多少个。这次大模型就会说18个。

在应用层面,大模型还受到了网络速度、云端效率和成本考量等多方面的限制。有研究表明,公共大模型每一次的查询成本达到了传统搜索的10倍之高。大模型很贵,仅电费就令人咂舌。以ChatGPT为例,它每天响应大约2亿个请求,在这个过程中消耗超过50万度电力,相当于1.7万个美国家庭的用电量。马斯克曾发出担忧,人工智能的发展可能导致人类电力短缺。端侧大模型带来的终端耗能,也需引起关注,一台笔记本的电量可能都无法支撑几次大模型的调用。

不可否认,大模型是人工智能底层核心技术飞跃发展的成果,它是人工智能普及的催化剂和加速器。但技术问题、获取成本问题、安全问题,都已将很多人拒之门外,大模型带来的社会“焦虑症”,到了不得不解决的时刻。

混合式人工智能系统化重构AI

技术推动人类文明的发展,都需要一段时间的演进过程。

电,从被发明出来到流向千家万户,经历了从单点工具化,到全社会系统化改造的漫长过程。最初,可能将用蒸汽作为动力的设备,做节点改造,让它可以替代蒸汽提升效率;后来,将整个设备做了重新设计,让它更适合用电;最后,人们又设计了电力系统,整个社会体系甚至都围绕电做了重新构建。

人工智能,正在开启同样的历史进程。杨元庆提出的混合式人工智能,原理就是系统化地应用大模型、重构AI,让AI顺利流向真正需要的地方,完成AI时代的底层改造。

联想集团在公共大模型之外,以自研技术与大模型厂商合作开发出个人大模型、企业大模型,部署在智能终端和边缘侧,让大模型真正的了解每个人和每个企业的个性化需求,实现个性化的推理、决策。而更具革命性意义的是,联想还自研了个人智能体与企业智能体,将大大降低生成式AI的使用门槛。

个人智能体,内嵌于智能终端,比如电脑、手机、平板、头显乃至汽车,通过自然语言交互,调用个人大模型、本地知识库,意图理解个人用户需求,并给出反馈结果。甚至于主动行动,比如提醒用户制定家庭度假计划,及时下单补充日用品储备等等;或根据你的思维模式和行为频率预测下一个任务,主动提出建议。

企业智能体,内嵌于企业内部多个终端设备(如员工电脑)或基础设施中,能够存储、学习大量的本企业数据并进行推理,在保障信息安全的同时,通过自然语言交互的方式,支持企业运营决策,反馈用户需求。如果遇到台风,企业智能体就会主动提示决策者,哪些产品及零配件会遇到什么问题,并给出解决问题的具体办法。

由于调用的是本地知识库、本企业数据,个人大模型和企业大模型,因此个人智能体和企业智能体会越来越懂用户需求,他们会变得越来越聪明、高效。杨元庆认为,个人智能体将“甚至超越每个人的寿命,永存于世,让人类实现另一种意义上的永生!”

清华大学人工智能产业研究院院长、中国工程院院士张亚勤表示认同:“智能体更接近于人类,对于个人应用来说就是真正的智能助理,对于企业应用来说,把现代复杂的运营和管理系统最大效率地调动起来,将极大地提升运营效率和生产力水平。”

此外,联想集团还在研究大模型增强技术,包括“意图理解”、“异构计算”、“智能问答”、“隐私安全”等四类技术,让基础大模型意图理解更精准、执行时间更短、问答效果更好、实现硬件级的安全保护。

虽然联想没有基础大模型,但它从自己擅长的终端着手,设计混合式人工智能技术架构,让大模型真正有“用武之地”,让人工智能真正“开箱即用”,这正是当下社会、产业所急需的底层构建能力。

全栈业务支撑未来落地

杨元庆承诺,个人智能体是联想智能设备出厂的一个标配。他说:“我们在产品设计阶段就可以采用自研的模型压缩技术,在出厂的智能设备上内置个人智能体。这样,用户就可以在设备端实现人工智能推理功能。”

联想今天发布的六款真AI PC仅仅只是开始。作为全球PC市场占有率多年的王者,再加上智能手机、平板电脑的全球领先地位,联想集团拥有绝对的底气以设备的规模量,去完成阶段性的人工智能普及。

相对于个人来说,企业端的人工智能普及更复杂一些。首先数据收集的端侧就涉及到电脑、工控机、智能网关、摄像头等,其次是智能基础设施,包括边缘侧设备、存储、服务器,以及网络传输等。

当日联想发布了“万全异构智算平台”,专门解决混合式人工智能中混合算力调用的关键问题。同时推出算力魔方技术、GPU内核态虚拟化技术、集合通信算法库、分钟级断点续训技术、以及跨集群超级调度器等5大技术,以解决越来越复杂的集群配置、断点难续的问题,为混合式人工智能注入永续不断的底层动力。

同时,联想还建立了一支人工智能专业服务团队,解决混合式人工智能“最后一公里”落地的问题。这个团队已经开始工作,现场展示了其正在为吉利集团及旗下路特斯跑车开发车内智能体。联想认为,不同的行业有不同的智能体,同一个企业也需要针对不同业务场景的企业智能体,比如有营销智能体、供应链智能体、服务智能体等等。

智能设备、智能基础设施、智能解决方案和服务,联想集团三大业务群将以全栈人工智能的身份定位,支持混合式人工智能落地到个人和企业。这也是联想集团多年布局端-边-云-网-智新IT技术架构的成果。

除此之外,联想集团也在积极与合作伙伴一起做大AI生态。联想一直以来与其他科技企业最大的不同是,永远保持着开放、合作、共赢的姿态建设生态。有业内人士曾评价,无论是“互联网+”还是“人工智能+”,很多企业都是试图把客户、用户加到自己的平台,做大自己的平台,但联想不是,它愿意把自己的能力加到客户和用户身上。

杨元庆答应陆川,一起建立AI影像实验室,让人工智能更好地赋能创作者经济,帮助陆川实现理想:AI可以帮助万千有电影梦的年轻人,跨越资金的门槛,直接呈现头脑中那部伟大的电影。

AI伦理与前景思考

“AI其实是增强,而不是取代人类的智能。”这是杨元庆的判断。

生成式AI的飞速发展,曾带来诸多的伦理问题、法律问题,AI被滥用、失控的情况多有发生,AI的威胁论、霸权论也时常上演。

联想在构造混合式人工智能时,就已经预设了AI应该是“负责任的AI”、“非歧视的AI”。它强调个性化数据的推理、决策,但也重视数据和隐私安全,没有用户授权,绝不上传云端,是硬件级的隐私阻断。从这个角度来说,联想混合式人工智能拥有科技向善的力量,若大规模应用或能真正抵消社会对AI的负面情绪。

此外,杨元庆始终强调的是,推动整个产业生态系统的成长,在开发和应用的各个环节,都能保证人工智能的普惠性、公正性和包容性,让人人都能从人工智能的发展中获益,从而打造一个“让世界充满AI和爱”的可持续发展的美好未来。这一愿景让人们看到期盼已久的技术平权,也有可能真正消除当下严重的平台化虹吸效应。

联想集团已经拥有了40年的成长经历,对AI也有着超10年的坚定投入与布局。AI是一项长跑项目,AI与实体经济连接才能产生化学反应,带动社会的科技平权,联想集团的长期主义与双实企业身份占有很大优势。

混合式人工智能、全栈人工智能便是联想集团前瞻性战略布局的最大成果,也带有正向的AI伦理价值观导向,但如何驾驭这一庞大的技术架构体系,如何让每个节点都开出AI之花,将是联想集团接下来10年面临的重要任务。(来自公号:热爱AI Next)