联想混合式人工智能，解困大模型下放之路陈庆春/文这一次，大模型真正放下“身家”，从云上走到终端。4月18日，联想科技创新大会上发布了一款真正具备五大特征的AI...

陈庆春/文

这一次，大模型真正放下“身家”，从云上走到终端。

4月18日，联想科技创新大会上发布了一款真正具备五大特征的AI PC新品。这五大特征包括：1、内置个人大模型与用户自然交互的智能体；2、本地异构算力（CPU/GPU/NPU）；3、个人知识库；4、开放人工智能应用生态；5、个人数据和隐私安全保护。

这一产品的发布意味着，大模型终于以合适的体积，找到与之相匹配的硬件性能，包括通常所说的内存、显卡、整体算力以及硬件级数据安全，最终发挥其应有价值，而非打着“下放终端”的名义，却依然与云端暗通沟渠。

在发布现场，高通公司总裁兼CEO克里斯蒂亚诺·安蒙、英特尔CEO帕特·基辛格和AMD董事会主席兼CEO苏姿丰均对此产品予以盛赞：AI PC将真正在端侧释放大模型为个人带来的生产力和创造力。他们也十分认同联想AI PC背后的支撑力——混合式人工智能。安蒙甚至说到：“混合式人工智能是AI的未来。”

混合式人工智能，就是公共大模型、个人大模型、企业大模型的混合并用。最早由联想集团在去年10月份正式提出，其意图便是希望充分发挥大模型的价值，让人工智能走下云端，走进千家万户、走进千行百业，实现AI普惠。此次联想重磅推出的个人智能体联想小天，其对端侧大模型易用性与精准性的变革，更是加注了这一意图的实现。

联想AI PC是混合式人工智能落地终端的首个产品，它所带来的行业冲击也将引发更深次的AI伦理和技术平权的思考：混合式人工智能或将能剔除AI威胁论、AI霸权论，削减AI滥用，带来“负责任的AI”、“无歧视的AI”，让AI平权成为可能。

正如此次大会的主题“ 让世界充满AI”，这也是联想集团董事长兼CEO杨元庆在会上强调的愿景。

大模型“焦虑症”

导演陆川，在联想科技创新大会上分享了一段他看到SORA后的焦虑：

ChatGPT一出现，我就感到一个新时代可能来临了，当我看了Sora系统生成的视频，确实焦虑了；就像是习武之人，别人在练“降龙十八掌”，而我在天天打沙袋。完全不是一个维度。元庆您能理解那种感觉吧？

（左为导演陆川，右为联想集团董事长兼CEO杨元庆）

自2022年底chatGPT一鸣惊人，到今年初SORA火爆出圈，生成式AI一直被看作是AI最终战胜人类的开始，但至今为止能使用到SORA的人类却少之又少，像陆川这样的人倒是不计其数。无论是在个体用户端还是产业端，生成式AI的高超能力与落地使用之间，一度陷入尴尬。

陆川说，他让团队从去年三月开始潜心研究AI的各类技术。一年后也就是4月18日在联想科技创新大会上，他展示了一个全部用AI技术制作的短片，十分震撼。这个短片实际的制作时间仅用了2天，但如果算上一年的学习成本，却也是一笔不小的投入。

大模型的使用者纷纷陷入焦虑，大模型的发明者们也好不到哪儿去，他们不断喊出，大模型应该加速走下云端、走到终端，才能真正发挥它应有的价值。谷歌、阿里等中外大模型厂商从今年起已加大端侧大模型的投入力度，并推出相关模型，如谷歌Gemma 2B端侧大模型，但大多是雷声大、雨点小，真正落地终端还存在诸多障碍。

公共大模型因为体积问题，很难在端侧落地，即便是压缩后的端侧大模型对硬件要求也极高。比如Gemma2B至少需要硬件配备8GB以上显存（GPU）才可以被调用，而手机目前是没有独立显存的。就算是PC，也需要匹配过硬的性能，也就是联想一直强调的五大特征聚齐才能是真正的AI PC，联想自己也才是刚刚才发布这样的AI PC。

大模型无法下放到终端，意味着人工智能无法做到真的懂你，也就谈不上“智能”，而只是一项技术，就像陆川那样需要先学习1年的时间，这个门槛很高。因为人工智能是由数据、算力、算法共同驱动完成的一项技术，如果不下放到终端，人工智能就没有可用的个性化数据，这是它“不智能”的关键，再强的算力、算法也是枉然。

如果想要公共大模型在尽可能完整的数据基础上做闭环推理、决策，个人或企业还需要将自己的数据资料上传到云端，这就又涉及到数据安全和隐私保护层面。用户上传数据之后，就必然允许这些要素成为公共信息的一部分。这在把保护客户信息当作天条的金融服务行业中，是不可想象的。

除此之外，大模型本身在技术层面也存在很多局限性。今天的大模型没有真正地理解语言和理解世界，也没有推理和规划能力。它只是根据高维语义空间的联合概率模型，来连接它之前见过的海量信息片段。举个例子，我们问大模型, 在150和250之间，有多少质数？它完全无法理解。如果你跟它说，你先把150到250之间的所有质数列出来，然后再数一数总共有多少个。这次大模型就会说18个。

在应用层面，大模型还受到了网络速度、云端效率和成本考量等多方面的限制。有研究表明，公共大模型每一次的查询成本达到了传统搜索的10倍之高。大模型很贵，仅电费就令人咂舌。以ChatGPT为例，它每天响应大约2亿个请求，在这个过程中消耗超过50万度电力，相当于1.7万个美国家庭的用电量。马斯克曾发出担忧，人工智能的发展可能导致人类电力短缺。端侧大模型带来的终端耗能，也需引起关注，一台笔记本的电量可能都无法支撑几次大模型的调用。

不可否认，大模型是人工智能底层核心技术飞跃发展的成果，它是人工智能普及的催化剂和加速器。但技术问题、获取成本问题、安全问题，都已将很多人拒之门外，大模型带来的社会“焦虑症”，到了不得不解决的时刻。

混合式人工智能系统化重构AI

技术推动人类文明的发展，都需要一段时间的演进过程。

电，从被发明出来到流向千家万户，经历了从单点工具化，到全社会系统化改造的漫长过程。最初，可能将用蒸汽作为动力的设备，做节点改造，让它可以替代蒸汽提升效率；后来，将整个设备做了重新设计，让它更适合用电；最后，人们又设计了电力系统，整个社会体系甚至都围绕电做了重新构建。

人工智能，正在开启同样的历史进程。杨元庆提出的混合式人工智能，原理就是系统化地应用大模型、重构AI，让AI顺利流向真正需要的地方，完成AI时代的底层改造。

联想集团在公共大模型之外，以自研技术与大模型厂商合作开发出个人大模型、企业大模型，部署在智能终端和边缘侧，让大模型真正的了解每个人和每个企业的个性化需求，实现个性化的推理、决策。而更具革命性意义的是，联想还自研了个人智能体与企业智能体，将大大降低生成式AI的使用门槛。

个人智能体，内嵌于智能终端，比如电脑、手机、平板、头显乃至汽车，通过自然语言交互，调用个人大模型、本地知识库，意图理解个人用户需求，并给出反馈结果。甚至于主动行动，比如提醒用户制定家庭度假计划，及时下单补充日用品储备等等；或根据你的思维模式和行为频率预测下一个任务，主动提出建议。

企业智能体，内嵌于企业内部多个终端设备（如员工电脑）或基础设施中，能够存储、学习大量的本企业数据并进行推理，在保障信息安全的同时，通过自然语言交互的方式，支持企业运营决策，反馈用户需求。如果遇到台风，企业智能体就会主动提示决策者，哪些产品及零配件会遇到什么问题，并给出解决问题的具体办法。

由于调用的是本地知识库、本企业数据，个人大模型和企业大模型，因此个人智能体和企业智能体会越来越懂用户需求，他们会变得越来越聪明、高效。杨元庆认为，个人智能体将“甚至超越每个人的寿命，永存于世，让人类实现另一种意义上的永生！”

清华大学人工智能产业研究院院长、中国工程院院士张亚勤表示认同：“智能体更接近于人类，对于个人应用来说就是真正的智能助理，对于企业应用来说，把现代复杂的运营和管理系统最大效率地调动起来，将极大地提升运营效率和生产力水平。”

此外，联想集团还在研究大模型增强技术，包括“意图理解”、“异构计算”、“智能问答”、“隐私安全”等四类技术，让基础大模型意图理解更精准、执行时间更短、问答效果更好、实现硬件级的安全保护。

虽然联想没有基础大模型，但它从自己擅长的终端着手，设计混合式人工智能技术架构，让大模型真正有“用武之地”，让人工智能真正“开箱即用”，这正是当下社会、产业所急需的底层构建能力。

全栈业务支撑未来落地

杨元庆承诺，个人智能体是联想智能设备出厂的一个标配。他说：“我们在产品设计阶段就可以采用自研的模型压缩技术，在出厂的智能设备上内置个人智能体。这样，用户就可以在设备端实现人工智能推理功能。”

联想今天发布的六款真AI PC仅仅只是开始。作为全球PC市场占有率多年的王者，再加上智能手机、平板电脑的全球领先地位，联想集团拥有绝对的底气以设备的规模量，去完成阶段性的人工智能普及。

相对于个人来说，企业端的人工智能普及更复杂一些。首先数据收集的端侧就涉及到电脑、工控机、智能网关、摄像头等，其次是智能基础设施，包括边缘侧设备、存储、服务器，以及网络传输等。

当日联想发布了“万全异构智算平台”，专门解决混合式人工智能中混合算力调用的关键问题。同时推出算力魔方技术、GPU内核态虚拟化技术、集合通信算法库、分钟级断点续训技术、以及跨集群超级调度器等5大技术，以解决越来越复杂的集群配置、断点难续的问题，为混合式人工智能注入永续不断的底层动力。

同时，联想还建立了一支人工智能专业服务团队，解决混合式人工智能“最后一公里”落地的问题。这个团队已经开始工作，现场展示了其正在为吉利集团及旗下路特斯跑车开发车内智能体。联想认为，不同的行业有不同的智能体，同一个企业也需要针对不同业务场景的企业智能体，比如有营销智能体、供应链智能体、服务智能体等等。

智能设备、智能基础设施、智能解决方案和服务，联想集团三大业务群将以全栈人工智能的身份定位，支持混合式人工智能落地到个人和企业。这也是联想集团多年布局端-边-云-网-智新IT技术架构的成果。

除此之外，联想集团也在积极与合作伙伴一起做大AI生态。联想一直以来与其他科技企业最大的不同是，永远保持着开放、合作、共赢的姿态建设生态。有业内人士曾评价，无论是“互联网+”还是“人工智能+”，很多企业都是试图把客户、用户加到自己的平台，做大自己的平台，但联想不是，它愿意把自己的能力加到客户和用户身上。

杨元庆答应陆川，一起建立AI影像实验室，让人工智能更好地赋能创作者经济，帮助陆川实现理想：AI可以帮助万千有电影梦的年轻人，跨越资金的门槛，直接呈现头脑中那部伟大的电影。

AI伦理与前景思考

“AI其实是增强，而不是取代人类的智能。”这是杨元庆的判断。

生成式AI的飞速发展，曾带来诸多的伦理问题、法律问题，AI被滥用、失控的情况多有发生，AI的威胁论、霸权论也时常上演。

联想在构造混合式人工智能时，就已经预设了AI应该是“负责任的AI”、“非歧视的AI”。它强调个性化数据的推理、决策，但也重视数据和隐私安全，没有用户授权，绝不上传云端，是硬件级的隐私阻断。从这个角度来说，联想混合式人工智能拥有科技向善的力量，若大规模应用或能真正抵消社会对AI的负面情绪。

此外，杨元庆始终强调的是，推动整个产业生态系统的成长，在开发和应用的各个环节，都能保证人工智能的普惠性、公正性和包容性，让人人都能从人工智能的发展中获益，从而打造一个“让世界充满AI和爱”的可持续发展的美好未来。这一愿景让人们看到期盼已久的技术平权，也有可能真正消除当下严重的平台化虹吸效应。

联想集团已经拥有了40年的成长经历，对AI也有着超10年的坚定投入与布局。AI是一项长跑项目，AI与实体经济连接才能产生化学反应，带动社会的科技平权，联想集团的长期主义与双实企业身份占有很大优势。

混合式人工智能、全栈人工智能便是联想集团前瞻性战略布局的最大成果，也带有正向的AI伦理价值观导向，但如何驾驭这一庞大的技术架构体系，如何让每个节点都开出AI之花，将是联想集团接下来10年面临的重要任务。（来自公号：热爱AI Next）

联想混合式人工智能，解困大模型下放之路

作者：陈庆春