云厂商混战大模型，有人突然亮出王炸！

作者：IT特大号

发布于:2024-04-17 16:15

雪球

转发：0

回复：0

喜欢：0

大模型时代的“新王炸”来了

就在昨天

百度发布了一个划时代的产品

↓

大模型时代的智能计算操作系统

百度智能云万源

为什么说这是个「划时代」产品？

只因，时代大变样了

传统IT时代，我们有Linux、Windows

云计算时代，我们有云平台、云操作系统

如今，大模型、AI原生不可阻挡

我们同样需要一个为这个时代而生的

「智能计算操作系统」

而「万源」恰好应景而生

成为业界首个“下一代智能计算操作系统”

↓

「万源」的整体架构

主要分为三层

①内核层②Shell层③工具层

↓

传统OS要运行在PC或服务器上

万源同样也要运行在基础设施底座上

这个底座，也就是上个时代云基础架构

不过，除了传统云服务存算网能力

还要额外增加智算基础设施

第一层，内核Kernel层

再往上，就是操作系统最关键的第一层

也就是Kernel，内核层

玩过Linux的小伙伴都知道

Kernel相当于操作系统的基本盘

内核稳不稳，架构好不好，决定了OS下限

而「万源」的Kernel层

则包括了两大部分

↓

❶百度百舸·AI异构计算平台

百舸的核心能力

是把底层复杂的云原生基础架构隐藏掉

云基础设施已经很复杂了

为支撑智算，还要引入海量算力芯片

比如，训练一个好的大模型

通常需要调度万卡规模的算力集群

这对只善于操控通用算力的传统云平台来说

集群设计、调度、容错，都是绝大挑战

而百舸可以轻松操控上万张算力加速卡

如同一张卡一样，协同工作，线性扩展

有效训练时长占比，达到98.8%

线性加速比和带宽有效性超过95%

同时，由于智算芯片供应的不稳定性

实际使用中，必须考虑多芯片异构

摆脱对单一特定芯片的依赖

从而规避供应链风险

如今，在百舸平台上，已经实现了

百卡规模、单一任务下异构芯片混合训练

而且把性能损失控制到了极限

也就是说，百舸做到了屏蔽芯片间差异

让用户自由选择不同芯片组合

❷各种预置大模型

内核的另一个重要组成是大模型

预训练大模型是AIGC时代的灵魂

万源kernel层内置了各种大模型

（强大的ERNIE4.0、3.5，轻量级的ERNIE Speed/Lite/Tiny，文心视觉大模型，第三方大模型）

只要开发者对大模型有想法

内核层都能兜底

第二层，Shell层

搞定内核，就如同打通了底层逻辑

那么，对用户来讲，如何调用内核呢？

传统OS有Shell，万源也不例外

千帆ModelBuilder就相当于这个Shell层

帮助用户实现内核调用和模型二次开发

ModelBuilder提供模型精调工具

用户可以轻松对基础模型进行精调

而不需要从头训练大模型

甚至只需要基于Prompt工程

就能多快好省搞出适合自己业务的模型

同时，ModelBuilder可基于MoE模式

根据具体任务的难度

灵活选择和组合内核中的最合适模型

实现效果和成本的最优组合

平均推理成本降低30%以上

第三层，开发工具层

接下来，到了最上一层：工具层

可理解为传统OS里的应用软件/工具软件

在大模型时代，万源OS提供的是黄金组合

AppBuilder和AgentBuilder

它们都是强大&易用的应用开发平台

集成工作流编排、管理插件

快速开发AI原生应用和智能体

开发者不需要像以前面对传统OS

要掌握Python、C、Java各种语言

只需要基于两大“Builder”

采用“拉家常”般的自然语言

就可以实现快速开发、轻松上线

这样，万源从内核到Shell到开发工具

已经实现了层与层之间的有机结合

对比传统OS的结构，我们可以看到

大模型时代的全新操作系统

有内味儿了

不过，「万源」还在持续进化ing

对于开发者（包括普通人）来说

他们可以忽略所有智算基础设施复杂性

也包括各种语言和架构的复杂性

只需要面对万源，进行极简人机交互

所想即所得，所Prompt即所得

而对于百度智能云的广大伙伴和客户

同样可以一步跨越两代OS

在「万源」之上

用AI原生应用和智能体，重塑数字世界

正如百度智能云沈抖所说

“简单是终极的复杂”

百度正在用自己对云、对AI的深厚理解

一步步，踏平各种复杂，奉献极致简单

让智能，生成无限可能