云厂商混战大模型,有人突然亮出王炸!

发布于: 雪球转发:0回复:0喜欢:0

大模型时代的“新王炸”来了

就在昨天

百度发布了一个划时代的产品

大模型时代的智能计算操作系统

百度智能云万源

为什么说这是个「划时代」产品?

只因,时代大变样了

传统IT时代,我们有Linux、Windows

云计算时代,我们有云平台、云操作系统

如今,大模型、AI原生不可阻挡

我们同样需要一个为这个时代而生的

「智能计算操作系统」

而「万源」恰好应景而生

成为业界首个“下一代智能计算操作系统”

「万源」的整体架构

主要分为三层

①内核层②Shell层③工具层

传统OS要运行在PC或服务器上

万源同样也要运行在基础设施底座上

这个底座,也就是上个时代云基础架构

不过,除了传统云服务存算网能力

还要额外增加智算基础设施

第一层,内核Kernel层

再往上,就是操作系统最关键的第一层

也就是Kernel,内核层

玩过Linux的小伙伴都知道

Kernel相当于操作系统的基本盘

内核稳不稳,架构好不好,决定了OS下限

而「万源」的Kernel层

则包括了两大部分

百度百舸·AI异构计算平台

百舸的核心能力

是把底层复杂的云原生基础架构隐藏掉

云基础设施已经很复杂了

为支撑智算,还要引入海量算力芯片

比如,训练一个好的大模型

通常需要调度万卡规模的算力集群

这对只善于操控通用算力的传统云平台来说

集群设计、调度、容错,都是绝大挑战

而百舸可以轻松操控上万张算力加速卡

如同一张卡一样,协同工作,线性扩展

有效训练时长占比,达到98.8%

线性加速比和带宽有效性超过95%

同时,由于智算芯片供应的不稳定性

实际使用中,必须考虑多芯片异构

摆脱对单一特定芯片的依赖

从而规避供应链风险

如今,在百舸平台上,已经实现了

百卡规模、单一任务下异构芯片混合训练

而且把性能损失控制到了极限

也就是说,百舸做到了屏蔽芯片间差异

让用户自由选择不同芯片组合

❷各种预置大模型

内核的另一个重要组成是大模型

预训练大模型是AIGC时代的灵魂

万源kernel层内置了各种大模型

(强大的ERNIE4.0、3.5,轻量级的ERNIE Speed/Lite/Tiny,文心视觉大模型,第三方大模型)

只要开发者对大模型有想法

内核层都能兜底

第二层,Shell层

搞定内核,就如同打通了底层逻辑

那么,对用户来讲,如何调用内核呢?

传统OS有Shell,万源也不例外

千帆ModelBuilder就相当于这个Shell层

帮助用户实现内核调用和模型二次开发

ModelBuilder提供模型精调工具

用户可以轻松对基础模型进行精调

而不需要从头训练大模型

甚至只需要基于Prompt工程

就能多快好省搞出适合自己业务的模型

同时,ModelBuilder可基于MoE模式

根据具体任务的难度

灵活选择和组合内核中的最合适模型

实现效果和成本的最优组合

平均推理成本降低30%以上

第三层,开发工具层

接下来,到了最上一层:工具层

可理解为传统OS里的应用软件/工具软件

在大模型时代,万源OS提供的是黄金组合

AppBuilderAgentBuilder

它们都是强大&易用的应用开发平台

集成工作流编排、管理插件

快速开发AI原生应用和智能体

开发者不需要像以前面对传统OS

要掌握Python、C、Java各种语言

只需要基于两大“Builder”

采用“拉家常”般的自然语言

就可以实现快速开发、轻松上线

这样,万源从内核到Shell到开发工具

已经实现了层与层之间的有机结合

对比传统OS的结构,我们可以看到

大模型时代的全新操作系统

有内味儿了

不过,「万源」还在持续进化ing

对于开发者(包括普通人)来说

他们可以忽略所有智算基础设施复杂性

也包括各种语言和架构的复杂性

只需要面对万源,进行极简人机交互

所想即所得,所Prompt即所得

而对于百度智能云的广大伙伴和客户

同样可以一步跨越两代OS

在「万源」之上

用AI原生应用和智能体,重塑数字世界

正如百度智能云沈抖所说

“简单是终极的复杂”

百度正在用自己对云、对AI的深厚理解

一步步,踏平各种复杂,奉献极致简单

让智能,生成无限可能