淘天自研大模型“淘宝星辰”已经上线官网,这也是淘天集团公开的首个自研大模型。据悉,星辰大模型基于Transformer架构,采用半自研的Megatron-ama框架进行训练,从海量电商消费数据和公开数据中持续学习,提供电商和生活服务场景增强的文案生成、多轮会话、知识问答、智能决策等能力。
发布于: | 雪球 | 转发:0 | 回复:0 | 喜欢:0 |
淘天自研大模型“淘宝星辰”已经上线官网,这也是淘天集团公开的首个自研大模型。据悉,星辰大模型基于Transformer架构,采用半自研的Megatron-ama框架进行训练,从海量电商消费数据和公开数据中持续学习,提供电商和生活服务场景增强的文案生成、多轮会话、知识问答、智能决策等能力。