聊聊商汤日日新大模型

发布于: 雪球转发:0回复:1喜欢:2

商汤科技在4/10的技术开放日发布子商汤"日日新"大模型,包括"商量"大语言模型,"如影"(AI数字人),"秒画"(AI图片内容创作),“琼宇"及"格物"(3D物体的复刻),比较有特色的几个地方:

=> “实时学习"并同步反馈结果,这是当前AI应用的一个痛点,商汤从演示的两个场景给个印象深刻:场景1是港风的新照片实时学习实时出效果,场景2是无人机实时捕捉画面并实时更新3D模型。这种能力有利于快速普及个性化应用。

=>"上下文学习"能力,这也是商汤科技本次发布会最大亮点,体现了更好的交互性,从问诊交互场景、小猫故事等,这种多轮对话技术在商汤大模型中体现的非常充分。

=>大装置真的很强大:商汤超算中心AIDC是亚洲目前最大的超算中心,2.7万块GPU的部署并实现了5.0 exaFLOPS的算力输出能力,公司年内将实现万亿级参数的训练。

=>面向智慧飞轮的基模型:这个相对比较抽像,可以这么理解,GPT-3是ChatGPT的底层模型,商汤为支持强大的多轮对话及实时学习的能力,增加了一个基模型,可以理解为语义模型层。

商汤这家公司一直以来是超市场预期,最早的CV领域四小龙商汤并不占优,算法最腻害是旷视,也没有云从国家队背景。但商汤在技术创新及产品思维是四小龙中最出色的,它是第一家进入二级资本市场,它的营收是四小龙最高的,同时也是最早推出大模型的。

商汤日日新大模型充分发挥了商汤视觉领域的优势,图片及3D生成的效果很惊艳,同时也找准了自己的产品差异化定位:日日新。华为盘古大模型发力点在工业领域的科学计算,百度文心一言的优势点在NLP。说到这,一直以认知见长的科大讯飞,将会带来怎么样的大模型,非常期待。

ChatGPT时代,一定是产品为王的时代,为客户提供什么样的AI服务,商汤的谋篇和布局渐次清晰,行至远,见至美,期待商汤。

$商汤-W(00020)$ $科大讯飞(SZ002230)$ $三六零(SH601360)$ 

全部讨论

谁见过日日新大模型?总说超越gpt4,可是连个产品都没见过。