吃烧烤架

吃烧烤架

他的全部讨论

讨论

你把我小米放哪儿!

讨论

回复@沃伦巴菲特比尔盖茨: 那必须的,商汤已经入门。chat gpt5。。。中国也没那么多卡搞啊。只能多讲讲行业落地。就在今年了。//@沃伦巴菲特比尔盖茨:回复@贾志堃:也许经过一段时间调整、会变好的。确实不比gpt4差、因为它也不好。生成代码、生成图片、应该是国内领先的

讨论

回复@光彩夺目之希德尼: 这是api接口试用,面向开发者的。。。又不是面向普通用户的。//@光彩夺目之希德尼:回复@贾志堃:试用时,让用户自己设置参数本身是一种不明智的行为,如果用户用足够的技术和能力,完全可以选择各种开源模型自己微调,根本没必要用这个

讨论

回复@在迷茫中救赎: 联合研发,各取所需。
但是有个道理你可以思考:小爱团队短时间内搞不定,只能找有这个技术的人来处理,商汤经受住了雷神严选,其他家被淘汰。
商汤排面拉满,直接坐上了雷神战车。
故事就是这么个故事。
对的,同样的故事还发生在wps。
搞大模型,在其他...

讨论

回复@赚点小钱----: 对,chat版本微调出来后侧重通用型对话。
商量版本5.0大概率跑不出来他们发布的那个跑分。估计那个分是原始底模跑出来的,但是没法拿出来直接当聊天机器人。
跑分这事,是可以在一定程度上作弊做专项优化的。
但是从我自己遇到的一些细类问题测试上看,商量的MoE,...

讨论

回复@贾志堃: 猜的,他们没给详细说明。之前我没看到。//@贾志堃:回复@沃伦巴菲特比尔盖茨:他们的关系虽然没有明说,但是可以推测: 日日新5.0底模—》 精调商量5.0—》 量化上线班商量5.0 量化版5.0估计性能损失3%-7%左右。

讨论

回复@沃伦巴菲特比尔盖茨: 他们的关系虽然没有明说,但是可以推测: 日日新5.0底模—》 精调商量5.0—》 量化上线班商量5.0 量化版5.0估计性能损失3%-7%左右。//@沃伦巴菲特比尔盖茨:回复@赚点小钱----:商汤日日新sensechat5应该就是商量了吧

讨论

回复@沃伦巴菲特比尔盖茨: 商量不是5.0//@沃伦巴菲特比尔盖茨:回复@赚点小钱----:商汤日日新sensechat5应该就是商量了吧

讨论

回复@沃伦巴菲特比尔盖茨: 看商汤只看这一层逻辑啥估值都支撑不了。我们自己调大模型,发现的大难点:
将行业数据调整成虚拟训练数据,然后训练到对话模型中去。
这条路当中有很多技术细节,商汤明显是做了一套工具链。
做出来这套工具链需要:
1,理论支撑,
2,算力支撑,

讨论

试试大模型小爱,原始chat日日新没精调过。

讨论

老哥,你参数没设置对。

讨论

回复@明了的股价小黄昏: 多去看看智算中心的建设,大都是建好了卡塞不满。商汤这个大装置单一智算中心已经占了全国10%智算算力。//@明了的股价小黄昏:回复@荞面的战争:面对美国的围剿,中国人工智能发展的门槛会抬高,其次,商汤的算力建设早就完成了最复杂的第一阶段12000p,
而且针对美国的...

讨论

这是过期新闻。

讨论

智驾部分是小米自研的,小爱是用商汤的技术搭建起来的。