98运气选手 的讨论

发布于: 雪球回复:5喜欢:31
鸿博股份,我是AI行业从业者, 别看其他服务器厂商也能提供算力,但就效率来说,AI需要的算力是极致的高端算力,其他老牌服务器厂商比如商汤大部分算力我推测仍然是V100这种几年前的算力,他没有新的计算单元,没有办法做极致的加速,英伟达背书的DGX可以说吊打全中国其他的架构; 从结果来看 百川大模型 在这么短的时间从研发到上线能做到国内同参数规模能力的No.1,离不开英博数科的支撑

热门回复

2023-06-22 07:35

百川能上线这么快是因为直接把LLaMa拿过来改了一下 所以快。就你还AI行业从业者?而且7B的模型 为什么上线快 而且大家都在做 是因为能在3090上训练 所以大家都在做7B的模型。不要为了唱多而唱多

2023-06-22 19:23

确实是的 这些东西都很重要 但是股市真的要理智 如果他后续做更大参数的模型 那对于鸿博是绝对的利好 但是目前来看 还是要慎重 虽然节前涨了不少 理性分析吧

2023-06-22 16:06

…..7B的模型用3090就能训练,和DGX框架没关系,而且大模型强不强靠的是数据质量,除非你是超大模型,比如万亿级,那么算力是非常重要的,就他这个7B的真不用多少算力,建议你去了解一下你就明白了,7b的模型训练一个真的很便宜。而且LLaMa开源的,就是所有人都可以训练,但是你有没有钱训练?你有没有数据喂给大模型?只要你有钱,你有质量高的数据,你有能微调模型的人,随便就训练一个7B的了。这是MOSS的团队说的,马上7月要出一份深度报告,针对大模型的,就包括我现在告诉你的这些内容,建议你关注一下。

那其他人不也可以直接改一下LLaMa就可以用了吗? 本质上还是算力的优秀可以快速的完成迭代,至于3090训练模型只能说,学校或者微小公司可以这么做

这种抱人大腿的垃圾只适合赌博,