发布于: | 雪球 | 回复:5 | 喜欢:31 |
百川能上线这么快是因为直接把LLaMa拿过来改了一下 所以快。就你还AI行业从业者?而且7B的模型 为什么上线快 而且大家都在做 是因为能在3090上训练 所以大家都在做7B的模型。不要为了唱多而唱多
确实是的 这些东西都很重要 但是股市真的要理智 如果他后续做更大参数的模型 那对于鸿博是绝对的利好 但是目前来看 还是要慎重 虽然节前涨了不少 理性分析吧
…..7B的模型用3090就能训练,和DGX框架没关系,而且大模型强不强靠的是数据质量,除非你是超大模型,比如万亿级,那么算力是非常重要的,就他这个7B的真不用多少算力,建议你去了解一下你就明白了,7b的模型训练一个真的很便宜。而且LLaMa开源的,就是所有人都可以训练,但是你有没有钱训练?你有没有数据喂给大模型?只要你有钱,你有质量高的数据,你有能微调模型的人,随便就训练一个7B的了。这是MOSS的团队说的,马上7月要出一份深度报告,针对大模型的,就包括我现在告诉你的这些内容,建议你关注一下。