发布于: Android转发:0回复:20喜欢:0
$农尚环境(SZ300536)$ 在住院期间,MATE推出了llama 3,在医院里没时间研究这个目前最强大的开源大模型llama 3,今日晚上花了点时间去研究了一下这个llama 3 ,着重说几点吧
第一:llama 3是目前最强大的开源大模型 国内的大模型基本都是基于llama 3去预训练 然后在上面做微调的
第二:llama 3 80亿参数的小模型 性能吊打llama 2 700亿参数的大模型
第三:llama 3的 700亿参数的大模型数据 已经追平了谷歌的王炸 Gemini 1.5 PRO 性能直逼 GPT 4.0
第四:网上有的下载 llama 3 80亿参数的模型 不要去试 相信我 你的显卡和CPU会烧掉的
第五:基于国内的大模型 都是基于llama 3去预训练和微调 那么接下来重点来了
国内 1-2个月后 大模型会像雨后春笋一样迅速大爆发!
哪些产业链会直接受益?
一:AIDC 算力中心 无可厚非
二:推理服务器 大模型大爆发 带来的C端体验用户大爆发 就像3月份的KIMI一样 C端用户流量大爆发以后 推理服务器的需求会几何倍数的爆炸
所以!走推理服务器这条路,没错!
我从不怀疑林峰的眼光 llama 3 或者以后得llama4 可以节省很多的训练服务器,因为参数变小 架构算法优化以后性能更强 ,需要在训练端的服务器需求 势必变小
而推理端不一样,推理端是面向C端用户,C端用户越多,需要的推理服务器就越多,当然科技在进步,技术在迭代,随着时间的推移,后面推理性能,随着算法优化进步,推理更智能,更有情感,重要性不言而喻

全部讨论

今晚出业绩了 慌得一笔

04-22 11:13

有实时交流的地方吗

是META啊,你说MATE,搞得我一下以为是华为搞出来的。那推理服务器,国内上市公司不知道有哪些收益的?不会炒寒武纪吧?

寂寞兄,应用端有公司推荐吗?或者国内应用端还是腾讯,头条之类?连月之暗面,都只能依附

04-26 22:07

这个跟农商没什么关系

04-22 18:08

训练太难,走推理符合现实。

04-22 14:04

寂寞兄,组个群聊怎么样?