$农尚环境(SZ300536)$ 在住院期间，MATE推出了llama 3，在医院里没时间研究这个目前最强大的开源大模型...

发布于:2024-04-21 02:33

Android

转发：0

回复：20

喜欢：0

$农尚环境(SZ300536)$ 在住院期间，MATE推出了llama 3，在医院里没时间研究这个目前最强大的开源大模型llama 3，今日晚上花了点时间去研究了一下这个llama 3 ,着重说几点吧
第一：llama 3是目前最强大的开源大模型国内的大模型基本都是基于llama 3去预训练然后在上面做微调的
第二：llama 3 80亿参数的小模型性能吊打llama 2 700亿参数的大模型
第三：llama 3的 700亿参数的大模型数据已经追平了谷歌的王炸 Gemini 1.5 PRO 性能直逼 GPT 4.0
第四：网上有的下载 llama 3 80亿参数的模型不要去试相信我你的显卡和CPU会烧掉的
第五：基于国内的大模型都是基于llama 3去预训练和微调那么接下来重点来了
国内 1-2个月后大模型会像雨后春笋一样迅速大爆发！
哪些产业链会直接受益？
一：AIDC 算力中心无可厚非
二：推理服务器大模型大爆发带来的C端体验用户大爆发就像3月份的KIMI一样 C端用户流量大爆发以后推理服务器的需求会几何倍数的爆炸
所以！走推理服务器这条路，没错！
我从不怀疑林峰的眼光 llama 3 或者以后得llama4 可以节省很多的训练服务器，因为参数变小架构算法优化以后性能更强，需要在训练端的服务器需求势必变小
而推理端不一样，推理端是面向C端用户，C端用户越多，需要的推理服务器就越多，当然科技在进步，技术在迭代，随着时间的推移，后面推理性能，随着算法优化进步，推理更智能，更有情感，重要性不言而喻