发布于: 修改于: Android转发:0回复:0喜欢:0
在雪球居然能看到大模型推理的文章,还有batchsize,GQA,MLA这些kv cache优化策略。点个赞,我就正在找这个方面的工作。
引用:
2024-05-09 18:00
(声明:本文不是幻方软文,纯个人感想)
除了DeepSeek那篇官号文章,几乎没太多声音,尤其我看几个专业的AI号甚至都没报道,这属于严重低估了...(或者人家故意不宣传)。总之一句话, DeepSeek v2非常值得重视....
为什么被Semianalysis大哥在最新文章中高亮点名,因为真的有点离谱了...