发布于: iPhone转发:0回复:0喜欢:0
Mark
引用:
2023-11-14 08:56
英伟达新款H200相对上一代只提升了显存(96GB提至141GB)和带宽(3.35TB/s至4.8TB/s)。
参考昨天文章,推理侧已经开始加速,这款算力卡主要就是用于模型推理,预计综合降本幅度在6X,与上周OpenAI开发者大会提及的内容匹配。
再结合前阵子出的H20,同样通过提升显存的方式来弥补算力,由...