发布于: 雪球转发:0回复:0喜欢:0
如果看好,越跌越买不是更符合自身利益?
引用:
2024-04-21 19:25
先说个干货
某行测算了GPT-5和GPT-6训练所需算力,GPT-5核心假设:8.8-17.6万亿参数、65T-130T token。由于参数量和数据量的增长是5-10x,总算力的消耗相比GPT-4就是25-100x,大概需要20-30万H100,训练4-6个月时间。
GPT-6,基于Blackwell以及再下一代Blackwell+1、Blackwell+2的算力需...