某行测算了GPT-5和GPT-6训练所需算力,GPT-5核心假设:8.8-17.6万亿参数、65T-130T token。由于参数量和数据量的增长是5-10x,总算力的消耗相比GPT-4就是25-100x,大概需要20-30万H100,训练4-6个月时间。GPT-6,基于Blackwell以及再下一代Blackwell+1、Blackwell+2的算力需...