谢谢你的回复,你的三个层级的概述非常到点子。AI引发的通讯互联,最大的变化是从传统的spine tree 结构,通过两三个hops的互通,到点到点的直接互联。第三级的柜子间的互联,在100G以下的,还是有不少铜连接的。第二级机柜内的互联一直是用铜线的。NVL72能在200G仍然用铜线,铜进,我在今年OFC 上能现场感到光学界的失望。一是打破了高频一定要用光的预测,另外72个柜内GPU间点到点的铜互联网,会减小第三级光互联的增长率。但我的观点,铜线在NVL72 的增量是对铜线等级的提升和绝对量的增加,但据说用了两英里长铜线也说明铜线的限制。想象一下,若是NVL144,144个GPU点到点的直连,增量是平方级的,估计机柜连重量也承受不起,尽管铜线便宜,没有额外耗电,最低的时延。所以,今年OFC感到失望同时,整个会展还是因为AI而兴奋,点到点互联的要求,在第三级的光需求已经促进了光模块指数级的需求,旭创和新易盛的最近季报就能显示。同时,光集成和CPO,哪个大厂不在研究,Nvidia和AMD,哪个不在看第二级柜子内芯片间的光互联,只是什么时候的问题。
另外我觉得液冷和气冷的解决方案也和铜和光的选择有些类似。Arista的Andy去年的OCP会上,花了大幅篇幅谈论cooling, 说到将来系统的大小和功能会取决于如何把芯片散热,液冷绝对是必经之路。但是现时还是能air cooling,不会用到液冷,成本、系统复杂度多会有考量。
上周四TSMC 在2024 North American Technology Symposium上也谈到了他们对于你概括的第一级和第二级的规划,增大芯片尺寸和支持光的CPO. 网页链接