智算中心建设的企业主体则包括三大电信运营商和部分互联网企业。运营商推动建设的智算中心具有一定公共服务属性,成为政府主导的算力基础设施建设的良好补充。以百度、阿里、腾讯为代表的互联网企业也纷纷建设智算中心,以推动自身业务发展、更好地推动客户人工智能场景落地。
前瞻结合至顶智库统计,截至2023年8月,中国已投入运营和在建的智算中心分布在北京、上海、南京、杭州等多个城市。从区域分布来看,中国智算中心集中于东部地区和中部地区。其中,东部地区智算中心数量达25个,占比62.5%,*,以京津冀和长三角地区为主;中部地区占比17.5%,排名第二;西部和东北地区的智算中心数量占比分别为12.5%和7.5%。
值得注意的是,北京是发力智算中心的主要地区之一。北京在海淀、朝阳、经开区、石景山、门头沟、大兴、丰台等区均布局智算中心,目前已建成智能算力总规模约5000P。
近日,石景山区北重科技文化产业园的四跨厂房已开启火热的改造施工,建成后初期将具备610P的算力,相当于30万台高性能电脑的计算能力,可供一个人工智能大模型在30秒内完成对近1000万张图片的学习和识别,预计今年10月即可建成投用。
刚刚开年就动作频频
新年伊始,各大运营商便积极行动起来,纷纷加强在智能计算中心领域的布局。
1月8日,中国移动智算中心(武汉)在武汉未来科技城开放运营,已建成1500PFLOPS服务能力,到今年底计划扩容至6800PFLOPS,成为华中地区规模*的智算中心。
1月22日,上海电信在上海点亮“大规模算力集群暨人工智能公共算力服务平台”,计划2024上半年在上海规划建设到达15000卡,总算力超4500P,其中单池新建国产算力达万卡,预计成为国内*超大规模国产算力液冷集群。
1月30日,中国联通人工智能创新中心成立仪式在京举行。值得注意的是,2023年11月24日中国联通长三角(芜湖)智算中心项目才正式开工。
可以看到电信、移动、联通三大电信运营商正在聚力“东数西算”数据中心集群建设,全力推进各自相关项目,加快打造全国算力中心城市和智算中心,促进数字经济与实体经济深度融合。
04
AI服务器是智算中心建设中最关键的设备
AI服务器是智算中心建设中投入比重*、最为关键的设备。
据市场研究机构IDC的最新报告显示,从2022上半年到2023年上半年,中国AI服务器市场规模成长了54%,其中GPU服务器依然是主导地位,占据92%的市场份额,达到30亿美元。同时NPU、ASIC 和 FPGA等非GPU加速服务器以同比17%的增速占有了8%的市场份额,达到2亿美元。
2023年上半年,从厂商销售额角度看,浪潮、新华三、宁畅位居前三,占据了70%以上的市场份额;从服务器出货台数角度看,浪潮、坤前、宁畅位居前三名,占有近60%的市场份额。
AI服务器依赖高性能芯片供给。中国市场面临的算力缺口给国内的芯片发展带来新的机遇。中国本土的AI芯片厂商发展正处于快速增长的阶段并取得了显著的成就,吸引了大量的投资和关注。这些企业在AI芯片设计、算法优化、生产制造等方面具备了一定的实力和竞争优势。此外,中国政府的政策支持也起到了重要的推动作用。2023年上半年,中国加速芯片的市场规模超过50万张。从技术角度看,GPU卡占有90%的市场份额;从品牌角度看,中国本土AI芯片品牌出货超过5万张,占比整个市场10%左右的份额。
从国产AI服务器所需的AI加速芯片的供应商来看,目前国内阿里巴巴(含光系列)、百度(昆仑系列)、华为(昇腾系列)等云服务提供商都有自研的云端AI加速芯片。还有寒武纪(思元系列)、海光信息(深算系列)、燧原科技、天数智芯、壁仞科技、摩尔线程、沐曦等。此外,景嘉微、龙芯中科等也在研发云端AI加速芯片。
从2023年上半年的数据来看,中国AI服务器芯片国产化率较去年出现了下降,比例从去年的15%左右下降到10%左右。这主要是因为高端训练服务器的需求大幅增长,而国产芯片性能难以跟上。
为了进一步提升国产AI服务器的性能,不仅需要芯片厂商在技术上持续创新,提高芯片的性能和稳定性,还需要这些芯片厂商深入了解市场需求,开发出更符合实际应用场景的芯片产品。同时,政府、企业和研究机构也应加大投入,支持国产芯片产业的发展,为其提供更多的研发资源和市场机会。
05
如何让智算中心真正用起来?
智算中心建成后,如何令其在运营过程中发挥更大的作用,依旧是一个非常关键的问题。
当下智算中心已逐渐赋能区域产业集群发展,但值得注意的是,其在多元算力融合、上下游协同、建设应用联动、能源消耗、使用价格等方面仍面临诸多挑战。
比如:通用算力和专用算力还有待融合。在自动驾驶、智慧医疗、智慧城市等不同场景中,算力需求不同。单一化算力方案难以满足多元算力需求,不能兼顾多产业和多领域。
算力、算法和数据协同不足。这些年来建设的智算中心,不同的芯片平台、算法模型、数据库、应用层面部分处于垂直一体化“孤岛”状态,软硬件兼容性问题有待改进。
投资建设运营有待联动。智算中心投资、建设和运营往往由不同主体负责。前期建设单位往往对建设后运营的模式、服务标准投入不足,出现了管头不管尾、建设运营割裂的现象,影响客户体验。
碳排放和能耗高。设备自身的能耗排放带来非常大的挑战,比如OpenAI公司的超大规模预训练模型GPT-3训练所需的耗电量为19万千瓦时,相当于2021年人均用电量的228倍。
投资成本和应用价格待规范。智算中心的投建成本较高,部分智算中心每 100P半精算力的投资成本高达5亿-6亿元,远远高出正常市场价格,同时使用成本也较高,比如据保守估计GPT-3大模型训练费用超过1200万美元。
智算中心建设需要结合建设基础、当地或区域产业特色,分类引导施策,改建并行,发展与数字经济相适应的智算中心;还需要选择合理的建设和运营模式,实现长效运营、促进有序布局,保证智算中心所释放的经济社会效益*化。
如今中国智算中心产业发展正在克服1.0时代的挑战进入2.0时代,中国在智算中心的建设中,始终坚持以算力融合、软硬协同、建运一体、能耗低碳、成本优化、需求牵引、安全可信为基础,稳步推进智算中心的发展。
以上不构成投资建议。
文章转自:公众号半导体产业纵横