智算云生态|AI大模型时代,智算云如何破解算力供需难题?

发布于: 雪球转发:0回复:0喜欢:0

(记者 林婉玲)第七届数字中国建设峰会·2024智算云生态大会日前已揭开帷幕,同期还陆续举办了智算云论坛与行业大模型论坛。从其中,我们可以敏锐的捕捉到两个关键词“大模型”“智算云”。

(图片来源:摄图网)

2024年被公认为大模型应用元年,无论是B端还是C端,都呈现出加速快跑的姿势。随着大模型的发展,算力也成为了“避不开”的问题,智算中心更是成为了各地基建的新亮点,面对新形势,不得不问一句,“大建快上”是正确的吗?

大模型为高质量发展注入新动能

大模型,通常指的是在人工智能领域中,具有大量参数和复杂结构的神经网络模型。今年以来,我国人工智能大模型加快发展。据不完全统计,国产大模型数量目前已超过200个,覆盖多个行业领域,应用场景不断拓展,产业化应用落地提速。如,生数科技联合清华大学发布国产自研视频大模型,支持一键生成长达16秒、分辨率高达1080P的高清视频内容;国内车企推出多个搭载大模型的新款车型,在多感官交互、自动驾驶等方面不断优化用户体验;人形机器人接入大模型进行任务调度和应用开发,“学会”叠衣服、分拣归类等精细操作……

与此同时,AI大模型需求也正重整算力产业格局。

首先,AI大模型对计算资源的需求催生了对高性能计算(HPC)的大量需求。为了训练这些模型,需要大量的GPU、TPU或其他专用硬件来提供必要的算力。这不仅推动了硬件制造商开发更强大的计算设备,也促使云服务提供商扩展其计算资源,以满足不断增长的市场需求。

其次,AI大模型的普及和应用,正在推动算力资源的重新分配。企业和研究机构开始寻求更高效的算力解决方案,以支持模型的训练和部署。这导致了对云计算资源的大量投资,同时也促进了边缘计算等新兴技术的发展,以实现更快速、更本地化的数据处理。

此外,大模型的高能耗问题也引起了广泛关注。为了减少能源消耗和环境影响,业界正在探索更节能的计算技术,如使用低功耗硬件、优化算法以及采用可再生能源等。

可见,从硬件创新到云服务扩展,再到能源消耗,各个方面都在经历着深刻的变革。

AI急需的另一面,算力浪费

《论语》有句话,“治其器必求其用”。经世致用,是中国文化的传统之一。当前,全球进入了数字化、智能化的新纪元,算力作为核心生产力,带动算力基础设施的重要性上升到了新的高度,产业处于高速增长期。工信部的数据显示,目前,我国算力总规模超180EFLOPS,已经位居全球第二。

随着全国掀起的算力建设风潮,算力基础设施得到了快速发展,各行各业又存在着多元丰富的应用场景,但一系列挑战也随之显现:数据不均衡、算力集群效率低、模型可信度有待考验、云边端算力资源没有有效协同等问题,成为制约算力进一步释放的关键因素。

如何才能释放更多的算力?

首先,释放更多算力需要加强顶层设计和政策支持。政府和相关部门制定相应的政策和标准,可引导算力资源的合理布局和高效利用。例如2023年10月,工业和信息化部等六部门联合印发了《算力基础设施高质量发展行动计划》,明确了高质量算力的发展方向。

其次,也需要加大对算力基础设施建设的投入,推动技术创新和产业升级。以用促建、建以致用,推进算力高质量发展,才能更好地满足智能时代千行百业的算力需求,确保算力资源的充分利用。

最后,人才培养和国际合作也是释放算力的重要途径。加强与国际先进水平的交流和合作,引进先进的技术和管理经验,同时,加大对本土人才的培养和引进,为算力产业的发展提供强有力的人才支持。

综上所述,要释放更多的算力,需要从数据共享、资源配置、模型可信度、云边端协同、政策支持、人才培养和国际合作等多个方面入手,通过综合施策,推动算力产业的健康发展,为经济社会的数字化转型提供强大的支撑。

智算云服务提高算力资源利用率

正如上文所言,数据中心建设热潮后一流的一些问题所示,不加区分的大规模扩张可能会导致资源浪费和低效利用的问题。因此,推动算力建设的同时,需提高算力使用效率;利用智算云服务,为大模型算法企业提供高效能的算力优化方案。

为更好地服务大模型的发展、顺应时代的要求,作为国内算力巨头的中国电信对天翼云全面整合升级,构建了全栈大模型智算服务,包括打造智算数据中心AIDC,升级云智超一体化基础设施平台“云骁”,推出一站式智算服务平台“慧聚”,构建国云大模型生态,从而形成云智一体的智算服务体系。此外,天翼云智算平台已率先通过《可信算力服务 平台技术能力要求 第3部分:智算平台》评估,是业内首批通过该项评估的云服务商。

不仅如此,中国电信自主研发了包括语义大模型、语音大模型、视觉大模型、多模态基础大模型等在内的“星辰”系列大模型,现已全面开源。面向政府、工业、交通等垂直领域,中国电信研发行业大模型20余个,赋能智慧工厂、智能矿山等场景项目超600个。

中国电信董事长柯瑞文表示,人工智能的发展对云网融合提出了更高要求,而朝着智能化方向演进发展的云网融合也将进一步推动人工智能加速发展。当前,网向云再向AI持续演进并深度融合成为发展方向。

独木不成林,百川汇江海。面对智算需求,天翼云将与产业各方合作伙伴紧密协作,广泛汇聚国内外AI芯片伙伴、各类通用大模型及行业大模型伙伴及广大开发者,共建繁荣的大模型创新生态,携手打造先进的智算生产力,提高算力资源利用率。