Arm发布全新终端计算子系统:优化人工智能体验、迄今速度最快Arm计算平台

发布于: 雪球转发:0回复:2喜欢:6

DoNews6月3日消息,立足生成式AI时代,企业对于数据传输速率的要求日益攀升,由此对于芯片架构和生态灵活性提出更多挑战。在CPU领域更占优势的Arm,如何在AI时代把握未来方向,成为备受关注的问题。

5月30日,Arm 控股有限公司(纳斯达克股票代码:ARM,以下简称“Arm”)在中国北京举办了一场线下发布会,公布了自家最新的终端计算子系统(CSS),其具备最新的 Armv9 CPU、Arm Immortalis™ GPU、基于3nm工艺生产就绪的 CPU 和 GPU 物理实现,以及最新的 CoreLink™ 系统互连和系统内存管理单元 (SMMU)。

同时,Arm还发布了为开发人员量身定制的Kleidi软件,将有助于软件开发者无缝取得 Arm CPU 上的最佳性能,其包括面向 AI 工作负载的 KleidiAI 和面向计算机视觉应用的 KleidiCV。

“Kleidi”,在希腊语代表“钥匙”。在现场,Arm 终端事业部产品管理副总裁 James McNiven向媒体如此表示。而这也代表Arm在AI时代下作为重要参与者迈出的关键一步。

“我们的最终目标,是让我们的合作伙伴以及我们的生态系统能够不断创新、实现差异化并更快地进入市场。Arm 终端 CSS 带来了 Armv9.2 的能效优势,凭借物理实现和持续的软件优化,它将彻底革新开发者和消费者的体验。” James McNiven表示。

1、大幅提升CPU/GPU能效

DoNews在现场了解到,Arm 终端 CSS 是迄今速度最快的 Arm 计算平台,提升了 30% 以上的计算和图形性能,以应对要求苛刻的实际用例中的安卓工作负载,同时也提高了 59% 的 AI 推理速度,适用于更广泛的 AI/机器学习 (ML) 和计算视觉工作负载。

Arm 终端 CSS 的关键在于 Arm 目前性能最强、效率最高、功能最广泛的 CPU 集群,带来最佳的性能和能效。

新的Arm Cortex®-X925 实现了 Cortex-X 系列推出以来最高的同比性能提升,该 CPU 利用了领先的三纳米工艺节点,在 3.8GHz 的时钟速率和最大缓存大小的条件下,与 2023 年旗舰智能手机的四纳米 SoC 相比,其单线程性能大幅提高 36%。而在 AI 性能方面,Cortex-X925 取得了 41% 性能提升,可显著提高如大语言模型 (LLM) 等设备端生成式 AI 的响应能力。

新的 Arm Cortex-A725 CPU 将对前沿性能的不懈追求与出色的效率相结合,该 CPU 将针对 AI 和手游用例的性能效率提高了 35%。这一改进也得益于更新后的 Arm Cortex-A520 CPU 和更新后的 DSU-120,使得采用最新 Armv9 CPU 集群的消费电子设备可提升能效和可扩展性。

新的 Arm Immortalis-G925 GPU 是 Arm 性能最强、效率最高的 GPU,在各款领先的手游应用中实现了 37% 的性能提升,并在多个 AI 和 ML 网络上提升了 34% 的性能。Immortalis-G925 面向旗舰智能手机市场,而包括 Arm Mali™-G725 和 Mali-G625 GPU 在内的全新高可扩展性 GPU 系列,则面向从高端手机到智能手表和 XR 可穿戴设备等广泛的消费电子设备市场。

2、为实现卓越的开发者创新优化软件

为了使开发者能够以最高性能快速实现AI应用领域的创新,Arm 推出了 Arm Kleidi,其中包括面向 AI 工作负载的 KleidiAI 和面向计算机视觉应用的 KleidiCV。

KleidiAI 是一套面向 AI 框架开发者的计算内核,使他们能够在各种设备上轻松获得 Arm CPU 上的最佳性能,并支持 Neon™、SVE2 和 SME2 等关键 Arm 架构功能。KleidiAI 与 PyTorch、Tensorflow、MediaPipe 等热门 AI 框架集成,旨在加速 Meta Llama 3、Phi-3 等关键模型的性能,并且还可前后兼容,以确保 Arm 在引入更多技术时依然能适用未来市场的需求。

通过将前沿的 CPU 和 GPU 技术、生产就绪的物理实现和持续的软件优化独特结合,Arm 终端 CSS 加之 Kleidi 软件,将为未来 AI 提供计算平台,而 Arm 正是这一未来的基石。

vivo首席芯片规划专家夏晓菲表示:“vivo 非常注重用户体验,在 Arm CSS 的技术基础之上,我们与 Arm 的密切合作,共同推动开发者生态,使手机更流畅更好用,同时也为设备端带来了前沿的 AI 体验。我们很高兴看到 Arm 终端 CSS 所引入的新方向,以及通过 Armv9 CPU 与 Arm GPU,这套计算子系统将赋能新一代设备端生成式 AI,从而实现沉浸式的智能移动端解决方案。”

全部讨论

孙正义说后悔卖早了nvd a,在向市场暗示什么。$Arm Holdings(ARM)$ $AMD(AMD)$