黄仁勋致股东的一封信,原文+机翻(英伟达目前的业务以及对未来的展望)

发布于: 修改于:雪球转发:0回复:3喜欢:10

尊敬的 NVIDIANs 和股东们,

新计算时代的曙光无疑已然到来。

两大变革正在同时发生——加速计算和生成式 AI,它们正在改变计算机行业和全球所有其他行业。

CPU 扩展是过去三十年来推动计算机行业发展的引擎,但如今已放缓。

软件开发人员已转向加速计算,以成本和能源可持续的方式满足呈指数级增长的计算需求。NVIDIA 首创的计算模型已达到临界规模,并被广泛采用作为前进的方向。

加速计算将使全球价值数万亿美元的数据中心基础设施实现现代化。其吞吐量增加以及成本和能源节省效果显著。两台配备 Hopper GPU 的 NVIDIA HGX 计算机总成本为 50 万美元,可以取代 1,000 个 CPU 服务器节点(这些服务器的成本为 1,000 万美元),用于 AI、科学计算或数据处理工作负载。 对于预算或功率有限的数据中心,NVIDIA 可将吞吐量提高一个数量级。 对于针对吞吐量进行优化的数据中心,NVIDIA 可将成本和功耗降低一个数量级。 加速计算是构建可持续数据中心的最佳方式。 当计算等基本资源的成本提高几个数量级时,就会发明新方法,发现新效用。AI 研究人员利用 NVIDIA CUDA 实现深度学习,这是一种计算密集型的机器学习算法。深度学习处理大量数据以查找模式和关系并学习预测特征。 2012 年,AlexNet 以相当大的优势赢得了 ImageNet 计算机视觉大赛,震惊了人工智能界。在几年内,每种计算机视觉算法都使用了深度学习,在五年内,计算机视觉就实现了超越人类的物体识别能力。NVIDIA CUDA 上的 AlexNet 是现代人工智能的大爆炸。我们认识到 AlexNet 不仅仅是计算机视觉的突破。我们想象深度学习将从根本上彻底改变软件,从而彻底改变所有计算。深度学习可以通过新的网络架构创新、更多数据和更多计算来应对许多以前不可能解决的挑战。在随后的十年里,NVIDIA 着手推进人工智能。我们采取了多项战略:

重新发明计算的每一层,

从 GPU 架构(例如 Tensor Cores)到系统互连(例如 NVLink)、系统(例如 DGX)、软件(例如 cuDNN 和 TensorRT)到网络技术(例如 SHARP 网络内处理)等等。我们从头开始重新发明了计算。

通过与世界领先的高性能网络公司 Mellanox 合并,转型为数据中心规模的公司。随着计算大型模型和训练数据规模扩大到需要数百万万亿次以上的操作,我们不仅需要出色的芯片,还需要 AI 超级计算系统。如今,NVIDIA 是每个计算层的专家,从芯片到软件,再到数据中心——从计算到网络。我们拥有专业知识和规模,可帮助客户在任何地方构建 AI 基础设施。通过构建 NVIDIA AI 研究和特定于应用程序的 AI 平台(用于 DLSS RTX 神经图形、DRIVE AV 自动驾驶汽车、Isaac 机器人、ACE 数字人类、NeMo LLM、BioNeMo 数字生物学和 Clara 医学成像的全栈 AI 平台)成为 AI 专家,以便我们可以直接应用 AI 来创造新市场。汽车已加入游戏行业,成为价值数十亿美元的运营业务。医疗保健和机器人技术是另外价值数十亿美元的机遇。

通过创建工具、库和专家技术团队来支持开发人员进行 AI 革命,从而为 AI 时代构建新的生态系统。全球 NVIDIA 生态系统现在接近 500 万名开发人员,创下了新开发人员数量的新高。四万家公司与 NVIDIA 合作。现在有超过 3,300 个 GPU 加速的应用程序。超过 18,000 家初创公司正在 NVIDIA 上构建。这四项战略——重塑完整的计算堆栈、构建数据中心规模的 AI 超级计算机、开展基础 AI 研究并应用 AI 创造新市场以及构建全球生态系统——改变了 NVIDIA 和整个计算领域。在 AlexNet 推出 12 年后,NVIDIA 是一家全栈、数据中心规模的 AI 公司,与全球各个行业的几乎所有 AI 公司都有合作。随后 ChatGPT 诞生,人工智能的发展步伐进一步加快。生成式人工智能时代开始了。

计算机现在可以根据人类的提示生成信息。

在 ChatGPT 的核心,大型语言模型(LLM)学会了从大量文本中理解人类语言、先验知识甚至一些常识。

而且不仅仅是人类语言。LLM 已经学会了理解文本、语音、图像,甚至氨基酸和蛋白质,即生物学语言。通过多模态学习(例如,同时从语言和图像中学习),生成式人工智能正在更深入地了解世界,并可以跨不同模态进行翻译。 给出这样的提示,例如“一只戴着太阳镜的金毛猎犬和一只穿着黑色皮夹克的白金贵宾犬在日落时分的毛伊岛冲浪,冲浪板上印着 NVIDIA 标志,海滩上有酒店”,生成式人工智能就可以创建图像。 从氨基酸序列中,人工智能可以生成蛋白质的结构,例如 SARS-CoV-2 主蛋白酶。 组合和可能性是无穷无尽的。 生成式人工智能是我们这一代最具变革性和影响力的技术。计算机将理解人类和世界,并执行以前需要人类智能才能完成的任务。借助生成式人工智能,计算机可以增强和放大人类的能力,使其更轻松、更快速地执行任务,帮助我们提高工作效率,并解决以前无法想象的问题。 研究人员使用生成式人工智能合成数十亿种化合物,并虚拟测试它们作为针对疾病目标的药物。气候科学家正在使用生成式人工智能在几秒钟内绘制出数万种天气模式的潜在轨迹,以更好地预测致命风暴的路径。生成式人工智能的智能自动化将改变全球价值 100 万亿美元的行业中的每一家公司。涵盖所有可以想象到的领域和行业的初创公司和老牌公司正在投资数十亿美元来推进和应用生成式人工智能。借助人工智能超级计算机,我们可以以代币或浮点数的形式制造智能。在上一次工业革命中,发电厂生产电力。在这场新的工业革命中,NVIDIA 人工智能超级计算机是生产智能的人工智能工厂。生成式人工智能使我们能够生产出全新的东西。

公司将运营一种新型的设施,无论是自有的还是租赁的,这些设施生产人工智能以增强、加速和扩大其员工和业务流程的生产力。

各国已经意识到人工智能的影响。

各国正在建设主权人工智能基础设施。政府将人工智能工厂视为推动社会和当地产业发展的重要基础设施。加拿大、法国、印度、新加坡、日本等国家都在寻求发展其主权人工智能能力,因为他们已经认识到本国的数据是其最宝贵的自然资源。

生成式人工智能是我们这个时代最具影响力的发明,与电力和互联网一样,它影响着每个人和每个行业。人工智能在帮助应对世界上最紧迫的挑战方面具有惊人的潜力。为了最大限度地发挥这一潜力,公司、政府和社会正在提高对这项技术能力的认识,发明协调、保护、保护和控制模型的能力,分享最佳实践,制定新政策,发现新的社会规范,鼓励辩论,并激发人工智能安全和安全领域的全新研究领域。

NVIDIA 加速计算达到临界点

2024 财年收入增长 126%,达到创纪录的 609 亿美元。GAAP 每股摊薄收益为 11.93 美元,比去年同期增长 586%。非 GAAP 每股摊薄收益为 12.96 美元,较上年同期增长 288%。非 GAAP 毛利率为 73.8%。 全年数据中心收入增长 217%,达到创纪录的 475 亿美元。对 Hopper 架构产品的需求依然强劲,我们已经宣布了其继任者 Blackwell 架构。 全年游戏收入增长 15%,达到 104 亿美元,这得益于对我们扩展的 GeForce RTX 40 系列 GPU 产品线的强劲需求。 专业可视化全年收入增长 1%,达到 16 亿美元。 今年汽车全年收入增长 21%,达到 11 亿美元。 价值一万亿美元的现有数据中心需要加速发展,未来五年还需要一万亿美元来扩大 AI 工厂的安装基础。我们正处于计算历史上最重要的扩张之一。NVIDIA 有能力帮助我们的客户和合作伙伴抓住这一机遇。

五年来,我们首次现场举办 GTC。这是一次激动人心的体验。超过 1,100 场会议、300 多个展览和 20 多个技术研讨会让圣何塞会议中心座无虚席,为我们的社区和生态系统提供了其他地方无法提供的学习和交流机会。

就在 15 年前,GTC 还很容易容纳在酒店的宴会厅内。现在,这是一个不容错过的活动,有超过 19,000 人现场注册,近 300,000 人虚拟注册,超过 12,000 人来到 SAP 中心聆听我们的主题演讲,拉开了令人难以置信的一周。

我们行业合作伙伴前所未有的合作和参与使今年的 GTC 与众不同。亚马逊思科戴尔谷歌、HPE、IBM、联想、微软、甲骨文和超微等行业巨头出席 GTC,凸显了人们对这一技术时刻的普遍认可,以及他们致力于与 NVIDIA 一起塑造未来的承诺。

那么,现在呢?我们如何提高标准?

新工业革命的新计算平台

我们正在全面加速我们的路线图。生成式 AI 模型的规模正在呈指数级增长,大约每六个月翻一番。如果训练两倍大的模型需要两倍的数据,那么计算强度每六个月就会增长 4 倍。此外,对 NVIDIA 的推理或生成 AI 的需求也大幅增加。当您与聊天机器人互动时(未来每个应用程序或服务都会集成聊天机器人),您很可能直接与云端的 NVIDIA GPU 进行交互。未来,我们与计算机的交互将由专门为该交互而生的 AI 生成,而不是检索预先录制的文本或内容。生成式 AI 将让我们重新发明与计算机交互的方式,对 GPU 的需求将是巨大的。多模态、大型上下文窗口、检索增强生成、 专家混合、合成数据 生成、内容保护、 推理、规划、工具使用、物理世界理解、万亿参数LLMs、精炼到小模型、高吞吐量到高交互性——训练和推理的创新率令人难以置信地高。每个计算机科学部门和每个行业都在取得进步。NVIDIA CUDA 丰富的软件生态系统和普遍性吸引了更多的开发人员,从而创造了更多的进步,推动了更多的采用。NVIDIA 的生态系统飞轮全速运转。我们的客户和合作伙伴想要更多、更快。我们需要一个更大的 GPU,所以我们建造了 Blackwell。作为有史以来最先进的 GPU 加速计算系统,Blackwell 平台是数千名工程师和二十多年学习和工艺的成果,是生成式 AI 时代和新工业革命的计算机。所有主要的云服务提供商、服务器制造商和领先的 AI 公司都已经开始采用 Blackwell,其中包括亚马逊谷歌Meta微软、OpenAI、特斯拉和 xAI,我们的合作伙伴预计将在今年晚些时候推出基于 Blackwell 的产品。 这些数字令人难以置信——B200 Tensor Core GPU 上有 2080 亿个晶体管、600,000 个零件、3,000 磅、两英里长的 NVLink 电缆、推理速度提高 30 倍、训练速度提高 4 倍、拥有成本和能耗比 Hopper 低 25 倍左右,带宽和内存是 H100 的两倍多。 Blackwell 拥有六项突破性技术,可实现高达 10 万亿参数的模型的 AI 训练和实时 LLM 推理。第二代 Transformer 引擎使 Blackwell 能够支持两倍的计算和模型大小。

第五代 NVLink 为每个 GPU 提供突破性的 1.8TB/s 双向吞吐量,可在多达 576 个 GPU 之间实现无缝高速通信,以处理万亿参数 LLM。内置的可靠性、可用性和可服务性 (RAS) 引擎使用基于 AI 的预防性维护来运行诊断和预测可靠性问题,从而增加正常运行时间和弹性并降低运营成本。高级机密计算功能(包括新的本机接口加密协议)可提供前所未有的安全性,而不会影响性能。最后,专用的解压缩引擎实现了数据处理的飞跃。

数据处理是全球数据中心的首要工作负载。数据是 AI 的原材料,生成的数据量呈指数级增长。AI 的预处理和后处理数据通常会消耗掉总工作量的一半。NVIDIA 在加速数据处理方面独树一帜。NVIDIA Blackwell 和 NVIDIA 的 RAPIDS 加速库将让我们在时间、成本和能源方面实现数量级的减少。这是令人难以置信的性能。不过,对于这场生成性工业革命,我们还需要更重要的东西。因此,我们进一步扩大了规模。GB200 NVL72 结合了 36 个 Grace Blackwell GB200 超级芯片,可用作多节点、液冷、机架级系统中的单个 GPU。每个 GB200 将两个 NVIDIA B200 Tensor Core GPU 连接到一个 NVIDIA Grace CPU。Blackwell 是一个完整的计算平台,客户可以将其配置成各种 AI 基础设施。 Blackwell 平台包括新的 Quantum InfiniBand 和 Spectrum 以太网交换机 X800 系列,专为万亿参数级 AI 而设计。

如果 NVIDIA GPU 就像神经元,那么 NVIDIA 网络就像突触。两者对性能都至关重要。

新的 Spectrum X800 是第一个克服以太网在分布式超级计算(如 AI)方面根本缺陷的高性能网络平台。虽然 Quantum X800 最适合专用 AI 工厂,但 Spectrum X800 将 NVIDIA 的许多 AI 网络技术带入了庞大的以太网市场。

使用 25,000 个 NVIDIA Ampere 架构 GPU 训练 1.8 万亿参数 GPT 模型大约需要三到五个月的时间。使用 Hopper,大约需要 8,000 个 GPU,在三个月内消耗 15 兆瓦。对于 Blackwell,在同样的 90 天内,完成相同任务所需的 GPU 数量和之前模型的四分之一功率仅为 4 兆瓦。

NVIDIA AI 适用于每个行业和企业

生成式 AI 将改变每个行业。NVIDIA 已经应用 AI 构建了多个价值数十亿美元的垂直行业——游戏、医疗保健、汽车和机器人。我们现在将 NVIDIA 的加速计算和 AI 带入企业。

企业历来不是 GPU 和高性能计算的市场。生成式 AI 改变了这一点。副驾驶、助理和代理将在未来增强和扩大每一位员工和业务流程,企业将成为 NVIDIA GPU 计算的重要市场。

NVIDIA AI Enterprise 软件平台的核心理念是,许多公司都希望构建和运营专有 AI 模型,每家公司都希望将 AI 集成到其业务流程中,以加速和提高生产力。NVIDIA AI Enterprise 战略有几个支柱:NVIDIA 在构建 AI 模型方面的专业知识、用于开发和定制 LLM 的 NVIDIA NeMo 工具套件、NVIDIA DGX Cloud(我们的 AI 工厂)和 NVIDIA NIM 推理微服务(可在有 NVIDIA GPU 的任何地方运行的 AI 容器)。我们是一家 AI 代工厂,就像台积电是一家芯片代工厂一样。我们制造定制 NIM,就像台积电制造定制芯片一样。就像一家伟大的代工厂一样,我们拥有与任何公司合作的技术、技能、规模和商业模式。NIM 是一种打包和交付 AI 软件的突破性新方法。我们集成了大量复杂的软件技术来构建 NIM,以便开发人员和企业能够快速开发 AI 应用程序。这些预先训练的模型经过优化且为云原生,缩短了上市时间并简化了生成式 AI 模型在任何地方的部署。NIM 可以学习理解特定于公司的专有信息,因此企业可以在其平台上创建和部署自定义应用程序,同时保留对其知识产权的完全所有权和控制权。NIM 专为可移植性和控制而构建,支持跨各种基础设施(从本地工作站到云再到本地数据中心)部署模型。Adobe、Box、Cadence、Cloudera、Cohesity、CrowdStrike、DropboxGetty ImagesNetApp、SAP、ServiceNowShutterstockSnowflake 是首批访问 NVIDIA NIM 的公司之一。例如,ServiceNow 使用 NIM 开发和部署新的领域特定副驾驶,以提供客户服务和服务保障。

增强健康科学和药物发现

生成式 AI 增强了医疗保健领域的创新。在 GTC 上,我们推出了 20 多个用于药物发现、医疗技术和数字健康的医疗 NIM。AWS 和 Microsoft Azure 正在将 NVIDIA NIM 纳入其医疗保健平台。 我们在医疗技术和生物制药领域的合作已经产生了巨大的影响。用于计算机辅助药物发现的生成式 AI 正在得到广泛采用。Genentech 使用 NVIDIA BioNeMo 定制集成到其药物发现工作流程中的 NIM。Amgen 正在以光速进行药物发现,构建基于世界上最广泛的人类数据集之一进行训练的 AI 模型。 强生医疗科技公司正与 NVIDIA 合作,在 NVIDIA IGX 和 Holoscan 平台上构建智能手术和医疗器械数字生态系统。

医疗保健领域的创新速度令人惊叹。数百家科技初创公司正在与 NVIDIA 合作,利用生成式 AI 彻底改变健康监测、药物研发、机器人手术和患者护理。生成式 AI 将使医疗保健成为世界上最大的技术行业之一。

扩展图形和游戏领导地位

计算机图形仍然是 NVIDIA 的核心。在过去的二十年里,加速计算推动了难以想象的进步,并带来了 1000 万倍的巨大性能提升。我们率先推出了 RTX DLSS 神经图形,将 AI 与光线追踪计算机图形融合在一起,以提高性能和视觉质量。虽然当我们在 SIGGRAPH 2018 上首次推出 RTX 和 DLSS 时,这似乎令人难以置信,但实时光线追踪和 AI 生成的图像已经彻底改变了计算机图形学。借助 DLSS,我们计算一个像素,而 AI 生成 15 个像素,这使我们能够将可用的计算用于创建一些漂亮的样本,因为 AI 可以预测其余部分。这种混合物理-AI 方法将彻底改变许多科学领域。NVIDIA 再次推动了一场广泛的变革,这得益于 AI 计算向 PC 的扩展。生成式 AI 正在迅速成为高性能 PC 的新“杀手级应用”。NVIDIA RTX GPU 定义了最高性能 AI PC 和工作站。 NVIDIA RTX 拥有超过 1 亿个 RTX GPU,是 AI 应用程序开发人员的天然平台。 NVIDIA ACE 是一个具有可定制微服务的数字化身云 API。 它让开发人员能够将游戏角色栩栩如生地呈现在各种平台和云上,并具有安全一致的性能。现在,借助生成式 AI 和 LLM,可以实现逼真且引人入胜的游戏角色。数字人类将成为游戏领域的下一个飞跃。 GeForce NOW 云游戏度过了令人难以置信的一年。目前,GeForce NOW 上有超过 1,900 款游戏,每天有来自 110 个国家的 3000 万注册玩家在玩这些游戏。

引领汽车行业增长

生成式 AI 技术的快速发展将推动从软件定义汽车向 AI 定义汽车的转变。 NVIDIA 与大陆集团、德赛、伟创力、富士康、联想、广达和 ZF 等汽车制造商密切合作,为全球市场打造尖端电动汽车。这些车辆采用了先进的 NVIDIA DRIVE Hyperion 平台和 NVIDIA DRIVE AGX 片上系统。DRIVE AGX Thor 利用 NVIDIA 的 Blackwell 架构针对生成式 AI 进行了设计和优化,将彻底改变汽车领域,让生成式 AI 重新定义驾驶体验。全球领先的新能源汽车制造商比亚迪将在其未来的高端汽车中扩大 DRIVE Thor 的使用范围。Waabi 正在利用 DRIVE Thor 提供首批由生成式 AI 驱动的自动驾驶卡车解决方案之一。 Nuro 将使用 Thor 为其集成式自动驾驶商业货物配送车队提供动力。增程式电动汽车先驱理想汽车、小鹏汽车和广汽集团选择了 NVIDIA DRIVE Thor 集中式车载计算机为其下一代车队提供动力。DRIVE AGX Orin 还为沃尔沃、Polestar、Lucid、长城汽车、上汽、ZEEKR、蔚来、小米和小鹏汽车的汽车提供动力。除了帮助汽车制造商开发其汽车中的 AI 定义计算机并为自动驾驶汽车构建安全的操作系统外,NVIDIA 还为梅赛德斯-奔驰和捷豹路虎开发了全栈主动安全、停车和 2+/3 级软件。NVIDIA 的全栈计算机和软件允许客户选择如何利用 DRIVE 平台来为他们的车队服务。 NVIDIA 开发了一个端到端平台,从云端到汽车,使汽车生态系统能够开发业界领先的 AI 定义汽车。

工业数字化

制造业是世界上最大的产业。制造业的数字化一直具有挑战性。从头到尾表示和预测制造业的物理属性非常困难。借助通用场景描述 (OpenUSD) 格式,从设计、模拟、制造到营销的每个步骤都可以连接到标准的可互换表示。借助生成式 AI 和加速计算,庞大且物理复杂的制造业世界可以模拟为虚拟环境。 NVIDIA Omniverse 基于 OpenUSD,并由 NVIDIA 最先进的图形、物理模拟、生成式 AI、加速计算和云超级计算技术提供支持,是一款独一无二的虚拟世界仿真引擎。Omniverse 云 API 可以轻松连接到世界领先的工业工具和平台。来自不同工具和不同制造阶段的设计部件可以在 Omniverse 内部集成和组合,以表示整个产品的数字孪生。 Omniverse 数字孪生帮助公司进行虚拟产品集成、虚拟启动新工厂、测试新制造流程并改进工厂布局以改善运营。 数字孪生是工业数字化过程的基本数字表示,而 Omniverse 是操作系统。 NVIDIA 与 Ansys、Cadence、Dassault Systèmes、Siemens 等许多行业领导者合作。他们使用 Omniverse 技术帮助客户设计、模拟、构建和操作基于物理的数字孪生并充分发挥其潜力。我们还扩大了与微软的合作伙伴关系,将 NVIDIA Omniverse 云服务带给 Azure 客户。

机器人技术的 ChatGPT 时刻即将到来

下一波人工智能是多功能、高功能的机器人技术,它即将到来。人工智能将理解我们和物理世界,就像 ChatGPT 能够根据我们的指令生成响应一样,机器人也将根据我们的指令生成操作。

NVIDIA GR00T 是针对人形机器人的LLM。Isaac Sim 是内置于 Omniverse 中的机器人训练房。NVIDIA Jetson 是一台机器人计算机。用于构建和部署 AI 驱动机器人的 NVIDIA 机器人平台(例如 Isaac 软件和 Jetson 计算机)拥有超过 120 万名开发人员和 10,000 名客户和合作伙伴。NVIDIA 已在机器人 AI 领域投入了近十年的时间,很高兴看到这一切融合在一起。随着时间的推移,人形机器人和特定任务机器人将成为一个比汽车和消费电子行业总和还要大的行业。

决定性的一年和决定性时代的开端

对于 NVIDIA、我们的客户和我们的生态系统合作伙伴来说,今年是一个分水岭。NVIDIA 加速计算已达到临界点,从根本上重塑了计算,是可持续计算的前进之路。生成式人工智能正在推动平台转型并开启一场新的工业革命,人工智能工厂将制造智能。NVIDIA 处于同时进行的计算和工业革命的中心。 NVIDIA 是我们员工数十年来追求愿景和毕生工作的成果。NVIDIA 以我们长期合作的员工素质以及我们以员工为重的坚定而坚韧的文化而闻名。 2023 年是不平凡的一年。 尽管世界各地的麻烦使这一切变得具有挑战性,但我对人们的性格感到非常自豪,为我们始终支持我们的家庭而感到自豪,为我们专注于为员工创造条件以从事他们一生的工作而感到自豪。 2024 年将会更加令人难以置信。我们可以期待从数字生物学到机器人技术等许多行业的下一代LLM和生成式人工智能中取得令人难以置信的技术突破。你会想看到接下来会发生什么。

黄仁勋 NVIDIA

首席执行官兼创始人

2024 年 5 月

全部讨论

06-27 09:32

好帖子!!!

06-27 13:44

这篇文章全面描述了英伟达涉及的领域:加速计算,AI,GPU,汽车,人形机器人等等。完全可以收录在公司介绍里面。

学习