成为全球第4之后,世界终于认清了黄仁勋

发布于: 雪球转发:2回复:3喜欢:7

作者:刘润 主笔:付帅 编辑:二蔓 来源:刘润

北京时间2024年2月22日凌晨,这一夜,全球大量的投资者屏息凝神、彻夜无眠。

他们,都在等待一家公司即将发布的第四季度财报。

这家公司,就是英伟达

最终,英伟达公布的多项财报数字,大超市场预期,市值剑指2万亿美元,全球排名第4,仅次于微软苹果、沙特阿美。

而谁又能想到,不到2年前,英伟达市值才不过3000亿美元。

所有的一切,都依赖于英伟达的独特地位:无论是国外大火的Sora、ChatGPT,还是国内的文心一言、讯飞星火,几乎全世界所有的人工智能模型,都离不开英伟达GPU所提供的算力支持。

当然,现在的英伟达也在遭遇挑战,比如最近大热的初创公司Groq,它推出的一款自研语言处理单元LPU,在全球人工智能行业,引发了不小的反响。

但根据目前业内专业人士的测评,它在单卡吞吐能力、用户生态等方面,还和英伟达有着不小的差距。

嗯。专业名词有点多。

但总之,到目前为止,英伟达占据了全球GPU市场超过90%的份额,成为了高盛口中“世界上最重要的公司”。而英伟达目前最为先进的H100显卡,更是被马斯克直言“比成瘾药品还难买到”

在这一波AI浪潮中,英伟达赚了很多。如果再算上它前几年吃到的那一大波关于“加密货币矿机”的红利,更是会让人眼红,也会让不少人感叹:

英伟达,运气真好。

猛地一看,好像还真是这样。但是,如果这种泼天富贵真的只是“运气”这么简单,那为什么只有英伟达接住了它?

回看英伟达的发展历程,你会发现,在这些“运气”背后,其实藏着英伟达曾经做过的艰难抉择和努力。

它们,让英伟达抓住了后面的运气。

今天,我试着用一篇文章,把这些抉择和努力,分享给你。相信会给你一些启发。

01

全球算力“超级军火商”

既然要聊英伟达的运气,就不得不提带来运气的核心产品:GPU

什么叫GPU?它和我们更常听说的CPU之间有什么关系?

CPU,全称为中央处理单元,它是计算机系统的运算和控制核心。我们熟知的英特尔,就是做CPU的。

而GPU,全称为图形处理单元,俗称显卡,主要用来做计算机图像和图形相关的运算工作。英伟达,是这个领域的老大。

那么,它们有什么区别?让我们打个比方说明一下:

CPU就像一个高等数学特别好的博士生,会计算复杂的微积分,可它只有一个大脑,没办法同时并行处理许多问题,只能一个个来。

因此,CPU适合复杂的通用单线程任务。比如,网页浏览、word文档打开时的快速响应,它们的任务复杂,但都很单一。

而GPU,就像一堆只会做加减乘除的小学生,虽然不能处理特别复杂的问题,但胜在人多、效率高。

所以,在大量重复性的并行计算上,GPU具有压倒性的优势。比如,渲染3D动画、4k视频编辑等等。由于许多视频、图像上大量的像素点是同质化的,因此可以快速并行进行处理。

GPU的这种特性,让它在设计之初主要用于加速计算机的图形渲染,主要用户也局限在游戏、设计等少数几个领域。

相反,在个人电脑时代,能处理单一高精尖任务的CPU用途更广。甚至,除了少部分特别复杂的需求,多数简单的图形渲染功能,完全可以通过把GPU集成到CPU上来解决。

所以,那个时候,世人多知道CPU、英特尔,少了解GPU、英伟达

但这个格局,被两件事情的到来打破了,这也是英伟达抓住的两波“泼天大运”:

首先是前几年的加密货币浪潮。

从2020年开始,加密货币领域迎来了一波暴涨。而比特币、以太坊这些加密货币有一个特点:需要用到大量的电脑计算来获取加密货币,俗称“挖矿”。

这个过程,不需要高精尖的计算,只需要暴力堆砌算力。而且,由于很多加密货币总量有限,因此,“挖矿”的人越多,竞争就越激烈,所有人所需要的算力也就越大。

还记得GPU有什么特点吗?没错,就是擅长大量重复性的简单计算。暴力堆砌算力,GPU最擅长。这个时候的GPU,已经基本等同于“印钞机”。

靠着这波加密货币浪潮,英伟达狠狠赚了一大笔。

除此之外,后面的一波浪潮,又让英伟达吃到了更大、更持续的一波红利:

AI人工智能。

2012年,后来被称为“深度学习三巨头”之一的Jeffery Hinton教授,带着他的两位学生Alex Krizhevsky和Ilya Sutskever,参加了当时全球最权威的计算机视觉识别挑战赛——ImageNet大赛。

最终,他们设计的识别模型AlexNet一举夺冠。

(从左到右:Ilya Sutskever、Alex Krizhevsky、Geoffrey Hinton)

更令人惊叹的是,AlexNet获胜所依靠的,仅仅是两块英伟达的GPU。

因为Hinton教授在研究中发现,人工智能模型的训练、推理,需要至少数百万次以上的并行计算,而GPU擅长处理大规模并行计算的特点,让它非常适合这样的场景。

而大概在同一时期,当时还在谷歌的另一位AI大神吴恩达,购买了足足16000个CPU处理器来训练模型,以便可以准确识别出图片中的猫咪。

这个对比,让所有人都认识到一件事:

在人工智能模型训练、推理上面,GPU可比CPU好用太多了。

这里有个彩蛋,Jeffery Hinton教授的其中一个学生,Ilya Sutskever,后来成为了OpenAI的首席科学家,并主导了ChatGPT背后技术的研发工作。

后来的故事,我们就都知道了。随着AlphaGo大战李世石、ChatGPT引爆生成式AI……人工智能行业,迎来了大爆发。

而靠着在GPU领域的技术积累,英伟达也成为了一家为全球人工智能行业竞争提供算力武器的“超级军火商”。

看起来,英伟达靠着GPU,接住了两波泼天的运气。可事实上,曾经有机会拥有这些运气的,不止是英伟达。

02

运气,不止英伟达一家独有

1999年,英伟达推出了被称为“全球首款GPU”的Geforce 256。然而,GPU相关的技术并非英伟达首创,此前已经存在了好些年。

为什么英特尔这些大公司会放任英伟达抢占“GPU发明者”这个称号?因为,当时GPU在产业端的需求和竞争力还没体现出来,CPU的市场比GPU大得多。大家熟知的英特尔、AMD等芯片公司,一心都扑在CPU上面。

当时和英伟达竞争GPU市场的,主要是一家叫做ATI的公司。并且,后者优势还更大一些。截止到2004年第三季度,ATI的市场占有率是59%,而英伟达只有37%。

换句话说,ATI曾经更有机会抓住后面那些“运气”。

就在这个关键时刻,曾经一直和英特尔在CPU市场竞争的AMD,转头收购了ATI。

至于收购的原因,也很简单:在CPU市场上,AMD已经竞争不过英特尔,索性通过收购ATI来打造一下“CPU+GPU”双轮驱动,看看能不能来个1+1>2。

现在,AMD接过了ATI的衣钵,变成了那个也有机会抓住后面两波“运气”的公司。

所以,该轮到英伟达慌了吗?

基本没有。

黄仁勋清楚意识到,按照AMD+ATI的庞大体量,合并后至少要花几年的时间来消化整合。这段时间,就是英伟达宝贵的“红利窗口期”。英伟达要做的,就是稳住阵地、全力聚焦GPU技术的研发。

事实和黄仁勋估计的大致相同,甚至,AMD的情况比他预计的还要更差。

AMD来说,收购ATI耗费了当时账上几乎所有的现金流,还让AMD背上了沉重的负债,差点拖死了它。

麻烦还不止于此。

由于AMD尽调做的一般,等到整合业务时才发现,ATI的技术并不如它所宣称的那样先进,这导致AMD在接手GPU的研发之初,就已经和英伟达拉开了差距。

在此之后的多年时间里,AMD不得不拖着虚胖的身躯,在CPU、GPU上双线作战。结果,两条业务线的发展都不尽如人意。

对手的失误,以及英伟达的潜心研发、耐心蛰伏,为英伟达后来“抓住运气”打下了基础。

但是,纵然英伟达抓住了AMD犯错的时机“猥琐发育”,但芯片行业日新月异,追赶者层出不穷,为什么只有英伟达笑到了今天?

因为,英伟达还在AMD整合期间做出了一个至关重要的选择和努力,也成为了它奠定今日行业地位的关键。

这个选择,叫做CUDA。

03

CUDA,让英伟达一骑绝尘

2006年,英伟达创始人黄仁勋力排众议,大力砸钱搞CUDA。

什么是CUDA?为什么要搞CUDA?

在回答这两个问题之前,我们需要了解一下,英伟达早年所面临的商业环境。

在个人电脑时代,GPU往往没有太多单独使用的场景,总是需要和CPU一起进行搭配。又因为CPU市场规模大得多,因此,GPU厂商总会受到CPU厂商不小的制约。

事实上,英伟达早年和AMD、英特尔等CPU厂商之间,都发生过非常激烈的冲突。这也让黄仁勋意识到,只做单一性的功能产品是远远不够的,永远都会受制于人。一旦甲方掌握了相关技术,就会毫不犹豫把你踢出局。

怎么办?必须要在原有产品上面“叠buff”,摆脱单一性功能产品的定位,从而让自己产品的护城河足够宽,让自己很难被取代。

这个关键的“buff”,就是CUDA。

CUDA,又叫做计算统一设备架构。它是英伟达为“GPU技术通用化”所搭建的一套程序开发环境。

什么意思?

以往的GPU,主要用于各类图形渲染,核心业务方向主要是游戏。但这个业务天花板比较低,还要受制于人。

公司要想进一步发展,就需要探索除图形渲染之外的其它领域,让更多人、更多业务都能更加方便地使用GPU的计算能力。

这,就是英伟达所构想的“GPU技术通用化”。

至于谁需要使用这个技术,英伟达也进行了设想,比如需要进行科学研究的高校和科研院所、进行药物筛选的生物科技公司、进行高频量化交易的股票交易员,等等。

不过,GPU是个硬件,在上面编写程序非常复杂。因此,英伟达需要在GPU硬件的基础上打造一个相适配的软件生态,降低在GPU上编程的难度,从而让开发者可以用自己习惯的编程语言编写程序,满足不同的计算任务。

CUDA,就是一个能在GPU上编写程序、进行通用计算的软件生态。

不过,在CUDA刚推出时,没几个人能理解这个构想。因为英伟达所设想的那些可能会需要“GPU技术通用化”的领域,当时的规模都太小了。相比之下,从零开始打造一个全新的软件生态,耗费的成本又太高。

事实确实如此。自从开始重金研发CUDA后,英伟达的利润表就变得难看了不少。此时的CUDA,就是一个只有投入没有产出的“吞金兽”。

怎么办?英伟达做了两件事:

第一件事,扛着。是的,你没看错,就是扛着。如果黄仁勋对未来的判断和押注没有错,那么,英伟达的这段“至暗时刻”就必须扛过去。

第二件事,做推销。没有需求,那就创造需求。在那几年,黄仁勋化身为“超级推销员”,经常奔波于各大高校、科研院所、初创公司里,反复为大家讲解CUDA生态的优势,并且低价甚至免费提供英伟达的GPU。

而在所有的推销故事中,有一件事堪称标志:

2016年8月,在OpenAI成立初期,黄仁勋就亲自把世界上第一台装载了8块英伟达P100芯片的超级计算机DGX-1送去了OpenAI的办公室,并由当时OpenAI最重要的出资人马斯克亲自开箱。

(图片来自互联网)

这台DGX-1价值超过100万美元,由3000名英伟达员工耗时3年打造而成。它有多强大呢?能把当时OpenAI一年的训练时间,压缩到短短一个月。

当时的OpenAI还是一个刚刚起步的非营利组织,对于这样一个重磅礼物,员工们别提多兴奋了。于是,包括马斯克、Sam Altman在内的早期员工,纷纷拿着马克笔在这台DGX-1上签下了自己的名字。

(图片来自互联网)

后面的故事,我们都知道了。AI浪潮的爆发,让英伟达的一切努力都得到了回报。

靠着十余年间对CUDA的持续投入,英伟达已经绑定了全球数百万的AI开发者和研究者,形成了强大的软件生态壁垒。

也正是因为英伟达打造了“GPU硬件+CUDA生态软件”的高度嵌合平台,才得以让英伟达占据当前GPU市场超过90%的绝对垄断份额。

回到英伟达,黄仁勋在决定重金研发CUDA时,不可能预料到后来人工智能这波大浪潮。毕竟,AI领域在上世纪50年代就已经出现,而60多年来,它的进展始终缓慢。

但是,黄仁勋始终相信,未来,世界会加速发展,无论是对虚拟世界的模拟,还是推动真实社会的进步,都会用到巨大的算力,也会促使GPU的市场规模得到空前提升。

而CUDA,则是英伟达抢占这个未来庞大市场的关键利器。

他赢了。

最后的话

机会,从来只留给有准备的人。

黄仁勋就是这样一个活生生的例子。因为他笃信自己的对未来的看法,所以坚持推动GPU技术的迭代,坚持十年如一日对CUDA进行砸钱研发。

最终,所有的抉择、努力、准备,都被AI这个划时代的运气事件所引爆。

可是,大多数人只会看结果,看到那份所谓的“泼天富贵”。他们对自己的设想,是“金鳞岂是池中物,一遇风云便化龙”。

在他们眼中,他们自己就是那个“金鳞”,他们需要的,只是“风云”这样一个运气。

可事实上,绝大多数人的成功,都是一个“鲤鱼跃龙门”的过程。

如果前期没有为“跃龙门”做充足的准备,比如,锻炼体力、提升耐力,那么,即使遇到“风云”这样的运气,“化龙”这件事与你也无关。

再退一步来说,如果你不做任何努力,只是将自己的人生寄托于可能随时会来、也可能永远不会来的运气,那么,你的生活就会完全被偶然性所支配。这个过程,既十分被动,又非常虚无。

祝你,做好准备,抓住运气。

祝你,强壮身体,遇风化龙。

全部讨论

03-08 09:53

03-07 09:00

03-07 07:38

厚积薄发