英伟达黄仁勋访谈——in good company系列1

发布于: 雪球转发:1回复:1喜欢:21

挪威主权基金nicolai tangen主持了一档播客《in good company》,邀请其持仓的公司的CEO或者主要领导来做客。我把其中几期我感兴趣的拿出来翻译。

挪威主权基金是全世界最大的主权基金之一,挪威人发现海上油气资源后,将其转化为基金,投资全世界的好公司。挪威人口只有全球人口的不到0.1%,但是他们持有全世界上市公司的股份达到1%+。目前已经有点像指数基金了,但是他们还是有很多active investment的工作,感兴趣的可以访问他们的网址网页链接{Norges Bank Investment Management}和nicolai tangen的LinkedIn。

以下是黄仁勋的访谈内容:

你几乎在目前社会发生的所有最重要的事情的中央,感觉如何?

让人很欣喜,很开心我们的公司能够在科学和社会的很多方面做出贡献。这是激动人心的时刻。

你是五六年前第一个给openAI提供超级计算机的人,给我们讲一些故事。

2016年,我们自己也是刚进入AI领域,同时也在自动驾驶领域工作。所以我们在想什么样的计算机可以给这些领域提供软件。听众可能知道AI是一种可以帮助软件工程师(码农)写软件的工具。这种软件是从数据中提炼出来的,人类不可能写出这样的软件,代码非常多。这需要一种特别的电脑。当深度学习刚出来的时候,我们意识到这会改变computer science。深度学习网络是神经网络,是给computer vision设计的,它的效应让人难以置信,他打破了计算机领域几十年的记录,这里面需要用到英伟达的GPU,所以我们被启发了。我们想要知道他会怎么发展,会解决什么问题。我们想要理解里面暗含了什么:从芯片到操作系统到数据中心,到网络,到算法,到应用。我们意识到新的计算机需要被创造,我们创造了这种新的计算机DGX。DGX是一种深度学习系统,他是一种AI超级计算机,这个计算机是为我们自己做的,我原以为只有一些人会对这个感兴趣,结果很多人都对这个非常感兴趣。所以我把公司外的第一台交付给了openAI。

做到现在这样,需要做出什么突破?

这种软件被创造,是通过巨量的数据,去寻找模式和相关性(patterns and relationships),这些数据就是0和1。使用深度学习的架构,深度学习网络是可能规模化成大模型大架构的,可以处理巨量的数据,寻找模式和相关性。所以问题就是什么样的计算机适合做这个。所以我们研究了电脑架构,得出结论,电脑的每个方面都需要改变,包括电脑处理器的设计方式。我们的GPU是一切的起点,可以模拟这个虚拟世界,结果是GPU特别适合于理解数学世界。这个过程所需要的数据和计算量是巨大的,我们对每一步都进行了分解,CPU不再是理想的处理器。所以我们升级了我们的GPU成为一个深度学习处理器,也就是AI处理器。CPU这个架构适合PC,但是不适合AI系统去学习数据。IO需要改变,网络需要改变,我们买了一家公司Mellanox,用以改变电脑之间的连接方式,取代了CPU一起工作的方式。我们有上百万的GPU core在一起工作,来处理数据,找到模式和相关性。从而可以学习任何事情。

在这些事情中,什么事情最挑战?

直到现在最大的挑战还是数量的庞大。一个手机应用只要gigabyte级别,我们现在讨论的软件,比如ChatGPT是1750亿的参数,每个参数可能是一个floating point number。这些参数是为了神经网络数学,不是给应用服务的。这是一种巨大的应用,不适应于一个PC,不适应于手机,需要很多电脑在一起工作来运行它,需要一个巨大的数据中心来从中学习。这种应用之前不存在,所以每个方面都被改变了。这需要很多的时间来处理这些数据。

你提到了GPT3,3和4之间在复杂度方面有什么进展?

复杂度很难评估,因为openAI没有这方面的描述。这里有一些突破,他可以同时从语言和图片进行学习。一个例子是,如果你见过一匹马,但是你没见过斑马,但是我跟你说斑马是一个马有一些黑白条纹。如果你有两种模式的知识,你就可以理解。从多种模式中学习对我们来说非常重要,GPT4已经有这种能力。

你提到我们现在已经到了AI的iphone时刻,是什么意思?

过去40年,我一直在电脑领域,我们一开始慢慢行进,然后突然爆发。就像水变成冰或者变成蒸汽。一开始温度线性变化,然后突然分子结构变化。这种事情发生在微型机和workstation服务器到PC,一开始四五年,线性增长,然后windows95出现了,然后PC产业改变了。PC是在这个时刻之前10年产生的。同样的事情在互联网也发生过,科学家和学者已经用了互联网五到十年,然后mosaic出现了,yahoo出现了,然后这个行业就变了,每个人都在用。然后是云,然后是iphone。在这些变化中,电脑被编程的方式也改变了,越来越容易编程了。我来给你一些例子,世界上主流的应用并不多,但是iphone的应用超过500万个,越来越多的应用说明,现在越来越容易创造厉害的应用,我们在手机或者iphone的应用超过了30年前的预期,人们创造这些应用越来越快。因此编程模式的改变,改变了应用的能力,计算的模式也被改变了。让我们套用到GPT和AI,我们现在编程用的是人类的语言,这是电脑历史的第一种和唯一一种编程语言。你不需要使用basic和pascal,C,C++,paython等。

这太好了,去年我尝试学习Python,但是还没这么快成功。

这个世界的编程者已经从千万级别增长到10亿级别,我们已经实现了电脑编程的民主化。我们缩小了懂技术和不懂技术的人之间的gap。

这种民主化意味着什么?

当使技术民主化之后,你几乎给每个人赋能了,看看现在基于chatGPT出现的应用数量,人们用技术来创造一切东西。现在不需要自己编程,你只需要让chatGPT来帮你写,你告诉它你想要解决的问题,让它给你写一个python或者SQL query,它甚至可以给你创造一个网站。如果你想创业,你不知道如何创建网站,你就告诉chatGPT来建立网站,你只需要告诉他你想要什么。

我们给社会创造了什么?

首先我们的生产力会提升,公司所拥有的知识可以交到所有员工手中,生产力会快速提升。很多平凡的信息也可以货币化。AI不可思议的地方在于,相比从蒸汽到电的这种物理生产,我们现在可以生产知识和信息,将来每个公司都需要去运用AI。英伟达现在是AI工厂,我们把数据放进去,AI改善软件,自己生产软件,我们睡觉的时候他也在改进。我们持续改善数据,从而改善软件。软件帮助设计,改善一切。所以下一次工业革命将会是智能的生产。基于智能的工业,将会快速提升我们的生产力。一些工作会被改变,一些工作机会会产生,我们现在创造了大量的AI数据科学家工作机会。这会有利于社会。

你认为社会生产力会提升多少?

我们有一些方法来衡量它。比如,我们在公司里面最难的一部分是设计芯片,我们生产的芯片是世界上最大的,最复杂的芯片。没有任何一个单一主体创造了这么大的芯片,这种芯片如果没有AI是不可能被制造的,原因是晶体管的数量,晶体管的连接方式,结合的非常棒。因为这么多人在上面工作,数学的优化,就像建造一千倍的纽约的大小,你试图从地基开始理解整个城市,每一栋建筑都在最优的位置上,你得了解每栋建筑之间的交通,你得了解哪里放公园,哪里放餐厅等等,这是难以想象的复杂,涉及到很多的组合,我们如果没有AI,根本解决不了这个问题。

还有另一个例子,我们用AI来理解气候变化。为了理解气候变化,你必须快速模拟气候,因为你想外推数据里面的隐含的未来的气候变化,不只是明天的气候变化,而是下个月,明年,以及未来几十年。所以为了做这个,我们必须非常快的模拟天气,所以我们模拟了天气的多元物理。所以现在我们比用普通的数据预测快了上千倍。这是生产力的表现。

最后一个例子,在我们公司,最花钱的地方是软件工程师。现在可以用微软的copilot。Github有40%-50%的软件是用AI写的。这有点像打字联想或者编程修改。所以现在英伟达最大的人群被工具放大了。我们预计我们的工程师将会提升10倍的生产力。

当你在说你们的复杂度超过设计纽约的1000倍时,你们在多大的芯片上工作?

有点像印章,每一面有几英寸。R&D预算大概有50亿美金。建设一代芯片比建设火箭花的钱还要多。

对社会的影响再说说?

对于没有足够CS工程师的国家来说,这是一个很好的机会。比如亚洲,印度,非洲将从这个过程中受益。在发达国家将会节省非常多的成本。

未来五到十年,AI将会解决的最大问题是什么?

有两个方面,我们在上面非常活跃的投资。一个是数字生物,药物的发现。就像我们学习人类的语言一样,现在我们在学习人类的蛋白质。蛋白质是一种生物机器,氨基酸的链,蛋白质的3D决定了功能,不同的形状变成不同的功能。通过蛋白质的功能可以合成其他蛋白质。可能可以用于更好的进入血管,更快的降解塑料等等。我们现在可以进入蛋白质工程。我们也可以用于药物发现,现在药物发现的方法很贵并且耗时很久,成功率也非常低。另一个就是我刚才说的气候变化。人们不止关心整体的气候变化,人们更关心气候对他们的影响,比如当地经济,农业等等。

比尔盖茨最近也来我们节目了,他提到个人助手。你怎么看待个人助手?

我们将会在很多领域有很多个人助手,比如在HR有个人助手,在IT领域有个人助手。

我们将要进入智能时代了吗,微软说他们已经看到一些迹象了,未来将会发生什么?

我很急切的看了很多paper,我下载了150页。智能是关于感知,推理和计划。我们已经在感知领域做了很多,但是我们还有很长的路要走。感知的目标是为了给你周围的世界建模。在分子甚至原子层面的建模。第一步是理解这个世界。第二步是你如何从问题中进行推理。在你的原则里面确保别人的安全,确保透明度。我们在自动驾驶,ChatGPT都做的很好。不可能在很多概念都做好推理,但是已经证明可以做好一些早期推理。所以这个进展非常快。

AI如何改变地缘政治,如何影响中美关系?

很难说,很多假新闻和假信息被创造,这可能会造成影响。目前大部分假信息都是人工生成的,AI有更强的能力可以识别假新闻。但是这个技术也有能力产生假新闻。这两种情况同时存在。

让我们来讨论一下年轻的黄仁勋。

统计上看我确实不年轻了。我专注,好奇,专业。我想做好每一件事情。我努力工作。

你认为努力工作对取得大的成就有多大作用?

有努力工作和疯狂努力工作两种。我是属于疯狂努力工作的一种。我每天都工作,没有一天是不工作的。

当你早上起来呢?

我5点起来,起来以后我马上工作。我每天都工作。我9点半睡觉。我喜欢睡觉,睡觉对我非常重要。

你怎么放松?

我一直在放松。我享受工作。工作的时候我就在放松。最放松的就是跟我的家人出去做任何事。阅读一些对我来说重要的文件是一种放松。

你阅读什么?

我刚读了chip wars,我读了很多AI paper,我不理解所有的材料,但是我努力去理解所有材料。我阅读所有我觉得好奇的材料。

你在1993年30岁的时候创建英伟达。如果你总结成功的本质,什么样的特质是这个公司有的?

你对未来的看法需要足够长期。多少要有点踩对方向。在这个正确的方向上,有很多路径,如果我们有更好的技巧,有些路径会更好。我不知道如何当CEO,公司里没有人知道如何建立一家公司。我们当时甚至不知道PC长什么样。我们当时没有很多关于公司的技巧。我们得发展这些技能,如何募资,如何管理公司,如何招人,这些都是我们在路上才发展的能力。我认为这些能力是可以学习的,企业家精神和创造一些新东西的精神。这些事情都很难,但是你就是有一种精神想看看它到底有多难。所以当我们开始AI的旅程,开始CS的旅程,开始自动驾驶的旅程,我们也是抱着这种心态。我们从第一性原理来推理事情。如果有人能做到,我相信我们也能做到,只要我们学习的够快。归根结底是因为我们的vision是对的,但是公司的character是最重要的事情。是character让事情最终成功。有韧性,如何处理逆境,如何学习。如果假设条件变了,公司够不够敏捷?

你如何把上面这些价值观装进公司?

你谈论他,教授他,live it。我们很幸运因为我们有很好的机会,因为我们一开始承受了很多。在我们一开始的15年,是一个接一个的逆境,但是公司可以处理这些困难。这些逆境很难想象。

面对这些困难的最重要是什么?

人形成了这些公司character,是因为人的resilience韧性。公司如何克服困难。人要敏捷,人要聪明并有创造力,人的意愿。公司遇到无数次的挑战。人的意愿和不可想象的愿意承受的能力,愿意在非常痛苦的条件下工作,这是公司品格。

你在斯坦福说过,我想要生存的愿望比其他人想要杀死你的愿望要强烈。这是什么意思?

每个人的教养对他们来说是独特的。很难有事情能让我泄气。如果我相信某件事,我就会持续做,直到做到为止。很难威慑我,很难使我分散注意力。每次我想试试到底有多难,结果每次都发现真他妈难。我周围有很多牛逼的人在帮我。但事情还是很难。

你对年轻人有什么建议?

有很多事情值得学习,成为一个学习的人。我的建议是从第一性原理来想问题。别担忧其他人的意见。我很多意见是错的。很多人说要寻找热爱的事情,但是我不知道。我干什么都很爱,我洗盘子的时候很爱这个工作,我送报纸的时候很爱这个工作,我爱我的每一份工作。我爱我在英伟达的每一天。我学习去热爱我正在做的事情。去寻找你热爱的东西可能有点难,热爱你正在做的事情比较容易。

$英伟达(NVDA)$ $AMD(AMD)$ $英特尔(INTC)$

@今日话题

全部讨论

01-17 22:23