OpenAI自研芯片帝国,全揭秘!

发布于: 雪球转发:0回复:0喜欢:0

OpenAI挖来前谷歌芯片员工,正与博通洽谈芯片开发。

编译 |ZeR0

编辑 |漠影

芯东西7月19日消息,据The Information援引知情人士消息,OpenAI一直在招聘谷歌TPU部门的前成员,寻求开发AI服务器芯片,并一直在与包括博通在内的芯片设计企业洽谈开发这款新型AI芯片的事宜。

去年OpenAI CEO萨姆·阿尔特曼(Sam Altman)决定创办一家新公司,开发和生产新的AI芯片,并帮助建设芯片工厂、数据中心来制造和容纳这些芯片。此后他的计划几经曲折。

但有迹象表明,他打造新芯片的努力正在成形,而且是从OpenAI内部开始。

OpenAI芯片团队谷歌TPU前工程高级总监Richard Ho领导。该团队很可能会选择一家美国公司(如博通)来帮助其开发拟议的新芯片。

博通谷歌合作制造TPU,并已与OpenAI芯片团队进行了交谈。一些知情人士透露说,博通的台湾竞争对手,如AIchip Technologies,也向OpenAI 推销此类服务。

知情人士称,OpenAI团队似乎尚未开始设计该芯片,最早也要到2026年才会投入生产。该团队正在考虑各种芯片封装和内存组件,以最大限度地提高芯片的性能。

据两位知情人士透露,阿尔特曼今年早些时候与存储芯片制造商三星和SK海力士讨论了他的芯片计划。这两家公司都生产高带宽存储(HBM)芯片,从而在芯片进行AI计算时实现更快的数据传输和处理。

开发新型芯片只是其计划的一部分。

从去年到今年,阿尔特曼与主要芯片制造商和供应商的高管进行了交谈,讨论他们是否可以提高产能以生产更多英伟达芯片或阿尔特曼提议的新型AI芯片。阿尔特曼与台积电及其他公司讨论了他可能成立的新公司,还结识了英特尔CEO帕特·基辛格。

但阿尔特曼扩建工厂的雄心让许多高管感到难以实现,因为这需要大量资金和专业劳动力。台积电CEO魏哲家上个月在新闻发布会上被问及新工厂的前景时谈道,阿尔特曼“太激进了,我难以置信”。

不过,据一位了解谈话内容的台积电高级经理透露,台积电高管在幕后告诉阿尔特曼,如果阿尔特曼或OpenAI能够承诺大量新芯片的订单,他们愿意扩大芯片产量。这种安排对于台积电来说更易于管理,因为它可以利用台湾现有工厂,而不必尝试建立数十家新工厂。

01.

拟成立新公司大建数据中心,

OpenAI将持股

阿尔特曼计划的一个关键部分是建立新的数据中心来容纳芯片

最近,他告诉一位行业高管,他打算与外部投资者成立一家或多家公司,以支付房地产、电力、数据中心以及将在其中安置的专用AI芯片服务器的费用,OpenAI承诺租用这些服务器

一位正式了解此次谈话情况的人士称,阿尔特曼已寻求美国商务部的批准,与中东等外国政府合作开展此类项目。美国商务部一直担心海外参与AI等美国关键领域。

阿尔特曼尚未公开谈论数据中心和芯片项目的具体细节,但他私下告诉行业高管,他将在今年公布该项目。目前尚不清楚该合资企业是否已注册为一家公司。

去年,当他试图说服芯片制造商时,阿尔特曼的计划成为他与OpenAI董事会之间众多争论的焦点之一。去年秋天,阿尔特曼曾被董事会短暂罢免。据两位知情人士透露,去年当他首次向董事会提出芯片想法时,他最初称芯片将独立于OpenAI。一些董事会成员认为,不断增加的业余项目会分散他对OpenAI的注意力。

不过,今年早些时候,他告诉同事,OpenAI将拥有新公司的股份,并且OpenAI的新董事会有机会审查这一想法。

OpenAI发言人利兹·布儒瓦(Liz Bourgeois)称:“OpenAI正在与行业和政府利益相关者进行持续对话,以增加对基础设施的访问,确保AI的好处能够广泛普及。这包括与顶级芯片设计师、制造商和数据中心的实体开发商合作。”

她并未对本文的具体内容发表评论。博通发言人没有立即回应置评请求。

为数据中心基础设施提供资金是私募股权公司和其他投资者的惯用手法,阿尔特曼一直在与众多可能参与的公司建立关系,包括软银,这家公司也在讨论与阿尔特曼单独成立一家合资公司,以开发一款由AI驱动的消费设备。其他公司还包括阿联酋主权财富基金以及大型私募股权公司。

目前尚不清楚阿尔特曼是否已从这些投资者那里获得该计划的承诺。OpenAI发言人称OpenAI正与其独家云服务器提供商微软密切合作,但没有详细说明。

02.

英伟达的挑战?

开发一款能够与英伟达相媲美的新型服务器芯片的可能性很小,而且需要数年时间才能实现。

如果OpenAI或新合资公司继续设计新的AI芯片,可能会冒犯OpenAI最重要的芯片供应商英伟达,但也可能为OpenAI在未来与该公司的定价谈判中提供潜在的筹码。

英伟达一直在其专注于AI GPU上创造前所未有的利润率和销售额,因为OpenAI等客户没有可行的替代方案。这家芯片设计公司已经向微软提供了数十万张GPU,以便OpenAI可以使用它们来开发ChatGPT和其他产品。

英伟达CEO黄仁勋亲自向OpenAI交付首批DGX H200芯片时,OpenAI总裁Greg Brockman发布了一条推文

不过对于英伟达来说,客户进入其地盘是常有的事。微软谷歌及其他英伟达大客户也在自研AI专用服务器芯片,以减少对英伟达芯片的依赖。但没有迹象表明OpenAI想要使用微软的芯片。

今年2月,阿尔特曼在社交平台X上抱怨没有足够的英伟达GPU来支持其公司的AI开发。

此后,OpenAI从微软获得了更多英伟达服务器的使用权。到2025年中期,甲骨文和微软将为OpenAI提供世界上最强大的英伟达服务器集群之一,每年的租金约为25亿美元。

但这对于阿尔特曼来说还远远不够。微软和OpenAI已经讨论了未来的数据中心,该中心可能耗资高达1000亿美元,在OpenAI内部被称为“星际之门(Stargate)”。这一设施及其服务器集群的预期规模意味着它可能需要突破能源问题,否则将面临电力短缺。

目前还不清楚“星际之门”的讨论是否已成为阿尔特曼单独AI数据中心谈判的一部分。

03.

结语:实现“超级智能”的梦想

需要更多算力资源

据《华尔街日报》今年早些时候报道,阿尔特曼正在与投资者洽谈为芯片合资企业筹集资金,并指出这可能需要筹集高达7万亿美元的资金。但阿尔特曼之后解释说,这个数字代表此类合资企业的参与者在几年内需要进行的总投资,包括从房地产和数据中心电力到芯片制造等各个方面。

阿尔特曼的努力反映了OpenAI对来自谷歌Meta等资金雄厚的科技公司的竞争的担忧,这些公司正在大力投资数据中心和专用服务器,以开发最好的AI。他早就说过,要击败他们并实现“超级智能”的梦想,OpenAI需要的计算能力将是现在的很多倍。这类AI可以帮助人类殖民火星或开发核聚变能源,而这与OpenAI的对话式AI目前所能做到的还相去甚远。

来源:The Information

2024全球AI芯片峰会

9月6-7日,智猩猩联合芯东西发起主办的2024全球AI芯片峰会(GACS 2024)将在北京召开。峰会主会场将进行开幕式、数据中心AI芯片专场、AI芯片架构创新专场、边缘/端侧AI芯片专场;分会场将进行Chiplet关键技术论坛、智算集群技术论坛和中国RISC-V计算芯片创新论坛。

目前,AMD人工智能事业部高级总监王宏强, 清华大学交叉信息研究院、人工智能学院助理教授、北极雄芯创始人马恺声,珠海芯动力创始人兼CEO李原,锋行致远创始人兼CEO 孙唐,兆松科技联合创始人兼CTO伍华林,PhySim资深产品工程师黄建伟已确认参会,欢迎报名。