推动ARM服务器芯片替代X86,华为、飞腾扛起国产化大旗!

发布于: 修改于: 雪球转发:3回复:5喜欢:23

众所周知,我国高端通用芯片高度依赖进口,尤其是 CPU 芯片,在 PC 和服务器领域国产厂商存在感较小,基本被国际大厂所垄断。这背后原因一方面由于高端通用芯片技术起源于海外并持续技术突破,领先国内厂商较多,另一方面以英特尔为代表的海外国际大厂已经构建成熟商业生态并占据专利和标准制定等战略高地,形成了多维度的壁垒,大幅增加国内厂商追赶难度。

2019 年华为和中科曙光等厂商被美国纳入“实体清单”,科技产业发展受制于人的境况进一步被放大。从国家安全维度和商业竞争维度,我国都有高端 CPU 芯片国产化替代的强烈需求,国家自上而下的重视下,政府、产业和科研界实体积极推动,资本市场也贡献自己的力量,共同推动我国高端 CPU 芯片国产化不断推进。

今天我们就聚焦于市场所关心的通用服务器的成本以及ARM服务器替代 X86 服务器趋势的进行分析。

一、服务器成本构成简析

服务器是重要的基础 IT 硬件,中国服务器行业快速发展,国内一线厂商正向全球拓展。依据 IDC 数据,2018 年我国服务器市场规模达到 176.9 亿美元,同比增长 57.82%;2018 年我国服务器出货量约为 330.93 万台,同比增长 29.33%。在云计算和移动互联网需求驱动下,我国服务器行业近年来快速发展。

放眼全球,依据 IDC 数据,2018 年全球服务器市场规模达到 883.05 亿美元,同比增长 32.01%;2018 年全球服务器出货量约为 1179 万台,同比增长15.72%。依靠成本优势,中国服务器厂商开始进军国际市场,有望带动国内厂商的出货量份额提升。

服务器是在网络中为其他客户机提供服务的计算机。服务器是计算机的一种,它是在网络操作系统的控制下为网络环境里的客户提供共享资源(包括查询、存储和计算等)的高性能计算机,它的高性能主要体现在高速度的 CPU 运算能力、长时间的可靠运行、强大的 I/O 外部数据吞吐能力等方面。主要为客户提供网络应用、数据库、文件、打印等服务。

服务器的硬件组成:通常服务器是以硬件的形态交付给客户,其主要硬件组成包括 CPU、内存、硬盘(以上俗称“三大件”)、PCI-E 扩展插槽、网卡、Raid 卡、电源和风扇。除硬件外服务器还需要部分驱动管理及服务器操作系统的支持。

中国服务器芯片市场快速增长。参考 IDC 的预测数据,由于云计算需求旺盛,推动服务器快速增长,服务器芯片市场规模也持续增长。2015 年中国服务器芯片市场规模约为155 亿元,预计 2020 年达到 360 亿元,年复合增长率约为 18%。

参考上文中国服务器的市场规模和服务器芯片的市场规模,可简单测算出 2017 年中国服务器的平均单价约为 29392 元,单台服务器上在芯片上的投入为 8542 元,则 2017年单台服务器中芯片(CPU)投入占中国服务器平均单价达到 29.06%。

由于公开统计数据有限,我们同时取典型案例分拆服务器成本。当前市场关注度最高且销量最好的是 2U 的机架式服务器,我们选取国内典型服务器品牌浪潮在京东上经销商优惠价格下销售最高的型号作为代表,其售价为 28200 元,接近 2017 年中国服务器平均单价,取其配置作为测算依据和市场统计数据相互印证。

CPU、内存和硬盘占服务器整体价格约为 60%~70%。基于上图中的配置,我们取公开平台上对应配件的价格如下表中所述。其中 CPU 价格来源较少,但其对应占比测算结果为 29.70%,与上文平均值 29.06%较为接近,可互为佐证。内存条价格取京东对应搜索条目下有效的前 8 条的平均值作为均价测算,得出内存占服务器总价格比约为13.44%。硬盘价格取京东和中关村在线相对应配件报价,匡算硬盘占服务器总价格比约为 23.45%。

综合以上,则“三大件”占服务器总价格比约为 66.59%,落在 60%~70%区间内,与产业实际情况互相佐证。其他配件累计占服务器总价格约为 30%~40%。基于谨慎性原则需要特别说明的是,以上测算仅基于部分产品部分型号,并不完全精确,同时不同型号、不同配置的服务器选择的配件型号和数量也各有不同,配件和服务器产品销售价格随行就市存在一定波动,均对占比值有一定影响。

二、服务器 CPU 国产化替代商业价值

全球服务器 CPU 市场主要为海外巨头所垄断。参考海外研究统计数据,AMD 曾推出皓龙系列,2006 年其服务器 CPU 市场份额一度超过 20%,但英特尔推出至强系列服务器芯片后,市占率快速提升,近年来服务器芯片市场基本被英特尔垄断。

英特尔服务器相关业务营收规模达到 229.91 亿美元。考虑到近乎独家垄断的市占率,英特尔的服务器芯片收入可近似看作全球服务器芯片市场规模,依据其财报,2018 年该项业务收入规模达到 229.91 亿美元,同比增长 20.60%。可以看到这是一个快速增长且较为庞大的市场。

以 CPU 为核心业务的英特尔盈利能力较好。从英特尔财报来看,其收入占比最大的两块业务分别是 PC 集团业务和数据中心集团业务,均是以 CPU 为核心的业务。公司近10 年整体盈利能力较好,近 10 年年度平均毛利率约为 61.68%,近 10 年年度平均净利率约为 20.55%。

当前 X86 服务器占据市场主导地位。依据 IDC 统计数据,2019 年全球范围内 x86 服务器达到 185 亿美元收入,而非 x86 服务器同比下降 13.7%至 13 亿美元。可见当前 X86服务器占据服务器市场主导地位继续强化。

三、ARM 芯片在服务器端的发展前景几何?

国家大力支持集成电路产业发展。集成电路在我国已经上升为国家战略。近年来,在市场拉动和政策支持下,我国集成电路整体实力显著提升。但也要看到在创新领域、前沿领域、设计环节与国际领先水平依然差距巨大,面临较大的挑战,因此我国持续发布相关政策支持集成电路发展, 加快追赶的步伐。

中国各类实体积极参与,形成多条国产化 CPU 路线。除国家政策支持外,巨大的潜在商业利益也驱动各家企业积极尝试和推动国产化 CPU 的发展,以 2017 年中国市场为基数,以稳态状态下 20.55%的净利率水平为常态盈利能力,则仅国内市场服务器 CPU产业一年净利润约为 44.92 亿元。当前基于 X86 架构、ARM 架构和其他架构形成多条CPU 国产化路线,行业顶尖科研机构、信息化国家队领军企业、优秀民企和地方政府积极参与,共同推进 CPU 国产化发展。

在服务器 CPU 领域,由于其对性能要求相对更高,竞争门槛进一步提升,有实力参与的国内厂商较少。目前市场较为关注的国产服务器厂商主要有基于英特尔行架构的天津海光、上海兆芯;基于ARM架构的天津飞腾和华为;基于MIPS架构的龙芯;基于Alpha架构的申威等少数几家公司。

不过,天津海光已被列入“实体名单”,其X86技术来源方AMD也已终止了与其的合作。不过,所幸的是,天津海光已获得了AMD第一代 Ryzen和EPYC的Zen架构技术,并顺利推出了自己的产品。另外上海兆芯的X86技术来源方——威盛的X86架构技术授权似乎也已经到期,后续发展阻力增大。总体来说,目前基于X86架构的国产CPU遇到了一些挫折。

相比之下基于ARM架构的国产CPU发展也不是一帆风顺,服务器芯片领域 ARM 替换 X86 困难重重。

从过往来看,由于 ARM 芯片在服务器领域性能的劣势以及生态环境的阻力,其替代 X86 芯片困难重重,Applied Micro、三星、英伟达博通Marvell高通AMD、华芯通等等厂商均大力投入但结果不佳。其中高通更是放弃了服务器芯片业务,而高通与贵州合资的ARM服务器芯片公司华芯通也于今年4月底关闭。剩下的国产ARM服务器芯片公司也就飞腾和华为了,而目前华为也已被列入了“实体清单”,不过在此之前其已经获得了ARMv8指令集架构永久性授权。

ARM 架构在服务器领域存在的不足(替代难点):

1、软件方面:虽然 Linux 系统支持 ARM,但在生态环境上,尤其是各种应用程序层面, 和 X86 架构相比差距巨大。

2、性能方面:由于过往 ARM 架构主要面向移动端等性能要求相对较低的应用场景,对高负载高计算的支持能力不够,导致性能上一直落后,无法满足市场需求。

ARM 体系性能持续提升,生态环境渐进友好:尽管服务器市场替代较难,但 ARM 并未放弃,ARM在去年发布了新型架构 Neoverse,并希望通过新一代处理器设计大幅提升其性能,提高在服务器和基础设施领域的竞争力。

根据Arm公布Neoverse处理器IP路线图显示:其首款产品是基于16nm的Cortex-A72/A75内核的Cosmos平台,2019年已推出7nm工艺全新CPU内核架构的Ares平台,2020年将会推出7nm+工艺的Zeus平台,2021年将会推出5nm工艺的Poseidon平台。每一代的平台性能都将会比上一代提升30%。

同时,Arm还表示,Neoverse IP路线图专门针对独特的性能、效率和可扩展性要求而设计,从而可适应数据模式的不断变化、全新的工作负载挑战以及为支持万亿互联智能设备而不断发展的基础设施带来的持续需求增长。

从商用用户维度看,亚马逊和华为都相继发布基于 ARM 的服务器芯片,富士通也从 SPARC 架构体系转向 ARM v8 架构体系并推出芯片,提振市场信心。同时随着移动端的繁荣,支持 ARM 相关生态的底层系统和上层应用也逐渐增加,三大 Linux 发行版(Ubuntu、Suse 和 Redhat)都已经直接有支持ARM Server 的版本。

云计算时代对服务器需求发生改变。过往由于服务器卖给企业客户为主,单个企业强调服务器的高性能、稳定性和和吞吐量等性能指标。而云计算时代,互联网和云服务提供商对数据中心的服务器需求发生改变,由于其集群模式强调整体性能且服务器需求量大,逐渐变为自己对服务器进行深度定制。如裁剪不需要的功能、结合业务特性进行强化、节省空间、降低能耗、应用优化等等。以上需求的改变也给 ARM 架构服务器替代带来新的机遇。

云服务商寻求替代 X86 芯片方案。由于云服务商对服务器需求巨大,一方面芯片占据服务器成本约 30%,另一方面电力成本也是云服务重要成本支出项,若能降低芯片成本和芯片功耗,则将给云服务商带来巨大商业利益,基于此,ARM 芯片低价格和低功耗的特性极具吸引力。亚马逊 2018 年 11 月份宣布自家开发的 Graviton 处理器支持新的AWS EC2 A1 实例配置,主要面向微服务、Web 服务器和开发环境等可扩展应用,成本可以大幅降低 45%。

华为、飞腾扛起ARM替代X86大旗

正如前面所提到的,目前国产ARM服务器芯片厂商主要有飞腾和华为两家。

而从基于ARM架构的具体部署和业务进展维度看,天津飞腾发展较早,目前其产品线布局、商业化和生态做都还不错,产品已经覆盖了高性能计算CPU、服务器CPU、桌面CPU和高端嵌入式CPU。需要指出的是,飞腾与华为一样都是获得了ARM指令集架构的永久性授权,目前其内核也是自主设计的,可以实现自主可控。

目前,飞腾已有 FT-2000+/64处理器芯片面向企业级高性能服务器;而且飞腾还将在今年四季度推出多路服务器芯片FT-2500/64,基于16nm工艺,主频2.3GHz,拥有64个FTC663内核。

另外根据飞腾公布的资料来看,其目前已经与400多家国内的软硬件厂商进行了合作,已经初步建立起了相对完整的生态体系。

同样,华为较早也开始基于 ARM 体系打造从芯片到服务器的系列产品线。当前华为 ARM 架构服务器相关产业产品三类主线:Hi16 系 列 CPU、鲲鹏系列 ARM CPU 和泰山服务器。2004 年华为就已经开始了 ARM 架构相关芯片的开发,覆盖华为多个产品线,直至今年重磅发布的应用于服务器上的鲲鹏 920。

鲲鹏处理器在竞争力维度实现了超越。依据鲲鹏 920 的发布信息,其代表着业界最高性能的 ARM 架构的 CPU。主要体现在以下几个方面:1)高性能处理器内核:鲲鹏 920实现自主设计,同频单线程性能相比前一代提升 45%;2)高集成度:采用业界领先的7nm 先进工艺,集成最多 64 核,并支持最高 3.0G Hz 的工作主频,实现极致的多核架构和低时延表现,满足高并发、低时延应用的计算需求。集成了南桥、网卡和 SAS 控制器等功能,节省了服务器系统能耗并提升了系统 PCIe 扩展能力;3)高吞吐能力:业界率先支持 8 通道内存控制器和 PCIe 4.0,相比业界,内存带宽提升 46%,IO 速率提升 66%;4)硬件加速引擎:集成了数据加密/解密、压缩/解压缩、EC(Erasure Code)纠删码、数据校验等硬件加速引擎,能够替代处理器的指令计算,极大提升数据处理效率,并提升数据安全。

基于 ARM 芯片的优势,华为泰山服务器承载 ARM 应用场景。泰山服务器聚焦大数据、分布式存储、ARM 原生、HPC 和 Web 等五大应用场景,帮助实现高效能计算和降低数据中心 TCO。1)对比 TPC benchmark 测试,华为 TaiShan 大数据方案相比传统方案提升 30%性能;2)华为 TaiShan 分布式存储解决方案,在全 NVMe SSD 热数据场景下,整体性能提升 10%以上,在 NVMe SSD 与 HDD 混合型的温数据场景下,减少10%的服务器数量;在全 HDD 冷数据应用场景,集群能耗低 10%以上;3)安卓应用与ARM 服务器天然兼容,无需移植即可直接运行,而且运行过程中无指令翻译环节,性能无损失,相比传统方案最高能够提升 3 倍性能;4)ARM 云手机则是 ARM 原生应用的典型场景之一,通过在 ARM 服务器上运用虚拟化仿真技术,为用户提供基于云的仿真手机服务。

在产业生态领域,华为规划:从硬件、基础软件和应用三个层面持续推进 ARM 产业合作,计划通过 3 到 5 年的时间,协同 ARM 产业组织,打造完备的 TaiShan 产业生态。目前 TaiShan 的生态合作已经取得较大进展,生态体系已经相对比较完善,泰山等体系已经具备了一定能力:1)打造开放生态系统,合作共赢;2)与合作伙伴共同进行创新和认证测试;3)拥抱开源 HPC 社区;4)丰富的 HPC 行业项目建设经验(在金融、政府、制造、互联网等行业的部署与应用,2018 年的应用规模数已经突破了 2 万台/套,实现了规模化应用的市场检验);5)利用 ARM 技术实现的云-网-端战略;6)ARM 服务器可以覆盖 50%以上的 HPC 工作负载;7)已经打造成熟的解决方案;8)鲲鹏 920芯片可与英特尔 6148 对标;9)加入主要生态联盟。

值得一提的是,2018年,飞腾的 ARM 架构服务器、申威的 Alpha 架构服务器和龙芯的 MIPS 架构服务器都进入政府采购清单,也显示出国家对发展国产服务器芯片的强力支持,而华为等厂商的入局则有望进一步加快这一替代趋势。

编辑:芯智讯-浪客剑 

注:文章主体内容来自长江证券,部分内容为芯智讯原创。

活动预告

芯智讯将于9月20日,在深圳南山举办第三届《生物识别技术与应用高峰论坛》。

活动议程(暂定):

9月20日,我们邀请到了指纹识别、语音/声纹识别、人脸识别、虹膜识别等众多领域的知名企业和技术专家,与大家共同探讨生物识别的前沿技术,解析生物识别技术如何助力行业的创新与变革。

注:具体活动议程以活动前一天公布的议程为准,活动行报名页面将实时更新,敬请关注。谢谢!

全部讨论

漫步金融界2019-09-06 20:34

方舟编译器:
宣称:今年 4 月 11 日,华为正式发表了方舟编译器,并表示该编译器可以改善 Android 应用的编译效率,从原先 Android 系统的边解释边执行转变为全程机器码高效运行程式,从系统层面改善手机的流畅度。据华为指出,方舟编译器是首家完全替代语言虚拟机器的静态编译器,可兼顾 Java 开发效率和 C 语言执行效率;同时还可让系统流畅速度提升 24%,系统回应速度提升了 44%,协力厂商应用如新浪微博极速版,操作流畅度提升 60%。该编译器可解决 Android 系统容易卡顿、App 执行低效、不流畅等一系列问题,可明显提高手机的运行速度。

实际情况:
华为将于 8 月 31 日正式开启方舟编译器框架开源。新浪微博极速版官宣和华为方舟编译器无关,方舟编译器无任何实际项目实现。

真相:
方舟编译器,只是一个没有任何实际项目支持,并且暂时来看,方舟编译器直译成机器码不可能,因为连基本的方式也没法实现,方舟编译器不可能实现所谓边解释边执行,就虚拟机ART的替代,仍是无任何理论及代码支持。

恐慌时买入2019-09-06 09:48

RISC-V呢?

小牛牛58882019-09-06 08:16

NB天鹰2019-09-06 07:24

龙芯很不错的,应该加大投入。至于ARM架构,从目前看,华为最有希望,毕竟华为的商业化能力太强了,远非那些研究所可比

这个家伙很厉害2019-09-05 22:52

国产任重道远啊