服务器出货带动加速卡需求看增

作者：爱集微 2022-07-03

来源：工商时报 #服务器#

1.8w

随着5G、AI、HPC、IoT等技术蓬勃发展，加上2020年新冠肺炎疫情爆发，促使消费者生活形态产生转变，逐渐采取线上学习／会议／购物／看房、云端储存／游戏／服务等模式，云端服务、电信服务供应商为满足大幅增加的云端储存与运算需求，持续扩大资本支出，扩建数据中心，加上厂商本身也要进行数字转型，需购置并扩增机房，皆带动服务器出货量持续增加。

根据TrendForce统计，2021年全球服务器市场出货量为1,360.7万台，预期2022年将增加至1,430.9万台，年成长达5.2％。

1.服务器加装加速卡需求与日俱增

数据中心（Data Center）包括服务器（Server）、储存系统、网络设备如交换机、路由器和防火墙，以及组织与连接设备所需的机架和布线，其中以服务器居于要角，而服务器虽又以CPU为系统运算核心，但CPU执行程式是依指令序列逐条执行指令，在执行复杂的控制功能时表现出色，然面对图形、影像与信号等多元资料处理时，效能仍有其瓶颈也不一定能完全负荷。

再者，服务器系统有持续扩充的需要，若定期升级其架构，能有助于改善相对效能、管理效率并提高整合度和可靠性，因此服务器通常具备插卡式或插槽式设计，而以PCIe为介面的加速卡产品，由于具有加速运算处理、灵活弹性配置等特性，即成为服务器重要配置，为整体系统提供更多附加价值。

目前加速卡主要核心芯片有GPU、FPGA、ASIC的架构，主要供应商为英特尔（Intel）、辉达（NVIDIA）、超微（AMD）、赛灵思（Xilinx；已被AMD收购），另外小型Fabless厂商Achronix亦有产品。服务器GPU加速卡领域以NVIDIA为首、AMD次之；在FPGA领域则以Xilinx为首，而Intel与Achronix近期则较无针对既有产品做进一步更新，另外以ASIC芯片架构为主的加速卡，则因开发成本高昂，逐渐被FPGA取代。

2.各大厂加速运算装置发展

服务器专用加速卡发展以来，已融合衍伸出各种加速运算装置，例如智能网络卡（SmartNIC）、资料处理器（DPU）、储存处理器（SPU）、运算型储存装置（CSD）、基础架构处理器（IPU）等，类型繁多且应用取向不同，主要乃因各厂商整合各种功能或侧重差异而有不同命名。

（一）NVIDIA

NVIDIA以GPU为加速卡基调，其Tensor Core是NVIDIA独有技术，可实现混合精度运算，并可动态调整计算，在加速传输量同时维持精准度，从Volta、Turing、Ampere到2022年Hopper，Tensor Core已发展到第四代。

第一代Tensor Core首先出现在2017年Volta架构，当时推出Tesla V100，目的在同时实现HPC、AI模型训练与推论的加速和虚拟化功能，有NVLink和PCIe两个版本，主要为汇流排技术不同，取决于使用者需求。

在Volta Architecture后为加强影像辨识，NVIDIA于2018年开发出Turing架构，释出Tesla T4，同时搭载可加速光线追踪的全新RT Core和第二代Tensor Core，主要针对视觉相关领域，聚焦于AI推论应用，再度站稳服务器加速卡市场；再来就是2020年Ampere架构，推出A100 PCIe与SXM4两个版本，其第三代Tensor Core每核心运算效率可达Turing架构第二代Tensor Core的2倍，大幅强化HPC、AI训练，严防当时对手步步进逼，同时也扩大客户族群。

2022年3月NVIDIA于GTC技术大会推出最新Hopper架构，以及首款基于第四代Tensor Core的H100，有PCIe Gen5与SXM5等版本，最令人惊艳的是分别配置HBM2e与HBM3存储器，打开服务器加速卡产品线另一新页。

芯片使用台积电4nm也是先进制程的时势所趋，与A100相比，H100的AI训练速度提升6倍、AI推论速度提升30倍，且HPC表现也相当优异，这都要归功于新增的Transformer Engine设计，扩大AI运算效能与能力，持续为NVIDIA守住在服务器加速卡领导地位，目前包括AWS、Microsoft Azure、Google Cloud、Baidu AI Cloud、Oracle Cloud等云端服务供应商已计画採用，而以其积极程度来看，势必也增加对台积电4nm的投片量。

从营收面来看，受益于GPU加速卡在数据中心的应用，NVIDIA于2022年第一季数据中心领域营收达35.9亿美元，是2021年同期20亿美元的1.8倍，营收占比达到45.4％，最重要的是2022年第一季数据中心领域营收超过先前一直最强劲的游戏领域业务，显见其营运爆发力十足；另一方面也代表GPU加速卡领导者NVIDIA对数据中心市场的重要性。

（二）AMD

在GPU加速运算领域，虽目前NVIDIA仍有绝对领导地位，但AMD也在其后苦苦紧追。AMD收购Xilinx已在2022年2月正式完成，AMD本身亦有服务器加速卡的产品线布局－Instinct MI系列加速器，且在AMD开拓下，Instinct MI200系列已获得多款高效能系统採用。

AMD营收可分为两部分：（1）运算与绘图事业群（CG），主要销售个人电脑的CPU和GPU，以及本次重点的数据中心GPU；（2）企业端、嵌入式与半客制化事业部（EESC），以企业端客户为主，包含服务器CPU，以及出售给游戏机厂商的半客制化运算芯片。以CG事业群来看，业绩仍稳步提升，2022年第一季营收年增33.4％，但相较总体营收来看，并呈现爆发式成长，其服务器GPU加速卡应仍有挑战10％以上市占空间。而成功收购Xilinx之后，AMD便能与Intel和NVIDIA抗衡，尤其是在数据中心领域，可大幅强化宥速卡与AI Inference等领域的竞争实力。

（三）Xilinx

综观整个FPGA加速运算领域，目前拥有最多款服务器、数据中心等级产品厂商为Xilinx。Xilinx在加速卡发展上，由于凭藉FPGA可编程特性带来的高灵活度，涵盖应用范围相当广泛，也有一定採用度，这也是AMD收购Xilinx主要原因之一。

目前Xilinx最新款产品为2021年11月推出的Alveo U55C，支援至PCIe Gen4。Xilinx在Alveo加速卡发展上，过去就曾获得华为、雪湖科技、深维科技、SK Telecom等厂商青睐，如今Xilinx再进一步推出服务器专用产品，显然是想针对特定应用的服务器市场扩大其影响力，然Xilinx也深知FPGA与GPU的差异，因此Alveo U55C再度突显低功耗、相对开放特性，例如联邦科学与工业研究组织等科研厂商也在Xilinx合作布局内，与GPU加速卡走出不一样道路。

从营收面来看，2021年第四季营收年增25.8％，然数据中心领域营收年增率为90.4％，代表Xilinx非常重视数据中心领域发展，且新产品Alveo U55C与先前所有Alveo系列产品的拓展皆有成长，也确实反应在营收上。

（四）其他加速卡大厂动态

Intel与Achronix同样是FPGA阵营厂商，不过截至2022年5月在纯针对服务器加速运算产品布局上未有明显动作，而是各自有不同发展策略如下。Intel服务器可编程加速卡PAC（Programmable Acceleration Card）自2019年FPGA PAC D5005后，于此系列已无更新，甚至该产品已发布停产通知，将研发重心转往其他产品架构上。

然Intel在其他FPGA应用仍有新作，例如Intel IPU C5000X-PL平台、Silicom FPGA SmartNIC N5010、Intel FPGA SmartNIC N6000-PL等，然细部来看，IPU C5000X-PL平台为支援云端基础架构工作负载，SmartNIC N5010与SmartNIC N6000-PL平台则用于网络服务环境，不全然专注于服务器的加速运算使用，而是整合为特定解决方案，能与Intel原本就非常强势的CPU相互搭配，辅以完成全方位功能，彰显Intel发展策略的改变。

值得注意的是，Intel在2022年6月2日公布新服务器加速用GPU“Rialto Bridge”Falcon Shores架构产品将于2024年问世，可将x86 CPU和Xe GPU架构整合至单一插槽中，届时将对以NVIDIA、AMD为主的GPU加速卡市场带来挑战。

此外，Fabless厂商Achronix仅有在2019年推出的VectorPath S7t-VG6加速卡，并在2021年4月将其中Speedster 7t AC7t1500 FPGA拆出贩售，以供第三方厂商推出自己的FPGA加速卡产品，而Achronix对加速卡并未有重大更新，步调相对放缓。

3.先进制程推进 NVIDIA率先採用4nm

综上所述，TrendForce表示，目前最新服务器加速卡分别是NVIDIA H100、AMD Instinct MI210、AMD旗下Xilinx的Alveo U55C，都能以PCIe介面的I／O介面卡形式，部署到服务器上，分别採用PCIe Gen5、Gen4、Gen4。而存储器也分别配置“高频宽存储器”HBM2e、HBM2e、HBM2，靠进核心运算区域故数据传输路径更短，从而减少延迟，而未来PCIe Gen5、HBM2e以上规格，将是服务器加速卡重点发展方向。

与此同时，服务器加速卡规格变化，除与存储器规格、传输介面密切有关外，内建芯片的制程技术也相当重要，目前仅Intel的FPGA使用自家制程生产，其余大部分皆由台积电代工，其中Xilinx的FPGA与前代产品相同，仍採用16nm；AMD的Instinct MI200系列则採用6nm制程打造，与MI100的7nm相比有所提升；NVIDIA H100则採用最先进4nm制程，较A100採用的7nm制程跃升不只一个档次，为业界之最。

TrendForce表示，FPGA加速卡会採用行之有年的制程技术，大致落在16～7nm；而GPU阵营较积极，已将芯片推往6nm乃至4nm发展，迈向先进制程的趋势应将持续，也是业界服务器／数据中心的首选。