服务器出货带动 加速卡需求看增

来源:工商时报 #服务器#
1.8w

随着5G、AI、HPC、IoT等技术蓬勃发展,加上2020年新冠肺炎疫情爆发,促使消费者生活形态产生转变,逐渐采取线上学习/会议/购物/看房、云端储存/游戏/服务等模式,云端服务、电信服务供应商为满足大幅增加的云端储存与运算需求,持续扩大资本支出,扩建数据中心,加上厂商本身也要进行数字转型,需购置并扩增机房,皆带动服务器出货量持续增加。

根据TrendForce统计,2021年全球服务器市场出货量为1,360.7万台,预期2022年将增加至1,430.9万台,年成长达5.2%。

1.服务器加装加速卡 需求与日俱增

数据中心(Data Center)包括服务器(Server)、储存系统、网络设备如交换机、路由器和防火墙,以及组织与连接设备所需的机架和布线,其中以服务器居于要角,而服务器虽又以CPU为系统运算核心,但CPU执行程式是依指令序列逐条执行指令,在执行复杂的控制功能时表现出色,然面对图形、影像与信号等多元资料处理时,效能仍有其瓶颈也不一定能完全负荷。

再者,服务器系统有持续扩充的需要,若定期升级其架构,能有助于改善相对效能、管理效率并提高整合度和可靠性,因此服务器通常具备插卡式或插槽式设计,而以PCIe为介面的加速卡产品,由于具有加速运算处理、灵活弹性配置等特性,即成为服务器重要配置,为整体系统提供更多附加价值。

目前加速卡主要核心芯片有GPU、FPGA、ASIC的架构,主要供应商为英特尔(Intel)、辉达(NVIDIA)、超微(AMD)、赛灵思(Xilinx;已被AMD收购),另外小型Fabless厂商Achronix亦有产品。服务器GPU加速卡领域以NVIDIA为首、AMD次之;在FPGA领域则以Xilinx为首,而Intel与Achronix近期则较无针对既有产品做进一步更新,另外以ASIC芯片架构为主的加速卡,则因开发成本高昂,逐渐被FPGA取代。

2.各大厂 加速运算装置发展

服务器专用加速卡发展以来,已融合衍伸出各种加速运算装置,例如智能网络卡(SmartNIC)、资料处理器(DPU)、储存处理器(SPU)、运算型储存装置(CSD)、基础架构处理器(IPU)等,类型繁多且应用取向不同,主要乃因各厂商整合各种功能或侧重差异而有不同命名。

(一)NVIDIA

NVIDIA以GPU为加速卡基调,其Tensor Core是NVIDIA独有技术,可实现混合精度运算,并可动态调整计算,在加速传输量同时维持精准度,从Volta、Turing、Ampere到2022年Hopper,Tensor Core已发展到第四代。

第一代Tensor Core首先出现在2017年Volta架构,当时推出Tesla V100,目的在同时实现HPC、AI模型训练与推论的加速和虚拟化功能,有NVLink和PCIe两个版本,主要为汇流排技术不同,取决于使用者需求。

在Volta Architecture后为加强影像辨识,NVIDIA于2018年开发出Turing架构,释出Tesla T4,同时搭载可加速光线追踪的全新RT Core和第二代Tensor Core,主要针对视觉相关领域,聚焦于AI推论应用,再度站稳服务器加速卡市场;再来就是2020年Ampere架构,推出A100 PCIe与SXM4两个版本,其第三代Tensor Core每核心运算效率可达Turing架构第二代Tensor Core的2倍,大幅强化HPC、AI训练,严防当时对手步步进逼,同时也扩大客户族群。

2022年3月NVIDIA于GTC技术大会推出最新Hopper架构,以及首款基于第四代Tensor Core的H100,有PCIe Gen5与SXM5等版本,最令人惊艳的是分别配置HBM2e与HBM3存储器,打开服务器加速卡产品线另一新页。

芯片使用台积电4nm也是先进制程的时势所趋,与A100相比,H100的AI训练速度提升6倍、AI推论速度提升30倍,且HPC表现也相当优异,这都要归功于新增的Transformer Engine设计,扩大AI运算效能与能力,持续为NVIDIA守住在服务器加速卡领导地位,目前包括AWS、Microsoft Azure、Google Cloud、Baidu AI Cloud、Oracle Cloud等云端服务供应商已计画採用,而以其积极程度来看,势必也增加对台积电4nm的投片量。

从营收面来看,受益于GPU加速卡在数据中心的应用,NVIDIA于2022年第一季数据中心领域营收达35.9亿美元,是2021年同期20亿美元的1.8倍,营收占比达到45.4%,最重要的是2022年第一季数据中心领域营收超过先前一直最强劲的游戏领域业务,显见其营运爆发力十足;另一方面也代表GPU加速卡领导者NVIDIA对数据中心市场的重要性。

(二)AMD

在GPU加速运算领域,虽目前NVIDIA仍有绝对领导地位,但AMD也在其后苦苦紧追。AMD收购Xilinx已在2022年2月正式完成,AMD本身亦有服务器加速卡的产品线布局-Instinct MI系列加速器,且在AMD开拓下,Instinct MI200系列已获得多款高效能系统採用。

AMD营收可分为两部分:(1)运算与绘图事业群(CG),主要销售个人电脑的CPU和GPU,以及本次重点的数据中心GPU;(2)企业端、嵌入式与半客制化事业部(EESC),以企业端客户为主,包含服务器CPU,以及出售给游戏机厂商的半客制化运算芯片。以CG事业群来看,业绩仍稳步提升,2022年第一季营收年增33.4%,但相较总体营收来看,并呈现爆发式成长,其服务器GPU加速卡应仍有挑战10%以上市占空间。而成功收购Xilinx之后,AMD便能与Intel和NVIDIA抗衡,尤其是在数据中心领域,可大幅强化宥速卡与AI Inference等领域的竞争实力。

(三)Xilinx

综观整个FPGA加速运算领域,目前拥有最多款服务器、数据中心等级产品厂商为Xilinx。Xilinx在加速卡发展上,由于凭藉FPGA可编程特性带来的高灵活度,涵盖应用范围相当广泛,也有一定採用度,这也是AMD收购Xilinx主要原因之一。

目前Xilinx最新款产品为2021年11月推出的Alveo U55C,支援至PCIe Gen4。Xilinx在Alveo加速卡发展上,过去就曾获得华为、雪湖科技、深维科技、SK Telecom等厂商青睐,如今Xilinx再进一步推出服务器专用产品,显然是想针对特定应用的服务器市场扩大其影响力,然Xilinx也深知FPGA与GPU的差异,因此Alveo U55C再度突显低功耗、相对开放特性,例如联邦科学与工业研究组织等科研厂商也在Xilinx合作布局内,与GPU加速卡走出不一样道路。

从营收面来看,2021年第四季营收年增25.8%,然数据中心领域营收年增率为90.4%,代表Xilinx非常重视数据中心领域发展,且新产品Alveo U55C与先前所有Alveo系列产品的拓展皆有成长,也确实反应在营收上。

(四)其他加速卡大厂动态

Intel与Achronix同样是FPGA阵营厂商,不过截至2022年5月在纯针对服务器加速运算产品布局上未有明显动作,而是各自有不同发展策略如下。Intel服务器可编程加速卡PAC(Programmable Acceleration Card)自2019年FPGA PAC D5005后,于此系列已无更新,甚至该产品已发布停产通知,将研发重心转往其他产品架构上。

然Intel在其他FPGA应用仍有新作,例如Intel IPU C5000X-PL平台、Silicom FPGA SmartNIC N5010、Intel FPGA SmartNIC N6000-PL等,然细部来看,IPU C5000X-PL平台为支援云端基础架构工作负载,SmartNIC N5010与SmartNIC N6000-PL平台则用于网络服务环境,不全然专注于服务器的加速运算使用,而是整合为特定解决方案,能与Intel原本就非常强势的CPU相互搭配,辅以完成全方位功能,彰显Intel发展策略的改变。

值得注意的是,Intel在2022年6月2日公布新服务器加速用GPU“Rialto Bridge”Falcon Shores架构产品将于2024年问世,可将x86 CPU和Xe GPU架构整合至单一插槽中,届时将对以NVIDIA、AMD为主的GPU加速卡市场带来挑战。

此外,Fabless厂商Achronix仅有在2019年推出的VectorPath S7t-VG6加速卡,并在2021年4月将其中Speedster 7t AC7t1500 FPGA拆出贩售,以供第三方厂商推出自己的FPGA加速卡产品,而Achronix对加速卡并未有重大更新,步调相对放缓。

3.先进制程推进 NVIDIA率先採用4nm

综上所述,TrendForce表示,目前最新服务器加速卡分别是NVIDIA H100、AMD Instinct MI210、AMD旗下Xilinx的Alveo U55C,都能以PCIe介面的I/O介面卡形式,部署到服务器上,分别採用PCIe Gen5、Gen4、Gen4。而存储器也分别配置“高频宽存储器”HBM2e、HBM2e、HBM2,靠进核心运算区域故数据传输路径更短,从而减少延迟,而未来PCIe Gen5、HBM2e以上规格,将是服务器加速卡重点发展方向。

与此同时,服务器加速卡规格变化,除与存储器规格、传输介面密切有关外,内建芯片的制程技术也相当重要,目前仅Intel的FPGA使用自家制程生产,其余大部分皆由台积电代工,其中Xilinx的FPGA与前代产品相同,仍採用16nm;AMD的Instinct MI200系列则採用6nm制程打造,与MI100的7nm相比有所提升;NVIDIA H100则採用最先进4nm制程,较A100採用的7nm制程跃升不只一个档次,为业界之最。

TrendForce表示,FPGA加速卡会採用行之有年的制程技术,大致落在16~7nm;而GPU阵营较积极,已将芯片推往6nm乃至4nm发展,迈向先进制程的趋势应将持续,也是业界服务器/数据中心的首选。

责编: 爱集微
来源:工商时报 #服务器#
THE END
关闭
加载

PDF 加载中...