DPU入局者,如何“行稳致远”?

来源:爱集微 #大禹智芯# #DPU#
2.2w

左手算力、右手网络的算网时代正加速驶来,这也使得DPU备受关注。在全球算力的急剧增长之下,受制于摩尔定律的CPU或将60%以上的资源分配于网络层面的处理,使得应用层处理“捉襟见肘”,出现巨大“剪刀差”。当CPU逐渐将网络、存储、安全等重任让位于应运而生的DPU,新一代数据中心算力和服务的核心也随之悄然变化。

关于DPU的重要性业界已然达成共识,但围绕DPU的产品逻辑、技术架构、生态适配的讨论至今依旧众说纷纭,莫衷一是。行至2022年末,尽管不同云厂商、芯片公司和相关初创公司均有各自的战略部署方案和技术路线,但如何能在DPU赛道上长久生存、行稳致远,是DPU入局者们共同关注的议题。

DPU诞生于云场景,DPU的很多核心技术也是从云计算中迁移和进化的。因此,要想入局DPU,首先要对云计算上层所支撑的业务及其需求和迭代方向足够清晰。事实上,DPU并非纯粹的硬件芯片,其设计思路充满了软硬一体化的特质。

很早便涉足DPU领域进行技术钻研和产品打磨的业界先行者——大禹智芯首席科学家、IEEE国际顶会HPCA名人堂成员蒋晓维博士表示:“目前,国内DPU仍处于发展早期阶段。对于国内DPU企业来说,眼下最重要的事还是要先把实际产品做出来,并在应用场景中进行检验,在落地过程中不断加长补短。场景拓展、生态开放等问题会在这个过程中,逐一找到答案。”

DPU发展的阶段历程,或暗含着它终将去向何处

作为云计算第三引擎,定义DPU的关键词在于:DPU是以数据为中心构造的专用处理器,它采用软件定义的技术路线去支撑基础设施层的网络、存储、安全等功能。在大禹智芯看来,DPU不应只被视为某种半导体的子集,而是一整套集芯片、硬件板卡、操作系统、应用软件一体化的方案。因而,设计DPU需要具备快速迭代开发和灵活部署的能力,也要平衡性能和可编程性的需求。

显然,DPU的发展不是一蹴而就的。历史沿革是未来趋势的注脚,大禹智芯重视对DPU发展史的调研,并试图从中洞见先机,找到作为DPU初创公司“谋篇布局”的打法,用最佳路径实现DPU产品的商业化落地。

据蒋晓维博士介绍,从宏观上看,DPU至今已呈现出三个阶段的发展态势:

DPU雏形最初源自公有云厂商,DPU从诞生之初是作为CPU的卸载引擎存在的。不难理解,在第一阶段,尽管各个云厂商均具备安全、网络、存储等的功能,但他们在软件的实现上存在差异。自然,这导致了各个云厂商生产的DPU在实现技术路径上的不同,因此,彼时的DPU落地应用尚未得以扩大。

自2019年DPU正式被提出后,不同云厂商先后公布了类似的DPU相关技术研究。比如阿里云在2020年国际权威网络顶会SIGCOMM上发表的技术,近似于AWS在2018年发布的高性能网络协议SRD。由此可见,在第二阶段,各个云厂商在DPU上使用的部分技术及实现路径已经开始趋于相似,但最终产品形态仍然存在差别。

在第三阶段,DPU逐渐从云厂商走出,开始面向更广泛的客户。部分云厂商开始有意识的选择收购外部芯片供应商或与之合作,将DPU的研发和生产进行更为专业化的分工。如Google选择与Intel进行合作,由Intel负责满足Google Cloud需求的DPU - Mount Evans (IPU);微软Azure也选择收购了业界著名的DPU公司Fungible。在此阶段,部分DPU的某些功能开始能够适配各家云厂商的基础软件,而不仅限于自研自用。当然,这些开放式的显性变化并不彻底。事实上,各个云厂商或多或少都保留了“独家硬技术”的自研权利,以便提升自己在市场中的核心竞争力。

基于对DPU发展历程的高度概括和总结,蒋晓维博士也对DPU未来的第四阶段进行了预测。他认为,DPU可能最终会通过软件可编程走向全面通用化。

蒋晓维博士强调,尽管不同的设计者为了实现通用的功能,在最初设计出的成品仍有差异。但从DPU本身执行的功能、承载的角色来看,DPU并不是一个定制化的角色,无论是网络、存储还是安全等均是比较通用化的功能和需求。

参考CPU的发展,或许能得到更多启示。尽管CPU包含了Intel/AMD x86、MIPS、Power、ARM、RISCV 等不同指令集和架构,但这些不同架构的CPU却均可以执行windows、Linux甚至Android的操作系统。蒋晓维博士表示,“在可预期的未来,不同架构的DPU可以完整适配某些重点的软件系统,通过软件可编程的方式,最终实现一颗芯片的通用性价值。”

软件可编程驱动DPU架构发展,当务之急是推出贴合场景的产品

事实上,业界存在一种声音认为,正如CPU最终会形成x86或是arm的主导架构,DPU未来的架构或许也会是由一两种来主导。

对此,蒋晓维博士回应说,DPU的终态必然会是一个包含CPU 的SoC,里面包含了接近于服务器级别的、能够实现完全可编程的CPU子系统。比起SoC外设(DPU硬件逻辑中比较核心的部分),CPU子系统内侧会相对比较容易固化下来。也就是说,相对DPU硬件逻辑的固化,可供不同DPU架构的通用软件系统或软件可编程协议标准更容易固化。事实上,CPU的微架构可能最终会决定性能,但比微架构更重要的是存在于软硬件之间的指令集协议,正是这些协议使得软件可编程成为可能。对于DPU,也是如此。

“在DPU发展初期阶段讨论DPU的硬件逻辑是否最终固化为一两种架构,言谈尚早。”蒋晓维博士进一步提到,“未来5年内,应该会有多个DPU架构相继出现。且需要经过更长时间的不断演绎迭代,才有可能在有限范围之内收敛为某几个架构。因此,在当下和相当长的一段时间内,比起硬件逻辑的固化,DPU的软件会有更强的主导地位,它会驱动整个DPU架构的发展。当然,或许十年之后,这个关系发生转变也是有可能的。”

以发展的目光来“透析”DPU,DPU的演进之路已然明了。相应地,推出贴合场景的DPU,亦成为检验国内DPU厂商成色的方法论。

对于国内DPU厂商而言,着眼于DPU在技术标准和生态方面都处于早期阶段的现状,蒋晓维博士建议,应尽早将DPU开发出来,加快形成规模化应用,解决更深层面的场景拓展、生态开放等问题才能更加有的放矢。还要看到的是,尽管DPU始于云计算,但未来的应用绝不局限于数据中心,DPU还将走向如边缘计算、5G、网络安全等更多的应用场景。“目前DPU还是‘庞然大物’的形态及100 瓦的功耗等局限了它能够去被部署的场景。在可前瞻的下一阶段,正如CPU不仅仅只有高端服务器CPU一样,DPU的硬件形态和功耗将存在不同SKU,甚至会出现灵活轻便可嵌入小型设备的形态。”蒋晓维博士指出。

先打好地基 以期未来弯道超车

随着数字经济时代的到来,我国已将网络安全、自主可控提到了前所未有的高度,核心技术国产化成为了绕不开的话题。有赖于国内政策和市场土壤的滋养,作为新赛道的探索者,国产DPU厂商拥有更多机会进行创造,也切实承担着创新加码国产化进程的重要任务。

不难理解,DPU的设计研发相当考验技术团队对于业务需求、产品逻辑以及系统架构等方面的综合把控能力。此外,考虑到云计算在当下仍然是DPU最主要的使用场景之一。确保DPU稳定性运行,顺利完成软件热升级及业务热迁移、运维纠错的精准定位等任务,都离不开在量级服务器上部署量级DPU丰富经验的铺垫。

而这些正是大禹智芯的优势所在。作为一家专注于提供DPU产品设计、研发与服务的国家高新技术企业,大禹智芯汇聚了一大批真正懂DPU上所需要支撑的业务场景、具备从无到有进行软硬化一体设计DPU的丰富经验的实力派技术大牛。大禹智芯的创始团队成员均具有云计算的扎实背景,整个芯片团队出身于阿里云、Google等头部云厂商,从需求到DPU的上线及后期维护等各个环节均有丰富经验。此外,大禹智芯还拥有完善的软件团队,具备丰富的互联网公司开发背景,一直在做相应的SDK等开发工作,并与各个开源社区积极对接和合作,深入探索共建生态的可行性方案。

需要强调的是,尽管大禹智芯的创始团队成员有着天然优越的出身背景,但正是因为有足够的经验、处理过更多的技术难题,所以心怀敬畏。大禹智芯采取稳扎稳打的策略,在清醒面对本土业态的前提下,本着“先打好地基,以期未来弯道超车”的基本态度,做足功课和调研后才开启了深耕DPU之旅。此外,大禹智芯十分重视对外部需求的业务挖掘,以便从场景出发倒推DPU的研发设计方案。

从具体产品路线来看,大禹智芯首先从产品易用性及客户侧功能快速实现角度出发,基于Arm Soc的设计推出第一代产品——Paratus 1.0,偏重于软件卸载。通过一代DPU产品接洽客户,大禹智芯进一步了解外部客户的具体诉求,并将之积累及优化为共性需求,最终沉淀至纯粹用PFGA来做硬件卸载的第二代产品Paratus 2.0。

Paratus 2.0于2022年10月推出,基于相同的硬件形态,通过不同的功能组合,形成了针对不同场景的多种产品,在诸多性能层面都实现了新的突破。据悉,支持裸金属场景的二代卡共有10G、25G、100G三种不同的网络接口速率。其中,在100G高性能的场景下,Paratus 2.0的总体性能优于国内业界同行,并有望在未来匹敌北美的一些纯芯片DPU对手。大禹智芯自主开发了支持RDMA应用的高性能网络传输协议HPRT,可以进一步释放RDMA应用的潜力,提升性能。在网络安全方面,Paratus 2.0提供了一个能够无缝支持东西向网络流量加密的协议,此协议在性能及扩展性方面,在业界均处于领先水平。另外,Paratus 2.0可针对上层应用流量进行定性分析,为监测网络入侵行为状态提供可靠的实时依据。在存储方面,Paratus 2.0支持Nvme,目前能做到100万IOPS,端到端的延迟大概在100微秒左右。

通过Paratus系列的第一代、第二代产品的研发、测试及落地,大禹智芯积累了更丰富的开发和应用经验。接下来,大禹智芯将着力全面寻求成千上万需求里的共性,再将这些共性集成优化到Paratus系列第三代DPU的开发中。第三代将固化前两代产品的代表性用户需求,通过芯片的集中化硬件实现解决性能、功耗、成本等问题。据蒋晓维博士透露,大禹智芯计划今年进行流片。

新基建、“东数西算”等战略布局推动着中国在算力网络时代昂首向前,在中国DPU厂商的集结发力之下,一个个东方DPU的“芯”故事正在浓墨重彩地被书写。DPU入局者的未来,不止在未来,也在当下。

责编: 爱集微
来源:爱集微 #大禹智芯# #DPU#
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

关闭
加载

PDF 加载中...