• 收藏

  • 点赞

  • 评论

  • 微信扫一扫分享

产业数字化及数字产业化高速发展,接口IP全方位赋能HPC算力升级

来源:芯耀辉科技

#芯耀辉#

#IP#

2022-11-10

所谓高性能运算(High Performance Computing,HPC) ,是指具备高速执行和数据运算能力,尤其指每秒浮点运算次数(FLOPS)超越一兆次(teraFLOPS)以上的系统,例如一个PFLOPS(petaFLOPS)等于每秒一千兆/一千万亿(1015)次的浮点运算,具备此能力的超级计算机被称为千万亿次级,可以执行超过千万亿次FLOPS。实现与评估FLOPS速度能力,需要连续向处理器传输数据,因此系统设计必须考虑到数据带宽及吞吐量(Throughput),而系统内存以及处理节点之间的互连的能力,对数据传输到处理器的速度有极大的影响。近年高性能计算已经在处理和吞吐量方面实现重大突破,实现了下一个重大级别- 百亿亿次级。在2022年ISC发布的美国Frontier处理速度达1.1exaFLOPS,超过日本富岳自2020年来以442 petaFLOPS保持的霸主地位,成为全球最快的超级计算机,从此进入「百万兆级运算」超级计算机里程碑。

在高性能计算中,处理信息的两种主要方式为串行处理及并行处理,串行处理由中央处理器(CPU)完成,每个CPU核心通常每次只能处理一个任务;并行处理利用多个CPU或加速装置,例如图形处理器(GPU)完成。运算丛集是常见的高性能运算解决方案之一,由数台计算机(或称nodes「节点」)互相串联成为群组,运算能力远超过单一计算机主机。而多数高性能计算系统通过超高带宽将多个处理器和内存模块互连并聚合,从而实现并行处理,被称为异构计算。

图1:芯片内异构,异构众核

图2:节点内异构,CPU+加速器结构

来源:2018年高性能计算、网络、存储与分析国际会议主题演讲“新形势下高性能计算发展面临的挑战和任务”

为什么需要高性能计算?从系统需求的角度来看,集成系统资源以满足对性能和功能不断增长的要求;从应用的需求角度来看,适当分解应用以实现更大规模或更细致的计算;从解决问题的需求角度来看,科学和工程问题需要更大量的数值模拟与仿真。随着技术的进步,基于比以往更强大的数据处理能力和内存,高性能计算已被应用在除了传统应用外更广泛的领域,例如AI、机器学习(ML)、大数据分析和高级建模和模拟、云端计算及网络通信。

而云端计算及数据中心是支持AI、ML、大数据分析等应用的重要基础,通过高效的数据处理能力及吞吐量,可加速各种计算与分析,并支持高速增长的资料处理与存储需求。其中,服务器SoC、网络及存储等更是核心的组成元素,如数据中心服务器SoC中除了处理器外,需要各种接口进行系统所需要的数据传输、存取及处理,其中包括以太网接口进行网络数据传输、PCIe接口与其他装置设备连接进行数据传输及数据存取、DDR接口进行内存存取、USB接口进行数据存取等。

为了有效达成算力的提升,如何通过各式高速接口以满足服务器、网络内存及存储存取的性能需求,成为核心的关键技术。而接口IP的传输速度、带宽等性能,决定了数据中心的数据交互性能和数据存取性能,采用先进且优异的接口IP,方能提升计算系统的算力,以满足更高要求的应用场景及需求。

图3:HPC集群组成示例

高算力的需求与发展

在产业数字化和数字产业化趋势下,金融、云计算、文娱等领域的数字经济高速发展,在不同领域有多个新应用应运而生,例如智能工业、AI、机器学习、大数据分析及元宇宙等吸引众多业界及学术机构投入发展,而这些创新领域都需要处理大量的数据及计算。据IDC统计,2025年全球数据量将达到175ZB,对算力的要求每年增加10倍。换句话说,高算力的发展,正是支撑数字化世界的重要推手之一及推动未来经济发展的重要指标与技术。

图4:全球数据圈的年度规模(单位:ZB)来源: IDC

2022年3月17日,由IDC、浪潮信息、清华大学全球产业研究院联合编制发布的《2021-2022全球计算力指数评估报告》,将基础建设、计算能力、计算效率及应用水平整合计算为计算力指数,对全球主要国家进行了分析及量化。根据报告显示,计算力指数平均每提高1点,GDP会提高1.8%,而数字经济会增长3.5%。

图5:计算力的影响  来源: IDC2021《2021-2022全球计算力指数评估报告》

报告中提到,全球计算力水平TOP 3行业分别是互联网行业、金融行业、制造业。在过去5年15个国家AI算力支出的增长中,近60%来自中国, 同时中国的AI服务器支出规模同比大幅增长44.5%,首次超过美国位列全球第一。

图6:我国数据中心机架统计及预估  来源:工信部信息通信发展司

高速增长的数据量、大量的AI数据分析需求等趋势,推动了云端计算暴增,进而加大了数据中心的布局与需求。根据2022年中国信息通信研究所发布的《数据中心白皮书》,我国数据中心机架近五年年均复合增速超过30%,规模达520万架,预估到2022年底,总架数将达到670万架。然而,数据处理及计算能力的需求成长也带来SoC及系统设计上的困难及挑战。例如,为了增加算力及数据存取性能,数据中心处理器核心数量和计算密度必须增加,数据集的数量提升需要更快和更大的内存和存储设备及架构以满足更多的数据移入和移出内存和存储设备,实现节能、高速、低延迟的高速缓存、一致性互连的需求及挑战等。这些挑战,需要通过更新的技术以达成,例如在服务器上,需要提高服务器的电源效率以满足核心数量增加和计算密度增加,并提升接口速度以满足数据传输;在网络性能上,从100GbE提升到800+GbE以满足大量数据资料及高速设备的需求;在存储及数据交互性能上,采用新一代的PCIe、NVMe、CXL及CCIX等技术提供更高速的数据存取及低延迟的高速缓存一致性互连;在SoC内存数据存取及处理上,采用最新的DDR技术,提升数据访问速度和增加系统稳定性,以提升系统性能等。接下来,会针对这些挑战及需求,进行更进一步的说明。

图7:数据量的高速成长及AI数据分析能力增加推动HPC芯片接口速度提升

HPC SoC 对接口的需求

趋势与发展挑战

如前所述,高算力的发展及高性能计算的突破,正是支撑数字化世界的重要推手。数字化推动了数据量的高速成长、大量的AI数据分析需求等趋势,加大了数据中心的需求,同时也增加了数据中心的设计与发展的挑战。例如服务器、网络及储存等技术,对计算力的数据处理能力及数据吞吐量影响很大,如果任何一环的性能未满足发展的需求,则整体高性能计算的性能便无法突破。

在服务器及储存性能方面,因为暴增的数据量使得计算密度增加,导致对扩容性、运行能耗与效率及更高速的接口的需求相应急速提升,也加速了市场对大型数据中心的需求,根据Data Center Frontier 2021年的统计,全球数据中心的数量在2020年Q4达到600座,而有219座正在进行设计或建设中。这些数据中心除了增加更多的CPU核及更高的运算密度外,配置更高速的大容量内存与储存装置、提供更多且更快的内存数据存取能力,也是支持大量数据处理能力的核心需求。因此,服务器处理内存的接口IP – DDR,由DDR3 往DDR4、DDR5发展,速度由2133Mbps提升至3200Mbps甚至是6400Mbps,容量由8Gb达到16Gb甚至64Gb,以满足高带宽、高速存取及高内存密度的需求。

同时,根据IDC统计,全球储存装置容量在2014~2019年间,以每年超过17%的增长率增加,而处理储存装置的接口,从NVMe SSD进展至使用更高速、高带宽及低延迟的接口IP - PCIe,以主流的16GT/s(PCIe4)、32GT/s(PCIe5),及下一代的64GT/s(PCIe6)的高速性能,提供高带宽及快速传输的性能,满足存取储存装置大容量、高速存取及大吞吐量的趋势,而基于PCIe演进的CXL及CCIX等协议,针对缓存一致性优化,减少资料的重复存取,降低系统负载及延迟。

图8:主要接口IP协议带宽

从网络数据传输速度及带宽角度来看,网络基础设施交换机的以太网传输速度每五年约成长4倍,由2010年的25Gbps增加到现在的800Gbps以满足高速增加的吞吐量需求,而支持以太网协议的接口IP – SerDes IP,速度也从低于10Gbps提升到32Gbps,或更新一代的112Gbps SerDes,以提供高速核心交换机(Core Switch)400+GbE甚至更高的速率800GbE。而高速核心交换机除了网络SerDes IP外,也需要其他接口IP,例如PCIe及DDR等,以支持其高性能需求。而快速增加的数据传输及处理,让网络应用处理器负荷加大,也催生如SmartNIC等采用PCIe、CXL、CCIX、DDR及SerDes高速接口的新技术,以增加整体性能。

图9:HPC芯片使用的各类接口 当前和下一代需求比对

芯耀辉IP赋能中国算力发展

在数字化世界的趋势下,数字经济高速发展,大量数据处理及计算的需求增加,为了满足高性能计算的发展,除了CPU核的性能外,各种接口IP技术的发展,亦占了重要的角色。芯耀辉团队致力于通过自主研发先进工艺芯片IP产品,响应中国快速发展的HPC芯片和应用需求,全面赋能芯片设计,已拥有全线高速接口IP产品以支持高性能计算需要的高带宽、大吞吐量及低延迟的需求。例如支持5200Mbps的DDR IP可提供高速的内存存取能力,支持32Gbps的CCIX、CXL IP,可提升数据访问速度、增加系统稳定性及具备低延迟的高速缓存一致性互连以提升系统性能,支持高达400GbE的SerDes IP提供数据中心布局及架构高速网络传输性能的能力,支持PCIe5 32Gbps速率的PCIe IP能提供高速的存储装置存取及近乎实时的连结能力。

图10:芯耀辉拥有完整覆盖主流的高速接口IP

芯耀辉除了先进工艺IP产品,专业的精英团队同时提供IP升级服务、IP定制和策略性业务,包含IP子系统、IP硬化、系统设计与性能分析、芯片调试等,帮助客户降低集成IP难度以及设计风险、加速芯片上市时间,让客户可以聚焦于产品的差异化,提高芯片量产的效率。

图11:芯耀辉IP服务

芯耀辉科技聚集了来自世界各地的行业顶尖人才,推出覆盖高速接口IP的完整产品解决方案及IP服务,并成功赋能数据中心、智能汽车、高性能计算、5G、物联网、人工智能、消费电子等多个领域客户。我们将继续以攻克芯片设计上游的关键“卡脖子”技术为己任,为客户提供精品IP产品以及差异化的增值和升级服务,全方位支持客户芯片的每一个设计环节,解决中国集成电路产业上游接口IP国产化的问题。

责编: 爱集微

爱集微

作者

微信:

邮箱:jiwei@lunion.com.cn

作者简介

读了这篇文章的人还读了...

关闭
加载

PDF 加载中...