【编者按】2024年,集成电路行业在变革与机遇中持续发展。面对全球经济的新常态、技术创新的加速以及市场需求的不断变化,集成电路企业如何在新的一年里保持竞争力并实现可持续发展?为了深入探讨这些议题,《集微网》特推出展望2025系列报道,邀请集成电路行业的领军企业,分享过去一年的经验与成果,展望未来的发展趋势与机遇。
【本期嘉宾】 Arm中国区业务全球副总裁 邹挺
当前,全球半导体市场处于强劲复苏阶段。根据WSTS预计,2024年全球半导体市场规模将达到6269亿美元,同比增长19%,预计明年将实现同比增长11%。AI技术的不断深入和拓展,高性能、低功耗的芯片需求的持续增加,为半导体市场带来新的增长点。
过去的一年,Arm凭借技术创新、开发者赋能以及生态协作,持续引领产业变革浪潮,为从基础技术到软件在内的整个技术栈和生态系统注入了广泛的影响力。
解决方案平台化:Arm计算子系统(CSS)助力产业升级提速
2024年,Arm为市场带来了一系列覆盖各关键领域的解决方案和产品,以领先的计算平台推动产业创新发展。
针对基础设施领域,Arm推出了两款基于全新第三代Neoverse IP构建的新的Arm Neoverse计算子系统(CSS):Arm Neoverse CSS V3与Arm Neoverse CSS N3,前者实现单芯片性能50%的提升,后者实现每瓦性能20%的提升。
在汽车市场,Arm推出了一系列新的Arm汽车增强 (AE) 处理器和虚拟平台,让汽车行业在开发伊始便可应用,助力缩短多达两年的开发周期。在这次的新品中,Arm首次将Armv9架构带入汽车应用,使行业受惠于新一代Arm架构所带来的AI、安全和虚拟化功能等优势。
面向智能终端市场,Arm推出了Arm终端CSS。作为面向新一代智能手机和电脑的计算平台,Arm终端CSS集成了最新的Armv9.2 CPU、Arm旗舰级Immortalis GPU,以及生产就绪的CPU和 GPU 物理实现。这是迄今速度最快的Arm计算平台,提升了30%以上的计算和图形性能,以满足严苛的安卓工作负载,同时提高了59%的AI推理速度。其中Arm Cortex-X925 和 lmmortalis-G925 已被集成于MediaTek天玑9400芯片中,为vivo X200和OPPO Find X8系列等国内最新旗舰手机提供了核心驱动。值得一提的是,Arm终端CSS还获得了世界互联网大会颁发的2024领先科技奖,体现了行业对其领先性及重新定义移动端AI体验的认可。
除CSS之外,在物联网领域,Arm在2024年也推出了新一代Ethos-U AI加速器Arm Ethos-U85 NPU以及全新物联网参考设计平台Corstone-320,加速推进边缘AI发展进程。
优化开发环境:简化开发流程加速AI创新
为了助力本土开发者加速AI创新,2024年,Arm推出Arm Kleidi,这是一项广泛的软件和软件社群参与计划,旨在加速AI发展。首先推出的是适用于热门AI框架的Arm Kleidi软件库,包含KleidiAI 和KleidiCV。该软件库可以被直接嵌入到热门的AI框架中,从而大大简化开发流程。
目前,Arm已将KleidiAI技术融入腾讯混元自研的Angel机器学习框架。在KleidiAI的加持下,混元大模型的预填充部分加速了100%,解码器速度提高了10%,这将有助于实现更快、更高效的AI操作。
此外,Arm持续不断投入开源社区的建设,在国内加入了OpenCloudOS操作系统开源社区,助力推进开源云操作系统的发展。与此同时,Arm也不断携手龙蜥社区,推动基于Arm架构的软硬一体的协同演进、相关的功能实现和性能优化,为广大的软件开发者带来基于 Arm 架构的顺畅开发环境与流畅的用户体验。
2024年,Arm在中国举办和参与了众多开发者活动,如Windows on Arm (WoA) Arm人工智能创新应用大赛、虚幻引擎技术开放日、AICAS竞赛,以及参与合作伙伴的倚天技术沙龙等,这些项目使众多中国开发者受益。在去年11月圆满落幕的 Arm Tech Symposia年度技术大会上,Arm首次举办了开发者工作坊,帮助开发者了解Arm技术将如何简化开发过程中遇到的难题。
深化生态合作:全方位赋能本土生态
2024年,Arm不断深化与本土生态伙伴的合作,见证了生态系统的持续发展与壮大。
在智能终端领域,Arm在2024年与vivo成立了联合实验室,通过双方在各自领域的专长与知识积累,从vivo提供的用户体验需求和实际场景问题出发,并在Arm技术底层进行优化,以更加贴合消费者的真实需求,充分发挥芯片性能,也树立了行业协作的新典范。
在汽车领域,Arm生态系统也在蓬勃发展。2024年是Arm牵头成立的SOAFEE(面向嵌入式边缘的可扩展开放架构)的第三年。SOAFEE成员已达140余家,涵盖整个汽车生态系统和供应链的方方面面,且已有多家国内企业已加入SOAFEE,包括吉利汽车、联想、映驰科技、智达诚远、中科创达、均联智行、知从科技、AutoCore等。SOAFEE打造了一个全新的软件解决方案生态系统,通过实现软件一致性来为芯片开发和部署进程提供支持,这对于将在2025年推出的Arm汽车CSS至关重要。
在物联网领域,Arm与中科创达合作,成立了中国大陆首个Arm SystemReady Devicetree合规实验室。该实验室融合了中科创达在操作系统和工程方面全方位的专业能力,以及Arm经过全球验证的SystemReady项目,为芯片厂商、原始设备制造商(OEM)及原始设计制造商(ODM)、系统集成商提供端到端的测试和技术支持服务,为智能设备启动固件的标准化,加速万物智能互联时代的到来。
这一系列成就,得益于Arm在技术生态系统中的独特地位,包括Arm对技术趋势和市场动态的敏锐洞察、自身卓越的技术创新能力和强大的生态合作能力。作为全球应用最为广泛的计算平台,Arm对全球半导体供应链有着深刻的了解,Arm的洞察覆盖从芯片设计、传感器、智能设备,到物联网、汽车和数据中心等所有市场。迄今为止,合作伙伴基于Arm 架构的芯片出货量已超过3,000亿颗,这一庞大的市场基础使Arm能够支持各种面向未来的技术发展,并成为推动创新的重要平台。
优化架构性能:充分释放AI潜力
近年来,以生成式AI为代表的人工智能技术浪潮发展势头迅猛。事实上,早在AI成为热点之前,Arm便已敏锐洞察到AI 未来的广阔潜力,并前瞻性地展开布局。十多年前,首次将AI功能引入Arm架构,随后在Armv8架构中引入了64位技术,而Armv9架构则是真正开启了AI时代。近几年来,通过不断优化Arm架构及技术,引入以AI为核心的功能,使其更适用于未来发展,这一进程在2024年得到了显著加速。
在备受瞩目的AI大模型领域,2024年,Arm为提升AI大模型的性能与能效提供了强大支持。
一方面,持续优化架构性能,广泛开展开源合作,使Arm成为AI推理开发者的首选平台。比如,Arm与Meta合作,在Arm CPU上运行新的Llama 3.2 LLM,集成开源创新与Arm计算平台的灵活性、普及性和AI功能优势,显著推进了解决AI挑战的进程。
通过Arm CPU优化内核在Arm技术驱动的移动设备上运行新的 Llama 3.2 3B LLM,提示词处理速度提高了五倍,词元 (token) 生成速度提高了三倍,在生成阶段实现了每秒19.92个词元。这直接减少了在设备上处理AI工作负载的延迟,大大提升用户整体体验。
除了在边缘侧运行小型模型,Arm CPU 同样支持在云端运行更大的模型(如 Llama 3.2 11B和90B)。11B和90B的模型非常适合云端基于CPU的推理工作负载,可生成文本和图像。
另一方面,Arm持续发力软件,助力开发者加速AI创新,充分释放AI的潜力。
2024年,Arm推出KleidiAI,使AI框架开发者们在各种设备上轻松获得Arm CPU上的最佳性能,并支持 Neon、SVE2和SME2等关键Arm架构功能。作为一套面向AI框架开发者的计算内核,KleidiAI可与PyTorch、Tensorflow、MediaPipe、Angel等热门AI框架集成,旨在加速Meta Llama 3、Phi-3、混元大模型等关键模型的性能,为生成式AI工作负载带来显著的性能提升。此外,KleidiAI还具备前后兼容性,确保Arm在引入更多新技术的同时,持续满足未来市场需求。
Arm的独特定位使之始终立足于技术发展前沿,随着AI技术的快速发展、与之伴随而来的巨大机遇,Arm也与时俱进进行产品交付形式的更迭,为生态系统提供更合时宜的解决方案。在转型为计算平台公司后,Arm持续加大对硬件、软件以及生态系统的支持力度,并从系统层面出发,面向不同市场打造Arm CSS等。凭借卓越的可扩展性、性能和能效,Arm计算平台在帮助合作伙伴更轻松、更快速地打造自己的芯片解决方案的同时,也让Arm真正成为支撑AI计算的技术基石。
重构计算方式:打造至高性能与卓越能效
在推动AI技术应用落地和支持传统行业数字化转型的过程中,市场对算力、性能、能效以及缩短产品上市时间的需求正在快速增长,这为行业提出了新的挑战,需要重新思考计算的构建方式。
高性能与卓越能效早已深深植根于Arm的基因之中,这使Arm在AI时代拥有了得天独厚的优势。为更好地满足行业对算力、性能和能效等方面的需求,Arm从系统层面思考解决之道,将硬件、软件和生态无缝集成到一个全面的解决方案,使其具备卓越的可扩展性、性能和能效,并缩短产品开发周期。
Armv9架构所引入的SVE2、SME及SME2等先进技术,显著增强了AI工作负载的性能与效率。在此基础上,通过整合基于Armv9的技术,Arm 推出了平台化解决方案Arm CSS,并搭配新推出的KleidiAI,通过软硬件的深度协同,不仅提供了卓越的性能与效率,更助力客户加速产品上市时间。
以Arm Neoverse CSS 为例,在Arm的一个客户案例中,Neoverse CSS 为其节省了长达80人/年的工程师时间;而在另一个合作伙伴项目中,从项目启动到流片仅耗时9个月,效率显著提升。
随着AI的发展,整个行业在不断追求高算力的同时,也更加聚焦能效问题,寻求更高效的解决方案。
从Arm的角度来看,在AI时代,能耗的不断攀升成为可持续发展和绿色制造面临的主要挑战,特别是AI推理对电力和能源需求的急剧增加。为此,Arm发挥计算平台及生态系统的优势,秉持“绿色AI”与“负责任的AI”理念,从技术创新、使命驱动及生态协作三大方面着手,致力于推动可持续发展的实践。
技术创新方面,Arm的解决方案在提供卓越性能的同时,也将降低能耗作为优先考量。以基于Arm Neoverse的倚天710为例,可以在CPU负载30%的情况下,每CPU功耗比x86降低6倍,整机功耗降低60%以上,碳排放也等比降低。
此外,Arm制定了到2030年实现净零排放的目标,并在2024财年取得了显著的进展。与2020财年基准相比,Arm在2024财年的温室气体排放量减少了77%。此外,Arm成功实现了100%可再生电力使用,通过将所有运营场所的电力完全转向可再生能源,确保了能源消耗的碳中和。这一举措大幅降低了公司的碳足迹,并成为Arm环境战略一大核心。
为更好地实现2030年的净零目标,Arm与供应链紧密合作,要求供应商在减少自身碳排放方面采取积极行动。通过这一合作,Arm的供应链碳排放绝对量目标为到2030年减少42%。同时,Arm携手在数据中心、新能源汽车、智能终端、物联网、教育等众多领域的生态合作伙伴,就可持续实践方面进行了深入探讨,共同致力于开创一个更加绿色、可持续的未来。
展望未来:芯粒等三大趋势方向值得关注
在2025年,行业将迎来新的技术变革和市场机遇,面对这些趋势,也重新审视以往的思维方式和实践。在Arm看来,有三大重点方向。
一是重新思考芯片设计,芯粒将成为解决方案的新方向。
从成本和物理学角度来看,传统芯片流片变得越来越困难。行业需要重新思考芯片的设计,突破以往传统的方法。例如,人们逐渐意识到,并非所有功能都需要集成在单独的单一芯片上,随着代工厂和封装公司探索新的途径、在新维度下突破摩尔定律的极限,芯粒等新方法开始崭露头角。对于芯粒,架构师需要逐步了解不同实现技术的优势,包括制程工艺节点和封装技术,从而利用相关特性提升性能和效率。
芯粒技术已经能够有效应对特定市场需求和挑战,并预计在未来几年持续发展。以汽车市场为例,芯粒可帮助企业在芯片开发过程中实现车规级认证,同时通过不同的计算组件,帮助扩大芯片解决方案的规模并实现差异化。例如,专注于计算的芯粒具有不同数量的内核,而专注于内存的芯粒则具有不同大小和类型的内存。因此,系统集成商可对不同的芯粒进行组合和封装以开发出大量高度差异化的产品。
二是更全面考量芯片设计指标,从性能优先到效率导向。
过去的摩尔定律,单一芯片上的晶体管数量已达到数十亿,其性能每年翻一番,功耗每年减少一半。然而,这种在单独的单一芯片上持续追求更多晶体管、更高性能和更低功耗的做法已经难以为继。半导体业需要重新思考和校准摩尔定律及其对行业的意义。其中之一便是,在芯片设计过程中,不再仅仅将性能作为关键指标,而是将每瓦性能、单位面积性能、单位功耗性能和总体拥有成本作为核心指标。
此外,还应引入一些新指标,关注系统实现方面的挑战(这也是开发团队面临的最大挑战),确保将IP集成到系统级芯片(SoC)及整个系统后性能不会下降。因此,这将需要在芯片开发和部署过程中持续进行性能优化。随着科技行业大规模地朝着更高效的AI工作负载计算发展,这些指标将在相关领域变得更加重要。
三是持续强化产业协作,生态系统将围绕芯片和软件开展前所未有的紧密合作。
随着芯片和软件的复杂性不断增加,没有任何一家公司能独自包揽芯片和软件设计、开发与集成的所有环节。因此,生态系统内的合作在2025年将越来越深入且广泛。此类合作能为各类规模的不同公司提供特有的机会,使各公司能够根据自身的核心竞争力提供不同的计算组件和解决方案。
以汽车行业为例,为实现更高的自动驾驶性能、先进的车内体验,软件和AI正在加速驱动一个由AI赋能的软件定义汽车(SDV)时代。为应对这一发展趋势,汽车行业需要将包含芯片供应商、一级供应商、整车厂和软件供应商在内的整个供应链汇集在一起,分享各自的专业知识、技术和产品,从而让最终用户能够享受到AI的真正潜力。
值得关注的是,虚拟原型技术正日益普及,并为汽车行业芯片和软件的开发流程带来革新。虚拟原型加速了芯片和软件开发,使得公司能够在物理芯片准备就绪之前就着手开发和测试软件。Arm在2024年推出了虚拟平台,可助力缩短多达两年的开发周期,这对汽车行业来说非常重要。在芯片和软件开发流程持续转型的浪潮中,2025年预计将有更多公司推出自己的虚拟平台。这些虚拟平台将无缝运行,借助Arm架构提供的ISA对等特性,确保云端和边缘侧架构的一致性。通过ISA对等特性,生态系统可在云端构建自己的虚拟原型,然后在边缘侧进行无缝部署。这将显著节省时间和成本,同时让开发者有更多的时间利用软件解决方案来提升性能。
此外,SOAFEE(面向嵌入式边缘的可扩展开放架构)也已成为推动汽车产业协同的重要力量。SOAFEE由Arm于三年前牵头成立,旨在解决行业在大规模部署SDV时会面临的三大难题:1) 在各级汽车的不同硬件平台上使用和移植相同的软件;2) 在云端和边缘侧(车端)实现软件一致性;3) 在硬件就绪前着手开发软件。该计划在过去三年中取得了显著进展,并持续引领软件定义和人工智能汽车领域的行业协作。
展望2025年,Arm将继续优化计算平台解决方案、坚定地朝着2030净零排放目标迈进,同时期待与更多合作伙伴携手,开展AI创新及可持续方面的合作,创造更美好的未来。