• 收藏

  • 点赞

  • 评论

  • 微信扫一扫分享

“热启动”让效率加倍,DSO.ai持续引领AI设计芯片新纪元

来源:新思

#新思科技#

06-29 12:04

1956年人工智能(AI)概念被提出时,即使是想象力最丰富的预言家,应该也难以预料到2022年的AI,早已打败了全球最顶级的围棋选手,能够预测天气,诊疗疾病,甚至,AI还在改变被誉为“工业粮食”的半导体行业。

随着半导体制造工艺的持续演进,采用先进制程的芯片,单颗芯片集成的晶体管数量高达数百亿个,系统愈加复杂,设计挑战越来越大。但与此同时,终端应用的软件和算法加速迭代,以月或者年为周期更新的芯片越来越难以满足终端需求,芯片设计的周期亟需缩短。

EDA工具与AI技术的结合,不仅能设计出PPA(性能、功耗、面积)更好的芯片,还能显著缩短芯片设计周期。在达成提供更好、更快、更便宜的芯片愿景的同时,也将大幅降低芯片设计的门槛,让更多人和企业能够设计出所需的芯片,将对芯片行业产生深远影响。

2020年,新思科技推出了业界首个用于芯片设计的自主人工智能应用程序——DSO.ai (Design Space Optimization AI)。作为一款人工智能和推理引擎,DSO.ai能够在芯片设计的巨大求解空间里搜索优化目标。

目前,全球顶级的芯片设计公司,包括英特尔、联发科、三星、索尼、瑞萨电子等都已经采用了DSO.ai,在不同的芯片工艺节点和不同类型的芯片设计中,普遍获得了4-5倍,甚至更高的效率的提升。

一经尝试就让芯片公司们喜爱的DSO.ai,还有一个“热启动”绝招。

各种芯片,都能用AI设计

将AI技术与EDA工具结合,有两个核心价值,首先是力图让EDA更加智能,减少重复且繁杂的工作,让使用者用相同甚至更短时间设计出PPA更好的芯片;其次是大幅降低使用者的门槛,解决人才短缺的挑战。

DSO.ai更加智能这一核心价值的体现,是能够在巨大的芯片设计解决方案空间中,搜索优化目标,利用强化学习来优化功耗、性能和面积。 

无论是x86架构、Arm架构还是传感器,无论使最先进的工艺,还是成熟的工艺,都可以用DSO.ai实现PPA的提升,同时缩短设计周期。

DSO.ai之所以能在不同工艺节点和不同技术架构中都能实现显著的效率提升,核心原因是基于新思科技在EDA领域积累的多年丰富的行业经验,借助AI的自动化学习能力和底层算例,把此前需要开发者们一遍遍尝试的重复而繁杂的工作,交由AI快速探索数以万亿计的设计方法找到最优解,因此具有普遍的适用性。

DSO.ai的第二大核心价值,能够帮传统芯片设计公司解决人才短缺的挑战,并大幅降低芯片设计的门槛。

数字化趋势下,大型系统级公司们纷纷开始自研芯片,通过定制芯片来优化其应用或工作负载。但大型系统级公司往往缺乏芯片设计的经验和经验丰富的芯片设计的人才,DSO.ai能够完美解决大型系统级公司面临的挑战。

借助DSO.ai,一个只有几年工作经验的开发者,也能达到有多年丰富经验开发者的设计水准。

DSO.ai的两大优势,将惠及几乎各种类型的芯片设计公司,典型的就是通用芯片公司和系统级两大类客户。

对于通用芯片公司,DSO.ai的目标是通过仿真验证、快速原型等更快、更易用的工具,使芯片生产出来之前就能模拟出实际的性能、功耗等表现,节约成本和设计周期。对于系统级公司,DSO.ai通过各种IP模块和设计工具帮助他们解决芯片架构和工艺的选择。 

数量级性能提升,门槛大幅降低

由于需要更加强大的算力作为支撑,所以DSO.ai的出现在一定程度上也是得益于云计算的普及,新思科技也通过和云服务提供商合作提供DSO.ai解决方案。

当然,正如云计算的普及不是一蹴而就,一开始,DSO.ai在芯片设计公司眼中也是新生事物。刚开始,顶级芯片设计公司们对于DSO.ai的态度也有些谨慎,但对DSO.ai进行测试之后,他们发现,在获得PPA大幅提升的同时还能缩短设计周期。很快,DSO.ai就迅速获得了全球顶尖芯片设计公司们的认可。

英特尔、联发科、三星、索尼和瑞萨电子等都是典型的例子。

英特尔发现,面对优化高性能芯片的PPA并缩短设计周期这一目标时,有诸多关键挑战需要解决,包括:设计尺寸大,运行时间长;对于较大尺寸的设计,最终RTL到GDS的收敛循环更长;在最后阶段执行多个手动ECO延长了设计关闭时间;跨多个设计向量优化PPA将增加实验数量等。

在实际案例中,英特尔采用DSO.ai技术对芯片设计周期和PPA进行优化,实现了设计时间结果质量提高约40%,运行时间加速了约20%。英特尔通过将DSO.ai并入区块布局布线(PnR)流程中,有助于缩短芯片设计周期并实现最佳PPA,减少了人工/ECO收敛工作中的搅动,并及时向RTL所有者提供反馈以修复严重违反时间路径的问题。

英特尔的例子还充分说明了DSO.ai易于定制的特性,可以很好地解决芯片设计中计时或功耗带来的挑战、通过创建布局指标帮助缓解拥塞点、以及使用库单元数量的限制。

联发科和三星也采用了DSO.ai技术提高先进制程Arm架构移动CPU的性能和功耗。在三星的案例中,DSO.ai技术被成功应用于开发Voptz和Ftarget优化应用程序,通过自动探索大量的电压(V)/目标频率(F)空间以找出最高基准分数和最长电池时间的最佳组合。此外,DSO.ai RL模型将通过分析之前运行中的选择,自动学习并生成更好的组合。

结果显示,三星在4nm Arm Big CPU的实验中,在相同的工作电压下,DSO.ai实现了频率提高13%-80%;而在相同的工作频率下,最高可将功耗降低25%。

三星的实践展示了AI驱动的解决方案提高了生产力,助力开发者能够输出高质量的结果。

虽然和设计CPU有所不同,但索尼在设计传感器时要以最短的时间满足各种类型终端的需求,也需要缩短设计周期,提高结果质量(PPA)。

因此,索尼也在设计传感器的过程中顺利采用了DSO.ai技术并验证了其出众的性能,与专家工程师的人工操作相比,DSO.ai实现最佳结果仅需1/4的设计周期、1/5的设计工作量,并成功将功耗降低了3%,进一步提升设计结果质量。

索尼发现,与冷启动相比,热启动具备一些优势,例如仅需1/2周期,并减少1/3的工作量。

热启动,也正是新思科技DSO.ai的绝招。

热启动,DSO.ai的绝招

之所以说是绝招,是因为目前业界集成AI的EDA工具中,仅新思科技的DSO.ai提供了热启动模式。

众所周知,AI技术需要利用大量的计算资源来实现模拟人脑的神经思考,而计算资源的不足往往限制了AI技术在高端应用或大型企业的部署。DSO.ai能够将每一次运行的学习经验保存到训练数据库中,之后就可以利用训练数据库来提高设计探索的效率,减少执行时间并降低对计算资源的要求。

DSO.ai有热启动与冷启动两种模式。

冷启动实际上就是无训练数据的模式,需要执行并创建训练数据,并选择使用自己的“未训练”抽样来分配第一个参数。一个新的设计引入DSO.ai时都是从冷启动开始,所以需要执行大量训练工作,且必须在同一流程中执行多次。

热启动模式则是将“冷/热启动”的结果用作一个进程的模式,在有训练数据的情况下自动学习,以寻求最优解。热启动的显著优势就是能够减少工作量和缩短周期,与此同时,热启动也能降低对算力的需求。

英特尔在实践中发现,有了热启动模式,能够用更少的工程师实现更好的设计结果。联发科也体会到,如果了解设计的参数,实现了PPA的提升,可以利用热启动提高生产力,更进一步,也就可以实现复杂的计算和决策。

新思科技能够率先在业界推出热启动模式,与新思科技较早在五六年前就组建了AI团队研发相关项目有密切关系。

不止于此,新思科技还在尝试探索将热启动模式前移,也就是通过与IP提供商合作,面向共同的客户做针对性的优化,进一步提升DSO.ai效率。

新思科技将不断提升DSO.ai的性能,比如易用性的改进、更加智能化(冷热模式的自动切换)、适用性进一步扩大,这些也都是客户所期待的。DSO.ai,正在被越来越多芯片设计公司采用,新思科技也正在把AI与EDA的融合从数字芯片逻辑设计扩展到验证环节。

未来,从芯片的架构设计、制造以及封装的全流程都会融入AI技术。新思作为拥有芯片设计全流程的工具,能够更容易可以在整个程中都使用AI,带来更显著的全面提升,而芯片行业深刻的变革,也已经开始。

我们迎来了突破性的芯片设计的新时代。

责编: 爱集微

爱集微

作者

微信:

邮箱:jiwei@lunion.com.cn

作者简介

读了这篇文章的人还读了...

关闭
加载

PDF 加载中...