【降温】越来越“热”的芯片,如何降温?中国科技巨头加速AI竞赛;黄仁勋:Blackwell太抢手令客户关系紧张

来源:爱集微 #芯片# #芯片散热#
9983

1.越来越“热”的芯片,如何降温?

2.中国科技巨头加速AI竞赛:百度、阿里、腾讯等大模型陆续亮相

3.镓仁半导体官宣成功研制氧化镓超薄6英寸衬底

4.黄仁勋承认:Blackwell太抢手令客户关系紧张

5.倪光南院士:RISC-V走出硬件定制新路径

6.江波龙:SLC NAND Flash累计出货量已超5000万颗


1.越来越“热”的芯片,如何降温?

2024年,AI的“狂飙突进”势头不减,继ChatGPT之后,文生视频大模型 Sora 的推出更是让人们看到AI的无限可能。然而,随之而来的能耗问题也不容忽视。国际能源署(IEA)《Electricity 2024——Analysis and forecast to 2026E》的报告,ChatGPT每响应一个请求需要消耗2.9瓦时,这相当于一个5瓦的LED灯泡亮35分钟。考虑到每天90亿次搜索,这将在一年内额外消耗近10太瓦时的电力,相当于一座小型核电站一年的发电量。而这些能源消耗的“罪魁祸首”之一,就是支撑AI运行的芯片。为了保证芯片的高效运行,庞大的数据中心往往需要消耗大量的电力进行冷却。根据IEA的报告,数据中心的电力需求主要来自计算和冷却两个方面,两者各占总电力需求的40%左右。预计到2026年,全球数据中心、加密货币和人工智能的电力消耗将在620至1,050 TWh之间变动。

来源:IEA《Electricity 2024 - Analysis and forecast to 2026》

近年来,为了满足5G、AI、汽车电子等新兴市场不断增长的算力需求,芯片的集成度不断提高,相应的功耗也随之增加。功耗增加会产品热量,当热度达到一定程度,芯片轻则宕机,重则损毁。一个直观的生活案例,这就好比我们的手机,过热会直接死机。因此芯片散热已是当今工程师的“必修课”。但为了满足便携性和美观性需求,电子设备的尺寸又必须不断减小,这就导致给散热系统留下的空间愈发有限。如何高效散热,已成为整个行业亟待解决的关键问题。

电子系统散热:日益严峻的挑战

随着芯片制程的不断微缩,大大加剧了散热困境。按照传统散热经验,芯片的散热密度存在物理极限,每平方毫米芯片的散热能力约为 1 瓦。目前行业内的发展趋势是,进入 10 纳米以下,英特尔和 AMD 等芯片巨头纷纷采用均热片来解决发热问题。3 纳米和 2 纳米甚至是埃米时代的来临,散热将是头等大事。

在人工智能浪潮的推动下,下一代 AI 芯片,其功耗甚至超过 1 千瓦。面对如此高功耗,液冷技术成为必要的降温选择。然而,设备越热,其冷却成本也随之增加。CDCC 的统计数据显示,数据中心的制冷系统在资本支出(CAPEX)中占 20-25%,在运营支出(OPEX)中的电力成本更是占了 40%。

功耗曾经被视为软性指标,但现在已成为芯片设计中的重要考量因素。过高的热量带来的不良影响不容忽视:

  • 性能下降:过高的温度会导致芯片性能下降,甚至出现死机、蓝屏等故障。

  • 可靠性降低:高温会加速电子元件的老化,缩短设备的使用寿命。

  • 安全性隐患:极端情况下,过热可能引发火灾等安全事故。

  • 能源浪费:过多的电力消耗不仅增加了运营成本,还加剧了能源危机。 

热量不仅会影响单个电子元件的性能,还会对整个电子系统的可靠性造成威胁。以现代汽车为例,在汽车电动化、智能化和网联化的发展趋势下,车内集成了成百上千个电子元件,这些元件之间相互作用产生的热量和振动,会形成复杂的热应力和机械应力场,影响设备的稳定性和可靠性。

面对日益严峻的散热挑战,以及对芯片性能提升的孜孜以求,如何在保证芯片性能的前提下,有效解决散热问题,是摆在业界面前的一项紧迫任务。

从 EDA 的角度来看,要实现精准的热分析面临着诸多挑战。首先,热量在芯片内的传播路径复杂多样,需要考虑不同材料的热导率、界面热阻等因素。其次,对于 3D-IC 等先进封装技术,需要考虑不同层次之间的热传导和散热路径,这增加了分析的复杂性和计算的负担。此外,由于热仿真的精度要求高,需要考虑如何在保证计算效率的同时,不影响分析结果的准确性。

然而,当前市场上的热分析工具往往是零散的且功能单一,工程师需要同时使用多个不同的软件和方法来完成散热设计,这增加了工程开发周期和成本,同时降低了设计的效率和一致性。传统的电子散热设计和分析工具已显得力不从心。

因此,电子行业亟需要创新的方法和工具来为芯片“降温”。这种解决方案应具备以下特点: 

  • 早期评估:在设计初期就对热解决方案进行评估,积极利用数字孪生等创新技术,避免后期返工。通过采用“左移”开发策略,即在设计早期引入热分析,我们可以更早地发现并解决潜在的热问题,从而提高产品的可靠性。

  • 全局入手:将整个电子系统作为一个整体进行热分析,考虑各组件之间的相互作用。

  • 统一平台:提供一个集成的设计环境,涵盖热仿真、流体仿真等多种分析功能。

Cadence Celsius Studio:开启散热设计新时代

今年初,Cadence 以其一贯的创新精神,推出了一款真正的系统级热分析工具——Cadence Celsius Studio,它结合有限元分析(FEA)与计算流体力学(CFD)技术,为电子行业日益严峻的散热问题提供了一套全面的解决方案。作为业界首个将 AI 技术与热设计深度融合的综合性平台,Celsius Studio 打破了传统热分析工具的局限,将电热协同仿真、电子元件冷却和热应力分析整合到一个综合的平台,引领电子系统热设计迈向一个全新的智能化时代。

Cadence Celsius Studio 实现了多项突破:

(一)真正的热系统分析:在 Cadence Celsius Studio 中,热和应力的建模是通过有限元分析(FEA)来完成的,通过精细到粗略的网格设计,可以满足广泛的精度需求。在 Cadence Celsius EC Solver 中,工程师可以通过建模对流和/或主动冷却(如风扇等),来实现散热分析。

(二)AI 驱动,实现设计优化:当今的高性能电子系统要求设计人员考虑 SI、PI 和热完整性以及电磁干扰和兼容性(EMI/EMC)等问题,多物理场分析变得至关重要。Celsius Studio 中所搭载的 Cadence Optimality Intelligent System Explorer,是一款 AI 驱动的多物理场优化软件,它突破了传统人力密集型优化流程的限制,用 AI 驱动的技术取代了传统的设计-测试-优化循环的交互流程,可对整个设计空间进行快速高效的探索,锁定理想设计。

人工智能技术的引入,为电子设计自动化带来了革命性的变革。Celsius Studio 不仅能帮助工程师在设计早期阶段发现热问题,还可提供分析和设计洞察,预测潜在的热问题,并提供智能化的优化建议,尽可能减少机械工程团队的后期设计迭代,缩短电子系统的开发迭代周期。Celsius Studio 专为大规模并行执行而设计,经过生产验证,其可在不牺牲精度的前提下,与手动、详尽、强力的参数表研究相比,生产力平均提高 10 倍。

计算流体动力学(CFD)是多物理系统分析的一个方面,它使用数值模型模拟流体的行为及其热力学特性。

(三)打通电气工程师和机械工程师的“鸿沟”:随着 PCB 机械外壳尺寸日益减小以及 PCB 本身复杂性的增加,电气和机械工程师之间的协作对于芯片和系统的热分析和优化愈发重要。从电路板的轮廓到最终布局和布线,双方必须掌握相同的信息,彼此同步进行,并消除过程中的冗余。

为了进行这种分析,ECAD(电子计算辅助设计)+ MCAD(机械计辅助设计)的协作必不可少。MCAD 和 ECAD 之间的无缝集成曾经是导致分析速度慢的主要障碍之一。在 Celsius Studio 中,Cadence 内部的专家简化了 MCAD 和 ECAD 模型的导入过程,将之前几天的工作量大大缩短到几乎无感知的时间,使得电路板和机架内的热、应力和冷却分析变得更加高效和简便。

Celsius Studio 平台既面向电气工程师,也可以满足机械工程师的需求。对于电气工程师,Celsius Thermal Solver 可进行芯片/SoC 性能/热分析、封装和 PCB 的电热协同仿真,以及在兼顾热影响的同时进行封装/PCB 的元件摆放。对于热工程师,Celsius Electronics Cooling 提供了电子元件冷却散热分析,可通过添加散热器、风扇、通风口来缓解潜在的热问题。

(四)多平台无缝集成,众人拾柴火焰高:Celsius Studio 的强大之处在于,可以与 Cadence 的多种实现平台无缝集成,包括 Allegro X Design Platform(用于电路板设计)、AWR Design Environment(用于微波 IC)、Virtuoso System Design Platform(用于定制/模拟电路)和 Innovus Implementation System(用于数字电路),芯片散热是一个复杂的工程性问题。Cadence 正在集结过往几十年的经验,将更多的工具整合在一起,助力热分析更加便捷。

这些多工具的见解可指导电源整体热和应力分析以及热量减少策略、布局优化以及热通孔和温度传感器布局,让电气和机械/热工程师可以在同一个环境中对设计装配流程执行多阶段分析,解决单个封装上多晶粒堆叠的 3D-IC 翘曲问题,无需对几何体进行简化或转换。

Celsius Studio 正在成为电子行业解决热设计难题的首选工具,帮助企业提高产品竞争力,加速产品创新。 

通过采用Celsius Studio,三星半导体在设计早期阶段即获得了准确的热分析结果,显著提升了 3D-IC 和 2.5D 封装的设计效率,将产品开发周期缩短了 30%。

BAE Systems 利用 Celsius Studio 在 MMIC 设计周期内实现了快速、准确的热分析,大幅提升了 RF 和热功率放大器的性能。

Celsius Studio 帮助 Chipletz 的设计团队能够及早获取详细信息,解决散热问题,并显著缩短了周转时间。在 Chipletz 工程团队开发复杂设计时,能够多次高效且详细地运行 3D-IC 和 2.5D 封装的热仿真。 

总的来说,Cadence 的 Celsius Studio 为芯片、封装、电路板和终端系统提供全方位的热分析和优化提供了一种独辟蹊径的做法。 

结语

Cadence Celsius Studio 的推出,为当今电子行业的发展带来了全新的机遇。通过将人工智能与传统仿真技术相结合,Celsius Studio 将帮助工程师克服日益严峻的散热挑战,加速创新产品的上市。通过提供精确的热仿真和高效的设计优化功能,Celsius Studio 将成为电子工程师的得力助手,助力他们设计出更高性能、更可靠的电子产品。

2.中国科技巨头加速AI竞赛:百度、阿里、腾讯等大模型陆续亮相

全球对生成式人工智能(AI)的关注主要集中在OpenAI、Alphabet旗下的谷歌和Meta等美国大公司身上。但从阿里巴巴到腾讯,一些中国巨头在过去18个月内推出了自己的人工智能模型,希望利用围绕该技术获利。

中国立志成为人工智能领域的世界领导者,这为该国与美国的技术竞争又增添了一层底色。中国一直视为正在追赶美国,这一竞争正在升温。

生成式人工智能包括OpenAI的ChatGPT等应用程序,它能够根据用户提示生成文本、图像甚至视频。这些应用程序由大型人工智能模型提供支持,这些模型经过大量数据训练,例如谷歌的Gemini。

由于中国对人工智能模型及其用途有严格的要求,科技公司在发布技术时必须谨慎行事。

以下为中国较大的科技公司开发的大型中国人工智能模型:

百度:文心一言

百度是中国最大的互联网公司之一,也是中国最早推出生成式人工智能应用的公司之一。其模型为Ernie Bot(文心一言)提供支持,Ernie Bot是一款旨在与OpenAI的ChatGPT竞争的人工智能聊天机器人,这家中国公司表示,该机器人拥有3亿用户。

在该模型的“Turbo”版本发布之前,百度表示其最新版本Ernie 4.0的功能与OpenAI的GPT-4相当。据百度称,基础模型可以理解和推理。

与其他公司一样,百度正在通过其云计算部门出售使用其人工智能模型的能力。

阿里巴巴:通义千问

阿里巴巴去年推出了一套基础模型通义千问。阿里巴巴通常简称为Qwen,已经开发了可以执行不同任务的各种版本。例如,一个模型专注于创建内容或解决数学问题。另一个模型可以理解基于音频的输入并给出基于文本的输出。

其Qwen模型的某些版本是开源的,这意味着它们可以公开下载,但有一些限制,并由开发人员使用。

阿里巴巴5月份表示,其Qwen模型已被超过90,000家企业用户部署。

腾讯:混元

去年,腾讯推出了自己的基础模型混元。

企业可以通过腾讯的云计算业务访问混元的功能。腾讯表示混元具有强大的中文处理能力和“高级”逻辑推理能力。该模型可以支持包括图像创建和文本识别在内的功能。

腾讯将该模型定位为可供游戏、社交媒体和电子商务等行业的公司使用的模型。

腾讯运营着中国最大的消息应用程序微信。该公司今年推出了一款基于其混元模型的AI聊天机器人。这款名为“元宝”的人工智能助手可以从微信中提取信息和内容,腾讯希望将其产品与竞争对手区分开来。

字节跳动:豆包

字节跳动今年推出了一款人工智能模型,标志着其较晚进入与百度和阿里巴巴等竞争对手的竞争。然而,字节跳动推出人工智能模型的价格比其他公司便宜得多。豆包模型不仅具备生成语音的能力,还具备为开发者生成代码等功能(校对/孙乐)

3.镓仁半导体官宣成功研制氧化镓超薄6英寸衬底

9月11日,杭州镓仁半导体有限公司(简称“镓仁半导体”)官宣于8月在氧化镓衬底加工技术上取得突破性进展,成功研制超薄6英寸衬底,衬底厚度小于200微米。

镓仁半导体成立于2022年9月,是一家专注于氧化镓等宽禁带半导体材料研发、生产和销售的企业。

镓仁半导体指出,氧化镓(β-Ga2O3)具有禁带宽度大、击穿场强高、Baliga品质因数大等优势,在高压、大功率、高效率、小体积电子器件方面具有巨大的应用潜力,能够极大地降低器件工作时的电能损耗,有望成为未来半导体电力电子领域的主力军。

但是,氧化镓热导率较低,会加重器件的自热效应,大量热量积累在器件内部,会导致器件性能退化,使其在高功率领域的应用受到极大的限制。减薄衬底厚度,能够使器件产生的热量通过衬底散出,增强器件的散热能力,提高器件性能。超薄6英寸衬底为高性能器件的制备提供了一种新选择,满足功率器件领域的科研与生产需求,促进业内产学研协同合作。

今年8月6日,杭州镓仁半导体有限公司Pre-A轮融资及战略合作签约举行。镓仁半导体Pre-A 轮融资由九智资本领投,普华资本共同投资。

4.黄仁勋承认:Blackwell太抢手令客户关系紧张

英伟达CEO黄仁勋在高盛集团举办的技术会议上发表了讲话,他提到,“(对英伟达产品的)需求非常强劲,每个人都想要成为第一个收到货的,每个人都想收到最多的产品。”

此外,他特别指出,最新一代芯片“Blackwell”的需求强烈,供应商们正在迎头赶上,“我们现在可能有更多的情绪化客户,这也是理所应当的。现在局势有些紧张,我们正在尽最大努力了。”

当被问及大规模的人工智能支出是否能为客户带来投资回报时,黄仁勋表示,公司除了采用“加速计算”之外别无选择。他强调,英伟达的技术不仅可以加速传统工作负载(数据处理),还能处理旧技术无法管理的AI任务。

黄仁勋表示,虽然公司大部分技术都是自己研发的,可以将订单转给其他供应商,但这种转变可能会导致芯片质量下降。

他补充道,“台积电的敏捷性和响应我们需求的能力令人难以置信。我们使用它们的产品是因为它们很棒,但如果有必要,我们当然可以随时使用其他产品。”

数据中心运营商使用英伟达的芯片来开发和运行人工智能模型。对此类服务的狂热需求使其销售额和股价飙升。继2023年上涨239%之后,今年股价已上涨一倍以上。但该公司的大部分收入都依赖于少数客户——微软公司和 Meta等数据中心运营商。这种客户集中度使得公司在面对供应短缺时更加敏感。

5.倪光南院士:RISC-V走出硬件定制新路径

人工智能对性能和功耗的极致要求,使面向特定问题或特定领域的定制化芯片成为计算产业的普遍诉求。9月10日,中国工程院院士倪光南在2024奕斯伟计算开发者伙伴大会作致辞时表示,RISC-V为硬件定制化提供了一条新路径。

自2010年在加州大学伯克利分校诞生,RISC-V以开放、简洁、模块化、易扩展和低功耗的综合优势引起全球关注,出货增长和应用拓展呈现星火燎原之势。

倪光南表示,RISC-V已经从一项学术成果发展成为具有全球影响力的开源架构和产业底座,不仅覆盖了从微控制器到高性能计算的广泛应用领域,更在架构设计的简洁性、模块化和易扩展方面展现出独特的优势。

在14年的发展历程中,RISC-V实现了嵌入式系统、物联网、边缘计算等领域的大量应用,为各类计算设备提供了强有力的支撑。如今,RISC-V正在迈进高性能计算领域,向桌面、服务器、人工智能、数据中心等计算领域拓展。

“这一系列突破标志着RISC-V将迎来新的发展时代,为未来的计算架构开拓新的发展路径。”倪光南说。

人工智能,是RISC-V重塑芯片产业格局的突破点。当前人工智能对计算架构提出了更高性能、更低功耗、更强的并行计算能力等一系列新要求。而后摩尔时代,通用处理器的算力提升和功耗下降速度有所放缓。针对特定问题或特定领域来定义计算架构,成为市场的普遍诉求。

倪光南指出,软件技术的发展使软件定制化较易实现,但硬件定制化仍有待于解决,RISC-V在这方面提供了一条新路径。

“RISC-V在设计思想中就包含了DSA(Domain Specific Architecture,即面向特定领域)的概念。为此,RISC-V架构包含了模块化和自定义扩展指令集功能,并为扩展指令集预留了很大的扩展空间。”

芯粒(Chiplet)及其互联标准的发展,也为集成自定义控制指令集的专用支持硬件模块提供了支撑。“我们相信,RISC-V和Chiplet的完美融合将促进DSA计算架构的创新和发展,再结合软件调优,我们有望进入‘需求定义硬件’的新时代。”倪光南说。(电子信息产业网)

6.江波龙:SLC NAND Flash累计出货量已超5000万颗

近日,江波龙在接受机构调研时表示,在核心技术方面,公司在已有的技术储备及丰富的产品品类基础上,持续提升产品研发的深度与广度,长期投入研发资源,并取得积极成果:

1)在企业级产品领域,公司是国内少数具备“eSSD+RDIMM”的产品设计、组合以及持续供应能力的企业,并在互联网、运营商、金融等行业的众多客户处完成产品验证和批量应用。

2)在主控芯片领域,公司已经推出了eMMC和SD卡主控芯片(已经实现超千万颗的产品应用),并匹配自研固件算法,能够高效率满足客户的产品性能要求,增加大客户黏性;

3)公司拓展了SLC NAND Flash等小容量存储芯片设计能力,实质性构建了自研SLC NAND Flash存储芯片设计业务,产品获得客户认可,累计出货量已远超5000万颗。

封测制造方面,公司已在封装设计、测试算法及测试软件方面等储备了多年的实力,并于2023年完成了元成苏州和Zilia的并购,这是加强全球供应链布局,进一步开拓海外市场的重要举措,有助于公司形成全球化产能与国内产能兼顾、自主产能与委外产能并行的制造格局。

全球化布局方面,公司积极践行国内国际双循环战略,通过跨国收购Lexar(雷克沙)品牌及巴西头部存储厂商Zilia的股权进一步实现了全球化布局优势,不断扩大公司的海外市场份额,为公司国际业务的中长期发展奠定坚实基础。

责编: 爱集微
来源:爱集微 #芯片# #芯片散热#
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

关闭
加载

PDF 加载中...