【本期受访人:Third Bridge Group半导体板块分析师Lucas Keh。Keh先生之前曾在Trubify担任投资经理多年。主要关注美国半导体大型企业的资本运作和北美产业风向,CNBC半导体视频类栏目嘉宾,专栏文章曾被华尔街日报,彭博社等多家媒体转载。】
在这一期的“集微访谈”栏目中,爱集微有幸采访了Third Bridge Group半导体板块分析师Lucas Keh。就关于英特尔和AMD数据中心问题,Arm和RISC-V生态竞争,AI和地缘政治问题等与其做了沟通,收到了十分有启发的答复。
集微访谈:目前AI手机、AI PC等已经成为业内热议的焦点,从消费端来看,AI需求是否会带来全新的商业模式?
Lucas Keh:我不认为这需要一个全新的商业模式。除非行业真正认识到AI 的重要性。他们会发现当前用于运行这些复杂的语言模型的处理器很昂贵,较新的高端处理器确实是比较贵的。我相信随着竞争和来自谷歌、亚马逊等数据中心公司的竞争,这些公司正在自研他们自己的芯片用AI来优化工作负载,而随着竞争环境越来越激烈,成本也会开始随之下降。
集微访谈:目前AMD和英特尔在数据中心领域都有哪些布局上的差别?
Lucas Keh:从时间节点上,我们需要退一步看这个问题。英特尔在20或者15年前曾占据数据中心领导地位,但随着时间的推移,由于管理不善和投资失误等原因,公司的发展偏离了他本来的一些强项地带,英特尔开始失去他们在数据中心的优势地位。从处理器的角度看,他们正在遭遇AMD的严重挑战。看目前宏观经济环境的总体状况,消费者对手机、电竞级PC的需求正在下降。而这正是 AMD和英特尔这两家所依赖的市场。就这两家公司进行一对一的比较来看,我们看到像AMD的数据中心营收实际上超过了他们的消费类电子收入。这说明什么?AMD可以通过架构、设计、封装的方式扩展他们的技术渠道。与英特尔相比,他们已经能够采取更多、更专业、更专注的方法来处理数据中心问题。他们已经能够比英特尔更好地按时交付产品,英特尔在这方面有些落后了。
集微访谈:对于某些大型半导体公司来说,数据中心能否抵消或者弥补一些消费类电子市场下滑造成的亏损?
Lucas Keh:还不足以抵消。如果你看一下AMD 最近一年的财报,某一季度电竞级PC,消费电子产品的收入约为16亿美元,而数据中心的收入是17亿美元。因此,我们看到数据中心收入首次出现拐点,使游戏、PC收入黯然失色。不过从增长率和净增数据来看,数据中心的收入增长显然还无法弥补PC等板块的下滑。
集微访谈:从很多咨询机构的报告以及各类市场调研来看,为什么数据中心扩张的反应度经常性跟不上市场变化?
Lucas Keh:我认为技术发展和市场扩张是两件不同的事情。当你在谈论扩张本身时,就会涉及到和半导体代工厂的那种增长现象。以英特尔、台积电、中芯国际等大厂为例,扩建新厂需要考虑土地、配套设施和工艺节点等等,从立项到量产需要大约四年左右时间。数据中心的扩张非常类似,首先有大量的资本投资进入到这个资本密集型产业。这就需要进行详细的规划和预测,全球范围内来看,并不是所有地方都能做到这一点——比如,不是所有地方的开放土地都将有资格作为数据中心的建设用地,因为土地必须能够符合数据中心的要求,所在的位置必须是合理的。疫情三年期间,数据中心市场的扩张是指数级的,但依然无法跟上市场需求。现在各大公司都已经意识到数据中心提前选址的重要性了,随着投资开始越来越多涌入这条赛道,我认为可以安全地假设,我们在未来能看到这些企业更好、更有效的规划。
集微访谈:现在比较火的一个概念是“软件定义数据中心”,即把基础设施元素(网络、存储、计算等)都进行了虚拟化并以SaaS的方式进行交付,如何看待硬软件结合这个趋势?
Lucas Keh:以最典型的走IDM模式的英特尔来说,他们控制着芯片生产的各个环节。数据中心拥有这类软件十分重要,因为一切都变得更加以系统为导向,最重要的问题或因素是集成,哪家公司能够将他们的硬件和软件无缝地集成在一起,并将其提供给客户,或者创建可以无缝集成硬件和软件的生态系统,谁就会成为赛道赢家。
话虽如此,英特尔并不是唯一一家这样做的公司。可以看到AMD正在追随他们的脚步。而且,我在2022年12月曾经发布一篇文章,分析了英特尔DCM管理体系( Data Center Manager)以及AMD公布的报告,指出相关硬件和软件有巨大的安全风险。系统集成度越高,发生系统风险的代价就越大。
我认为当下值得关注的是网络安全公司如何强化服务于这一特定领域的垂直增长。将来会有哪些公司能够赢得这个市场,或者像英特尔和AMD这样的公司是否会通过内部解决方案来做到这一点,这都很值得关注。回到刚才的问题,我认为像这种超大型公司,拥有自己的内部软件平台是非常必要的。硬软件的耦合让供应商对接、成本整合,以及对各类灵活的技术扩展等都会带来很多好处。我之前说过,这一领域另一大挑战是这些公司如何管理安全风险。
集微访谈:除了英特尔和AMD之外,为什么谷歌会选择自研数据中心芯片,会给其带来什么样的竞争优势?
Lucas Keh:谷歌选择创建这些TPU是出于两个原因。首先,公司已经认识到了AI/ML的重要性,并利用他们的优势来自动化数据中心的工作负载,这是第一个原因;第二个原因无论是微软、亚马逊、谷歌还是Meta,他们都认识到了自研芯片和IP的重要性。在某种程度上,如果这些软件巨头不想把所有东西都外包出去,他们要有资金来开发,谷歌自研TPU就是其中一个典型案例。这又回到了集成问题,在GCP平台上运行了某个谷歌软件工作负载或其他任何大型数据集,最后验证下来只有谷歌自己设计芯片运行的最好。微软Azure还使用了英伟达的GPU,但并不会像谷歌效率那么高,谷歌同时拥有软件和硬件并且优化了集成体系,他们可以定制任何他们想要的应用。
集微访谈:如何评价目前Arm以及RISC-V架构在数据中心的切入情况,它们各自都有什么样的机会?
Lucas Keh:我认为在数据中心这个环境,Arm和 RISC-V可以更多的共存,我认为它们正在每个各自擅长的地方都有自己的一席之地。基于Arm的处理器主要在移动端,如智能手机领域。与Arm相比,RISC-V仍然处于相当早期的发展阶段。我认为,到目前为止RISC-V在整个市场范围里还没有展示出可以主导的区域。我们只是开始看到更小、不那么复杂的工作负载采用 RISC-V。但就数据中心本身而言,我们将首先开始看到Arm架构的较大规模应用,毕竟它已经建立了相对良好的生态系统,包括合作伙伴网络和与供应商的关系等等,可以优化软件在生态系统中的工作负载。
RISC-V还在成长发育中。就功能应用的情形而言,基于Arm的处理器非常适合具有高数据集、高吞吐量的工作负载,而且这些场景还需要较低的功耗。Arm架构可以较好地处理这种情况。RISC-V的整个价值主张就是它的定制能力和灵活性。我相信RISC-V处理器仍然能够在这些高强度如AI/ML工作负载中得到落地。但我认为相比通用性,RISC-V会更多用在更定制化的应用程序和使用案例中。
RISC-V目前整体生态仍落后于Arm。对数据中心这样有很高的多样化需求的市场,RISC-V处理器目前只是一个利基市场。
集微访谈:整体来看,地缘政治是否会加重数据中心计算平台算力供给的不确定性?
Lucas Keh:美国对华出口就高性能GPU加强了管制。这种出口限制对中国云服务数据中心扩大市场需求造成了一些负面影响,其中包括了在相同的成本下,可能无法维持同等量的算力。区域经济保护主义对数据中心计算平台算力供给造成了很多不确定性。在谈到地缘政治紧张局势时,美国正在寻求与中国脱钩的态势比较明显,并将其大部分制造工艺更多地向美国国内转移,这已不是什么秘密。这将对算力全球化造成比较大的伤害,因为数据在地区、公司和用例方面会越来越多的本地化,尤其是在业内人士越来越担心IP侵权和安全性保障的情况下。总而言之,地缘政治肯定会对通用算力的全球化共享造成很多负面影响。(校对/朱秩磊)