中国人工智能初创公司DeepSeek发布了 R1 模型,成为人工智能界热议话题。尽管 R1 占用的资源和计算能力更少,但它的功能和准确性与美国同行相比,似乎对整个人工智能行业来说都是一个胜利。但这不一定对每个人都是好消息。
半导体巨头 Nvidia 发现自己正面临 DeepSeek 近期成就的不利影响。根据雅虎财经的数据,这家芯片巨头的股价从周五公开市场收盘到周一公开市场收盘暴跌了 16.9% 。英伟达的市值缩水了近 6000 亿美元。周五下午,英伟达 的股价收于每股 142.62 美元。周一,该股收于 118.58 美元。
有人猜测 DeepSeek 模型的发布之所以会影响英伟达的股价,是因为 R1 提供了一个清晰的例子,即 AI 模型并不一定需要昂贵的高端芯片或硬件来构建令人印象深刻的模型,这对于英伟达这样的芯片制造商来说并不是一个好消息。
英伟达发言人通过电子邮件告诉 TechCrunch:“DeepSeek 是一项出色的 AI 进步,也是测试时间扩展的完美示例。”“DeepSeek 的工作说明了如何使用该技术创建新模型,利用广泛可用的模型和完全符合出口管制的计算。推理需要大量 Nvidia GPU 和高性能网络。我们现在有三个扩展定律:预训练和后训练,它们将继续,以及新的测试时间扩展。”
这一切发生的时间很有趣,因为就在一周前,美国前总统乔·拜登签署了一项行政命令,进一步限制美国生产的先进人工智能芯片向某些国家的出口,并几乎全面限制向中国等国家(DeepSeek 的总部所在地)出口芯片。
当时,英伟达表示,这项行政命令“史无前例且具有误导性”,并将“破坏”全球创新和经济增长。
此后,特朗普总统推翻了拜登的行政命令,并签署了另一项行政命令,以创建星际之门项目,这是一项基础设施计划,将向人工智能数据中心投资高达 5000 亿美元。