主要内容
中国初创公司 DeepSeek 的推出在硅谷引发了市场动荡和冲击波,挑战了一些人工智能公司运营和扩张的基本假设。在不到两年的时间里,这家总部位于北京的新公司完成了许多人认为不可能的事情:在仅花费竞争对手预算一小部分的情况下,创建了与行业巨头竞争的 AI 模型,并推断出响应。
公开推出时的影响是直接且可衡量的。据《南华早报》报道,包括英伟达、微软和 Meta 在内的主要科技股在投资者应对 DeepSeek 存在的影响时大幅下跌。该初创公司于 1 月 10 日推出的适用于 iOS 和 Android 的免费 AI 助手应用程序迅速攀升至苹果美国应用商店的榜首,取代了 OpenAI 的 ChatGPT,标志着中国 AI 产品在美国市场的历史性首次。
重要的是 DeepSeek 的技术方法。《算法之桥》报道称,该公司实施了多项创新解决方案,包括多头潜在注意力 (MLA) 以减少内存瓶颈和组相对策略优化 (GRPO) 以简化强化学习。这些进步使 DeepSeek 在使用显著更少资源的情况下实现了与美国竞争对手相当或更优的结果。该公司的资源效率令人瞩目:DeepSeek 仅使用不到 10 万 H100 GPU,而 Meta 到 2025 年底将部署 130 万 GPU。效率不仅体现在硬件上。《算法之桥》表明,考虑到开发时间和基础设施成本等因素,DeepSeek 的方法在资源利用方面提高了十倍。
然而,迅速进入西方用户视野并非没有挑战。《南华早报》报道称,DeepSeek 的突然流行导致了重大的基础设施压力,导致服务器崩溃和网络安全问题,迫使实施临时注册限制。成长的烦恼凸显了扩展 AI 服务的现实世界挑战,无论架构效率如何。
该公司对开源开发和研究透明度的承诺与美国主要科技公司的秘密方法形成鲜明对比。对许多行业观察家来说,开放和本地托管的 AI 可能是首选的部署蓝图。该公司赢得了科技行业知名人士的赞誉,包括风险投资家马克·安德森 (Marc Andreessen),他将 DeepSeek 的发展描述为“最令人惊叹和印象深刻的突破之一”。
这些事件的政治影响重大。美国总统唐纳德·特朗普将 DeepSeek 的出现称为美国行业的“警钟”,反映了对美中之间技术竞争的更广泛担忧。他继续在技术领域与中国竞争,实施限制关税,影响了全球各个角落。然而,这种情况超越了简单的国家竞争,代表了对 AI 发展既定思维的根本挑战。
展望未来,仍有几个关键问题。DeepSeek 的高效方法能否扩展以满足不断增长的需求?老牌企业是否已调整其策略以做出有效回应?这家中国公司已经证明,算法效率和开放合作可以取代原始计算能力和秘密作为 AI 进步的主要驱动力。AI 市场的动荡最终可能通过迫使重新评估既定做法而使整个领域受益,并有可能导致更高效、更易访问的 AI 开发方法。尽管 DeepSeek 的成就自进入公众视野以来令人瞩目,但重要的是要注意,美国主要科技公司也发布了自己的进展,市场竞争仍在继续。