将人工智能从英伟达迁移至华为:机遇与权衡 - AI News
将人工智能从英伟达迁移至华为:机遇与权衡

将人工智能从英伟达迁移至华为:机遇与权衡

2025-10-29

新闻要点

多年来英伟达在 AI 领域占主导,如今华为 AI 成为替代选择 。华为推出 SuperPod 集群等,有诸多优势,但迁移存在挑战 。在一些场景下企业有迁移需求,也有字节跳动等成功案例。

- 华为 SuperPod 集群 数据链接比英伟达快 62 倍

- 迁移至华为 或需重造开发流程 成本高

- 字节跳动用华为 Ascend 910B 芯片训练新模型成功

主要内容

多年来,英伟达凭借其成熟的 GPU 系列、CUDA 软件栈以及庞大的开发者社区,一直是 AI 模型训练和推理基础设施的事实上的领导者。因此,脱离这一基础是一个战略和战术上的考虑。华为 AI 是英伟达的替代品,这家中国公司正表明其在 AI 硬件、芯片和系统领域日益积极的行动。这给决策者带来了机会,例如:该公司推出了其 SuperPod 集群,可连接数千个昇腾 NPU,声称数据链接例如“快 62 倍”,且该产品比英伟达的下一代替代品更先进。华为的策略强调其推理优势。在出口管制或供应链风险使单一供应商(英伟达)策略不那么稳健的国内或替代市场中,这家中国公司的产品组合是合理的选择。

然而,向以华为为中心的管道迁移并非简单的即插即用替代。这将需要开发者生态系统的转变和可能的区域调整。

转向以华为 AI 为中心的管道的商业优势:在考虑转移时,一些商业优势可能会促使做出最终决定。依赖一个主要供应商(即英伟达)可能会带来风险:定价杠杆、出口管制、供应短缺或创新的单点故障。采用或迁移到华为有可能提供谈判杠杆,避免供应商锁定,并提供访问替代供应链的机会。在英伟达面临出口限制的领域尤其如此。如果一个组织在华为生态系统更强的地区(例如中国、亚洲部分地区)运营,或国内激励措施有利于本地硬件,转向华为可能符合企业战略。例如,字节跳动已开始主要在华为的昇腾 910B 芯片上训练新模型,并取得了显著成功。华为的技术专注于推理和大规模部署,因此可能更适合长期使用,而不是偶尔用于大型基础设施训练,然后进行强度较低的推理。如果一个组织的工作负载是推理密集型的,华为的堆栈可能在成本和功耗方面提供优势。移动华为的内部集群(例如 CloudMatrix)在特定基准测试中已显示出竞争结果。

风险和权衡:尽管迁移提供了潜在的收益,但也存在一些挑战。英伟达的 CUDA 生态系统在工具和社区支持方面仍然无与伦比,英伟达已成为大多数公司和企业的首选解决方案。迁移到华为的昇腾芯片和 CANN 软件栈可能需要重新设计工作负载、重新培训员工和调整框架。这些都不是可以轻视的考虑因素。此外,华为硬件在高端基准测试中仍落后于英伟达。据报道,一家中国公司需要 200 名工程师和六个月的时间才能将一个模型从英伟达迁移到华为,但仅达到了之前性能的约 90%。开发管道的大规模重建将产生工程和运营成本。如果在英伟达硬件和 CUDA 优化工作流上有大量投资,切换不会在短期内节省成本。尽管使用华为技术减轻了对西方芯片的依赖,但鉴于该公司在关键国家基础设施中的硬件争议,可能会引入其他监管风险。这在华为硬件面临自身限制的全球市场中尤为相关。

华为 AI 的实际案例:有几个案例研究显示了华为技术的有效性。TikTok 的母公司字节跳动已在华为的昇腾 910B 硬件上训练了新的大型模型。DeepSeek 目前正在推出针对华为 CANN 栈优化的 AI 模型(例如 V3.2-Exp)。

适合迁移的组织:对于在国内市场或对供应链有特定需求的公司,迁移到华为可能是有意义的。