在美国限制措施下,开始大规模发货910C - AI News
在美国限制措施下,开始大规模发货910C

在美国限制措施下,开始大规模发货910C

2025-04-23

新闻要点

华为最早下月大规模发货昇腾 910C 芯片,此时中国开发者受限英伟达硬件。该芯片虽工艺不先进但性能可比肩英伟达产品,采用组合芯片等方法提升性能,其 CloudMatrix 384 系统有优势有不足,或助中国塑造人工智能未来。

- 昇腾 910C 最早下月大规模发货

- CloudMatrix 384 系统性能超英伟达 GB200

- 昇腾 910C 或成中国企业 AI 首选芯片

- 华为用自研芯片替代外国组件成趋势

主要内容

华为有望最早于下月开始大规模出货昇腾 910C 人工智能芯片。虽已有少量出货,但大规模部署将是中国企业寻求国产美国半导体替代品的重要一步。此举正值中国开发者在获取英伟达硬件方面面临更严格限制之际。美国政府近期通知英伟达,向中国销售其 H20 人工智能芯片需要出口许可证,这使得中国开发者在寻找能支持大规模训练和推理工作负载的替代方案。
华为昇腾 910C 芯片并非基于最先进的制程节点,但它是一种替代方案。该芯片本质上是早期 910B 的双封装版本,两个处理器使其性能和内存翻倍。熟悉该芯片的消息人士称,其性能与英伟达 H100 相当。华为采用了强力方法,而非依赖尖端制造,将多个芯片与高速光互连相结合以提升性能。这一方法是华为云矩阵 384 系统的核心,这是一个用于训练大型模型的全机架规模人工智能平台。云矩阵 384 包含部署在 16 个机架中的 384 个华为昇腾 910C 芯片,包括 12 个计算机架和 4 个网络。与基于铜的系统不同,华为的平台使用光互连,实现系统组件之间的高带宽通信。据 SemiAnalysis 分析,该架构包括 6912 个 800G LPO 光收发器,形成全光网状网络,使华为系统能提供约 300 千万亿次 BF16 计算能力,超过英伟达 GB200 NVL72 系统的约 180 BF16 千万亿次。云矩阵还声称在更高内存带宽和容量方面具有优势,提供超过两倍的带宽和超过 3.6 倍的高带宽内存(HBM)容量。然而,这种提升并非没有缺点。华为系统预计每浮点运算的效率比英伟达 GB200 低 2.3 倍,每单位内存带宽和容量的功率效率也较低。尽管每瓦性能较低,华为的系统仍提供了大规模训练先进人工智能模型所需的基础设施。消息人士称,中国最大的芯片代工厂中芯国际正在使用其 7nm N+2 制程生产 910C 的一些主要组件,但良率仍是一个问题,据报道一些 910C 单元包含台积电为中国厂商 Sophgo 生产的芯片,华为已否认使用台积电的部件。美国商务部目前正在调查台积电与 Sophgo 的关系,此前在华为早期的 910B 处理器中发现了 Sophgo 设计的芯片。台积电一直表示自 2020 年以来未向华为供应产品,并继续遵守出口规定。2023 年底,华为开始向选定的科技公司分发 910C 的早期样本并开放订单。咨询公司奥尔布赖特石桥集团表示,鉴于对美国制造芯片的出口控制仍在继续,该芯片很可能成为中国企业构建大型人工智能模型或部署推理能力的首选。虽然华为昇腾 910C 在功率效率或制程技术上可能无法与英伟达匹敌,但它预示着一个更广泛的趋势。中国科技企业正在开发国产的外国组件替代品,即使这意味着使用不那么先进的方法来实现类似的结果。随着全球人工智能需求的激增和出口限制的收紧,华为在国内提供可扩展人工智能硬件解决方案的能力可能有助于塑造中国的人工智能未来,尤其是在开发者寻求确保长期供应链并降低地缘政治风险之际。(图片来自 Unsplash)另见:华为的人工智能硬件突破