主要内容
**英伟达AI革命中每秒赚2300美元,数据中心业务强劲**
在AI革命的推动下,英伟达每秒的利润高达2300美元。其数据中心业务规模庞大,其网络硬件的营收甚至超过了游戏GPU。目前,英伟达宣布推出三款新的AI GPU,希望借此巩固其市场领先地位:Blackwell Ultra GB300将于今年下半年上市;Vera Rubin将于明年下半年推出;而Rubin Ultra则将在2027年下半年问世。
今年的Blackwell Ultra并非我们去年所期待的那样。去年,英伟达曾表示将每年推出新的AI芯片,且速度前所未有。然而,Blackwell Ultra并非基于全新架构。尽管如此,在今日的GDC主题演讲中,英伟达迅速转向介绍下一架构Vera Rubin,其完整机架的性能是同类Blackwell Ultra的3.3倍。
在新闻发布会上,英伟达透露,单个Ultra芯片将提供与Blackwell相同的20petaflops的AI性能,但配备了288GB的HBM3e内存,而非Blackwell的192GB。同时,Blackwell Ultra DGX GB300“Superpod”集群的CPU和GPU数量与Blackwell版本相同,但内存从240TB提升到了300TB。
总体来说,英伟达将新的Blackwell Ultra与2022年的H100芯片进行了比较。H100是英伟达AI业务的基石,也是许多公司升级的首选。在FP4推理方面,Blackwell Ultra是H100的1.5倍,且能大幅加速“AI推理”。NVL72集群能运行DeepSeek-R1 671B的交互式副本,只需10秒即可提供答案,而H100则需1.5分钟。这是因为新的芯片每秒能处理1000个令牌,是2022年芯片的十倍。
值得注意的是,一些公司可以购买单个Blackwell Ultra芯片。英伟达宣布推出一款名为DGX Station的台式机,搭载单个GB300 Blackwell Ultra芯片、784GB统一系统内存、内置800Gbps网络及承诺的20petaflops AI性能。华硕、戴尔、惠普等也将加入Boxx、Lambda和Supermicro一起销售这款台式机。
此外,英伟达还将推出一款名为GB300 NVL72的单机架产品,提供1.1 exaflops的FP4性能、20TB HBM内存等。但Vera Rubin和Rubin Ultra在2026年和2027年推出后,其性能可能会大幅提升。Rubin拥有50petaflops的FP4性能,而Rubin Ultra则包含两个连接在一起的Rubin GPU,性能达到100petaflops,内存近四倍于Blackwell。
Nvidia表示,Blackwell已创造110亿美元的营收;仅前四大买家就在今年购买了180万个Blackwell芯片。在今日的GPU技术大会上,创始人兼CEO黄仁勋表示,为了跟上需求,这一行业的计算需求将是去年的100倍。他还透露了下一架构Feynman,预计将于2028年推出。