华为、阿里押注“超节点”：不卷单卡性能追求“系统效率”才是国产AI正解？

今日快讯 2025年10月05日 00:48 0 aa

《科创板日报》10月4日讯人工智能正以史无前例的速度重塑各行业，这场变革背后离不开海量算力的支持。当AI模型参数从亿级跃升至万亿级，“超节点”开始逐渐取代单机与传统集群，成为新一代的“算力法宝”。

超节点，即Superpod，是一种用于构建大规模算力集群的技术架构。此概念最早由英伟达提出，指将数千张GPU集成在一个逻辑单元内，形成类似“超级计算节点”的系统。与传统架构不同的是，超节点可以通过高速互联技术，弥补原先服务器间带宽不足以及高时延等问题，以期实现算力效率的优化。

在不久前举行的2025云栖大会上，阿里云发布了磐久128超节点AI服务器。据悉，该服务器集成阿里自研CIPU 2.0芯片和EIC/MOC高性能网卡，单柜支持128个AI计算芯片。同等算力下，相较于传统架构，该服务器推理性能可提升50%。

除推理场景外，超节点亦可用于AI训练。今年4月，华为推出CloudMatrix 384超节点，其通过构建超过万片的大集群来提供算力。对于万亿、十万亿参数的大模型训练任务，在云数据中心，可将432个超节点级联成最高16万卡的超大集群。

在9月召开的华为全连接大会上，华为表示CloudMatrix 384超节点已销售300余套，共服务20余家客户，主要需求来自政企。未来，华为还将推出Atlas 950 SuperPoD超节点，算力规模8192卡，预计于2026年四季度上市。新一代产品Atlas 960 SuperPoD算力规模将达到15488卡，预计2027年四季度上市。

华龙证券指出，中美AI竞争正从“单卡性能”走向“系统级效率”，中国正在用集群建设+开源生态+工程化交付的方式完成AI基建方面的弯道超车。事实上，当前还有更多国产硬件厂商正在加速布局超节点：

8月7日，浪潮信息发布面向万亿参数大模型的超节点AI服务器“元脑SD200”。

沐曦股份已发布多种超节点形态，包括光互连超节点、耀龙3D Mesh超节点、Shanghai Cube国产高密度液冷整机柜以及高密度液冷算力POD。

8月28日，百度智能云发布百舸AI计算平台5.0版本。在算力方面，昆仑芯超节点正式启用。

从技术方向看，超节点正在成为AI基础设施建设的新常态。民生证券认为，此前市场更多关注芯片算力，但伴随Scale up产业趋势崛起，超节点已经重新定义AI基础设施的范式。

以华为超节点为例，其柜间采用全光互联，具有高可靠、高带宽、低时延等优势；另一方面，华为的Atlas 950通过正交架构，实现零线缆电互联，其独创的材料和工艺让光模块液冷可靠性提升1倍。相比英伟达将在明年下半年上市的NVL144，Atlas950超节点卡的规模是其56.8倍，总算力是其6.7倍，内存容量是其15倍，互联带宽是其62倍，在各方面均呈领先。

该机构进一步指出，当超节点速率大幅提升，AIDC功率将迎来新挑战。由于包括华为CloudMatrix 384、英伟达GB200NVL72在内的超节点单机柜功耗普遍突破100KW，因此在算力密度指数级增加的情况下，超节点机柜的温控和电源系统将面临挑战。而当Atas950超节点采用全液冷模式时，其互联带宽速率和算力速率均有望迎来大幅提升。

从投资层面来看，国金证券表示，华为超节点等新平台在算力、带宽、内存等关键指标上全面领先，有望推动国产算力基础设施加速落地。看好超节点渗透率的持续提升，带动光连接供应链的放量。