首页 十大品牌文章正文

美芯片封锁失败,华为“算力炸弹”堆出新高度,超英伟达1.7倍

十大品牌 2025年07月27日 19:40 0 aa

自大模型诞生以来,“算力焦虑”就一直伴随着大模型企业,尤其是万亿级别的ChatGPT、DeepSeek、百度文心一言、阿里通义千问、腾讯混元等等。

美芯片封锁失败,华为“算力炸弹”堆出新高度,超英伟达1.7倍

而解决算力焦虑的办法主要有两种,一种,提升AI芯片的性能;第二种,将多个AI芯片做成“集群”,当然两种方式结合在一起效果更佳。

市场普遍认为,AI大模型的算力门槛是“1万枚英伟达A100芯片”,也就是“万卡集群”。

但是随着AGI的概念的火爆,行业对算力的要求越来越高,万卡集群已经无法满足需求了。国外的OpenAI、微软Meta等科技巨头,已经准备构建10万卡规模的GPU集群了。

美芯片封锁失败,华为“算力炸弹”堆出新高度,超英伟达1.7倍

10万卡集群简直就是“烧钱”,光是AI服务器价格就达到了几百亿人民币,加上配套电力、散热等配套设施,投资可想而知。

国内能够玩的起的恐怕只有字节、阿里、腾讯、百度这类大厂了,但是这里面还有一个问题,那就是AI芯片,在美国的限制下从哪去弄10万张芯片呢?

美芯片封锁失败,华为“算力炸弹”堆出新高度,超英伟达1.7倍

对于企业的担心,华为创始人任正非表示:“芯片问题其实没必要担心,用叠加和集群等方法,计算结果上与最先进水平是相当的。”

这番表态打消了国内企业的担忧,也增强了国产AI发展的信心。

就在近日的世界人工智能大会上,华为首次展现出了384个超节点的超级AI服务器,被称为“算力炸弹”,当之无愧的成为了2025年世界人工智能大会的“镇馆之宝”。

美芯片封锁失败,华为“算力炸弹”堆出新高度,超英伟达1.7倍

这款超级AI服务器具备超大带宽、超低时延、超强性能的三大优势,其相关参数如下:

芯片规模:384颗昇腾NPU(AI芯片)+192颗鲲鹏CPU,然后通过华为自主研发的总线技术互联在一起。

硬件构成:12个计算柜、4个总线柜、内部采用了3168根光纤、6912个高速光模块。

算力:总算力达300Pflops,是英伟达NVL72的1.7倍,

带宽:网络带宽达269TB/s,比英伟达NVL72提升107%;内存总带宽达1229TB/s,比英伟达NVL72提升113%;单卡推理吞吐量跃升到2300 Tokens/s。

能效:千亿大模型训练性能提升2.5倍,多模态性能提升3倍。

AI服务器做好了,现在要把432个这样的服务器连接在一起,构成一个“16万卡”的超算集群,以满足十万亿大模型的训练需求。

可以确定的是AI芯片不是问题,华为自主研发,国内晶圆厂代工,国外限制不了;电力供应也不是问题,我国是全球发电量最多的国家,特高压输电技术首屈一指。

难得是这16万颗昇腾芯片如何组合在一起,并且保证数据传输顺畅

华为的方法是直接打破传统的CPU为中心的“主从架构”,改为新的“全对等架构”。

美芯片封锁失败,华为“算力炸弹”堆出新高度,超英伟达1.7倍

即:利用高速互联总线从服务器内部扩展到整机柜、跨机柜,最终将CPU、NPU、DPU、存储和内存等资源全部互联和池化,从而去除掉繁多的中转环节。

事实证明这个方法完全行得通,华为服务器比英伟达NVL72服务器带宽高出1倍。

美芯片封锁失败,华为“算力炸弹”堆出新高度,超英伟达1.7倍

至于散热就比较简单了。光是液冷技术就衍生出了3种,包括冷板式液冷、浸没式液冷、喷淋式液冷。

无论是冷却液循环带走热量,还是将服务器浸泡在冷却液中360°散热,或者哪热喷哪,都可以有效降温。

华为超节点技术能够弥补芯片工艺落后吗?

国产芯片工艺落后这是不争的事实,海外芯片已经迭代至了3nm,甚至明后年就可能出现2nm。但是国产芯片还在14nm、7nm工艺上打磨。

落后几代的芯片真的能通过“集群”,在总算力上追平或超过英伟达吗?

美芯片封锁失败,华为“算力炸弹”堆出新高度,超英伟达1.7倍

要知道,英伟达的旗舰芯片H100,采用了台积电4nm制造工艺,光是晶体管就集成了800亿个,算力更是达到了2000 TFLOPS。

而华为昇腾910B的算力为320 TFLOPS,二者在算力上相差6倍。

美芯片封锁失败,华为“算力炸弹”堆出新高度,超英伟达1.7倍

这似乎与华为专家所表示的,“单芯片制程从7纳米到5纳米、3纳米、2纳米,每代性能提升不超过20%,总体能提升50%左右。有点出入啊!

不过从目前来看,华为的确通过高效的互联技术,把更多的AI芯片集成在了一起,16万块的规模同样满足了10万级大模型的需求。这才是最重要的。

解决了当下的需求,才会有更多的精力去研发先进的5nm、4nm工艺。

美芯片封锁失败,华为“算力炸弹”堆出新高度,超英伟达1.7倍

芯片制造工艺落后,这不是华为的责任,这是历史原因造成的,芯片技术本来就诞生于西方国家,之后发展壮大,传入到我国。

2000年左右,我们搞自主研发,过程中还出现了“造假”风波、打压限制,能取得今天的成绩已经是非常了不起了。

我相信在科研人员共同的努力下,很快就会实现工艺的突破,5nm、4nm近在咫尺,到时候搭配华为强大的互联互通技术,会彻底解决我们的算力焦虑。

但是在这之前有个前提,那就是国内厂商、消费者要大力支持国产AI芯片,一方面有助于芯片企业的资金回笼,研发迭代,另一方面会形成良好的生态。

美芯片封锁失败,华为“算力炸弹”堆出新高度,超英伟达1.7倍

英伟达之所以能够畅销全球,占领80%以上的市场份额,有很大一方面原因就是生态完善,几乎所有的软硬件、工具厂商都适配英伟达AI芯片。

比如,你建了一座算力中心,使用的是英伟达AI芯片,现在呢?想要算力升级,英伟达的方案是提供新的芯片,进行更换就OK了。

而使用国产芯片,要当心硬件、软件是否适配,如果不适配的话,你愿意更换掉整台服务器吗?不仅费时费力,还费钱。

所以,作为消费端,在规划建造一座算力中心时,就应该优先考虑国产AI芯片,助力生态建设。


我是铭程,欢迎评论区留言,共同讨论!

发表评论

长征号 Copyright © 2013-2024 长征号. All Rights Reserved.  sitemap