首页 景点排名文章正文

摆脱英伟达依赖,中国超算正在探索一条新路

景点排名 2025年10月24日 21:45 0 admin
摆脱英伟达依赖,中国超算正在探索一条新路

在AI浪潮席卷之下,一个观念似乎已深入人心:CPU的时代已经过去,现在是GPU的天下。这样的观念也造就了如今英伟达如日中天的声望。但这究竟是浮于表面的“噱头”还是未来发展的必然趋势?当一切回归真实用户需求,我们能从中找寻答案……

AI虽作为智能化发展的推动力,但没有办法替代所有的计算需求。不同的主流算力架构各有优势,却也会存在天花板,这并非技术上的落后与先进之争,而是不同技术方案对特定问题域的‘适配性’问题。在市场中,单一的GPU技术路线已无法满足日益复杂的计算需求,而在气候气象、生物医药、能源勘探等不同领域,我们都发现HPC+AI带来质效的提升。

(文/观察者网 陈济深;编辑/张广凯)

“没有高性能计算(HPC),就没有大模型。”

清华大学高性能计算研究所的学者、国内大模型领域早期研究与生态建设的重要推动者之一的韩旭在今年7月的这句论断,概括了算力基石对于人工智能的重要性。

所谓HPC是指利用超级计算机或大规模计算集群,在极短时间内完成单机无法胜任的复杂计算任务。它的核心目标是“用并行计算换取时间”——把大问题拆成无数小块,让成千上万颗 CPU/GPU 同时运算,几天甚至几小时就得出结果。

早在大模型出现之前,HPC就已经在用算力解决很多复杂问题,但由于其架构并非为生成式大模型设计,CPU在其中仍然扮演着核心地位,这在GPU主导的大模型时代自然会带来疑问:中国曾经重金投入的HPC建设过时了吗?它与AI,究竟应当如何融合?是简单的算力叠加,还是深度的架构变革?

带着这些问题,我们与太初(无锡)电子科技有限公司(以下简称“太初元碁”)首席产品官洪源进行了一场对话。

摆脱英伟达依赖,中国超算正在探索一条新路

洪源

作为HPC+AI融合路线的坚定提出者和一线实践者,洪源的分享为我们揭开了智能计算产业在喧嚣之下,一条清晰、务实且充满信心的破局之路。

这不仅是一家企业的战略思考,更是对整个中国计算产业在关键历史节点上的一次精准把脉。

AI时代,不止GPU

在AI浪潮席卷之下,一个观念似乎已深入人心:CPU的时代已经过去,现在是GPU的天下。

而长久以来,业界对HPC与AI的融合之路也充斥着质疑。一些权威声音,例如来自国防科技大学的专家就曾指出,HPC以CPU为核心,追求极致的双精度与低延迟,而AI则依赖GPU生态,侧重低精度与高吞吐,两者技术路线存在“天然矛盾”。

英伟达现在的如日中天,与英特尔的举步维艰,就是CPU/GPU之争最形象的表现。

但当GPU主导一切的观点几乎成为行业定论时,洪源却给出了一个源自产业一线的核心判断:“HPC+AI融合并非凭空设想,而是客户真实需求驱动的结果。”

这一核心判断的根源,是基于用户对于算力的真实诉求。“用户对于算力的需求其实一直都没有变。”

洪源认为,“概括起来有三点:第一,如何获得相对低成本的算力;第二,这些算力能不能解决我的最终问题;第三,用算后能不能带来新的价值。”

要理解为何客户的需求必然导向融合,我们需要深入剖析当前主流算力架构的优势与天花板。

首先是当前最为人熟知的GPU(图形处理器)。它以图形渲染起家,凭借数千个并行计算核心,在处理浮点数据方面能力强大,天然适合AI训练中海量的、结构单一的矩阵运算。

为了更好地支持通用计算,业界逐渐发展出GPGPU(通用图形处理器),即减弱传统GPU的图形显示能力,将资源全部投入到计算中。

然而,这条看似康庄大道的路径,其隐忧同样明显。由于GPGPU并非从通用计算原生出发,而是在传统GPU架构上“去图形化、强计算化”,导致其在功耗、内部指令调度等方面存在先天的妥协与冗余。

对于国内玩家而言,选择类CUDA体系虽然能借助其成熟生态快速迭代,但也意味着产品路径趋同,在核心调度与驱动技术上难以摆脱依赖,其发展上限被牢牢锁定。

其次是ASIC(专用集成电路)。这类芯片为特定算法(如音视频解码)量身定制,在特定场景下能做到性能最优、功耗最低,非常适合AI推理等固化场景。

但其“成也萧何,败也萧何”——架构被固化在晶圆中,灵活性极差。一旦算法变更(如Transformer结构变形、激活函数变动),芯片几乎无法适配。对于AI这种技术快速演进的领域,押注ASIC无异于一场豪赌,商业化风险极高。

这两种主流架构的盛行,催生了一种普遍的行业思维:即认为大多数复杂的计算问题,都可以通过简单地“AI化”(用AI算法重构问题)或“GPU化”(用GPU硬件加速解决)来应对。

“这并非技术上的落后与先进之争,而是不同技术方案对特定问题域的‘适配性’问题。”洪源的这句话点明了核心。许多关键行业的核心计算任务,并不能被简单地“AI化”或“GPU化”,其计算流程往往是 “强逻辑、高精度、复杂流程” 与 “大数据量、模式识别” 的混合体。

具体到特定任务,从计算精度看:传统科学计算(HPC)常要求FP64双精度浮点运算以保证结果的准确性,而主流AI训练则普遍使用FP16/BF16单精度乃至INT8整型来提升计算吞吐量。

而从任务流程看:GPU擅长“一张大网算到底”,但对于需要频繁逻辑判断、任务调度和高频交互的复杂流程,其内部指令调度能力相对较弱。这时,CPU强大的通用计算能力和灵活的控制逻辑反而更具优势。

基于异构众核的通用高性能计算芯片

华为可信计算首席科学家金意儿教授在2024年OpenHarmony技术峰会上也表达了类似观点:“未来芯片系统最主要的模式,将是集成通用多核处理器及专用加速处理器,同时获得通用处理器的灵活性和专用加速器的性能效率。”这也意味着,不走传统GPU路线,并非无奈之举,而是在深刻理解客户需求后,主动选择的一条技术上更优、更具适应性的道路。

正是基于这样的技术判断,那些看似“矛盾”的HPC与AI需求,在实际应用中找到了融合的落点。

太初元碁选择并坚持走异构众核的技术路线,打造通用高性能计算芯片,将HPC与AI深度融合。异构众核建立了一套更立体化的计算逻辑,适合各种通用计算场景,满足人工智能计算效率的同时,也能支持高精度科学计算。

异构众核是将不同架构的计算核心依据相关技术标准和规范有机内在融合在一颗芯片上,任务由最合适的工作单元来承担,不同异构内核之间实现协同计算。其在构建专用领域最大优势在于可根据领域的应用需求在芯片的系统架构设计中,灵活的分配通用计算与加速部分的配比,并且根据领域应用的特点设计为某个特定的领域问题设计专用的计算架构,同时在编程性上通过统一的编程模型实现异构系统的无缝整合。

对于开发者而言,异构众核架构的优势在于计算任务的拆解和并行处理上的便利性。基于严谨标准体系的设计,不同处理器单元之间能有机融合和对接,降低产品开发门槛。同时,为算法开发人员提供了更多的计算任务分解可能性,全栈开源的基础软件生态为技术创新提供了更高效的平台。

异构众核的诸多特点使得太初元碁自研的AI芯片在性能与功耗、产品开发、差异化创新与更改灵活性以及生态构建等方面展现出明显优势。

洪源对观察者网解释道,在许多前沿领域,单一的技术路线已无法满足日益复杂的计算需求,如何能够高效、并行去进行海量数据处理,成为许多行业、客户关注的问题。“在高性能计算的场景里面,其实客户也有很多做人工智能计算的这种结合的需求。”

气候气象领域可以认为是高性能计算扎根最深的领域之一,基于对全球大气和气候的海量数据,该领域常借助高性能计算来开展科学研究。AI大模型引入后,短临预报(一般为未来3小时的天气预报)的预测耗时可以从过往的6小时缩短到1小时,这是HPC+AI提升效率和准确度最直观的一个应用领域。

在生物医药领域,新药研发的“双螺旋”正在形成:AI大模型利用其强大的模式识别能力,从数以亿计的分子组合中筛选出最具潜力的候选药物,将过去需要数年的筛选工作缩短至几周甚至几天;而被选中的“天选之子”,则需要通过HPC进行精确的分子动力学模拟,预测其与靶点蛋白的结合效果和潜在副作用。AI的广度与HPC的深度在此完美结合。

在能源勘探领域,AI正在成为地质学家的“透视眼”。通过学习海量的地震波数据,AI能够以前所未有的精度勾勒出地下深处的地质构造。而一旦确定了潜在的油气藏,HPC便会接管,通过复杂的流体力学模拟,优化钻井方案和开采策略,最大化资源利用率。

“这些其实都是有高性能计算和人工智能计算结合的这样一个融合的需求,”洪源总结道,“AI虽作为智能化发展的推动力,但没有办法替代所有的计算需求,因此芯片仅兼容低精度能力远远不够。” 这种来自产业一线的真实呼唤,正是太初元碁坚定走上HPC+AI融合之路的根本原因。

中国可以有自己的算力生态

在当下的AI领域,英伟达CUDA生态的强大影响力毋庸置疑,它几乎成为了算力的代名词,让整个行业形成了一种默认的“路径依赖”。

然而,一个常被忽视的事实是,英伟达GPU本身的发展就与HPC密不可分,甚至可以说,其通用计算能力正是在HPC领域的应用需求下发展壮大的。

事实上,观察当前市场主流的数据中心GPU,其架构本身就是在单一芯片上集成了服务于AI的低精度张量核心(Tensor Cores)和HPC所需的高精度计算单元。这恰恰从侧面印证了HPC与AI的融合并非异端,而是行业发展的必然趋势。

当然,强大的硬件只是第一步。真正构建起行业“路径依赖”的,是其上层的CUDA软件生态。

对此,洪源认为,任何强大的生态都非一日之功。“CUDA生态是挺伟大的,但强大的生态也是一步步建立起来的。”他回顾道:“早些年它也是这么干出来的,只是后面慢慢形成一个标准,所有人都围绕它去做的时候,它就可以卖标品了。”

这正是国产算力建设者们的信心所在。既然融合是共识,那么实现融合的路径便不必只有一条。

洪源认为,中国算力的未来,不应是简单的模仿或依附,而是要走出自己的道路。“中国要想把自己的产品做好,其实它应该是有它自己的,既兼容并蓄、又有自己特点的这样一个生态。”

“兼容并蓄”,意味着尊重用户习惯,在技术上兼容现有主流框架,降低开发者的迁移成本。“有自己特点”,则意味着敢于在主流视野之外,根据产业的真实需求,探索更高效、更自主的技术路径。

太初元碁的“异构众核”架构,以及与龙芯中科合作2小时适配DeepSeek的成功实践,正是这一理念的生动注脚。它证明了在CUDA生态之外,通过软硬件的深度协同,同样可以为顶尖大模型提供强大的算力支持。这不仅是一次技术上的突破,更是构建全新自主产业生态的一次关键探索,它向业界展示了另一条道路的可能性。

从“强制替代”到“质优价廉”

“客户接受新的解决方案,是需要一个过程的。”洪源坦言。他认为,国产算力市场的心态演变,清晰地划分为三个阶段。

第一阶段,是“国产替代”政策驱动下的强制使用。在这一时期,用户的选择更多是出于战略安全考量,对性能和易用性的疑虑普遍存在。紧接着,是国产厂商奋起直追、性能逐步跟上的第二阶段。随着技术的不断迭代,国产算力开始在越来越多的场景中证明自己“能用”且“够用”。

而今天,市场正全面进入第三阶段——性能平替下的高性价比阶段。“越来越多行业,越来越多的用户,包括客户的决策人,他认识到我们自己的解决方案是能够满足需求的。”洪源判断道。这种心态的转变,可以用一个词来生动比喻,那就是“真香”。

但“真香”的体验远不止于采购成本,更体现在解决数据中心建设的“不可能三角”上。洪源指出,尤其在北京这样的大城市,客户对算力密度、能耗(PUE值)的要求越来越高,建设成本却要严控。对此,太初元碁推出的高密液冷解决方案,正是破局的关键。

摆脱英伟达依赖,中国超算正在探索一条新路

图为太初元碁其中一款自研产品

这并非简单的技术堆砌,而是一笔需要算“总账”的经济学。“初期购买和液冷建设成本可能会有一点上升,”洪源坦诚,“但是从未来5到10年的长期运营成本和单位算力成本来看,优势是巨大的。” 高密度部署节约了宝贵的机房空间,而液冷技术则有效解决了散热难题,大幅降低了PUE值和电费开销。

回看近两年太初元碁的发展之路,业务与订单便是市场对其最大的肯定。公开资料显示,太初元碁已参与多个国家公共算力基础设施建设,包括盐城超级计算中心、蠡湖未来城算力中心、延安智算中心等。日前,央视《新闻联播》对于中国联通三江源智算中心项目的报道中,众多拟签约名单里也出现了“太初”字样。同时,观察者网了解到,截止到今年第三季度,太初元碁拿下多个商业订单,总金额已超过3亿元。从营收增长来看,太初元碁近年年均营收增长均超过100%。

算力产业的“慢”与“深”

与上层大模型“以周为单位”的疯狂迭代相比,底层的算力产业遵循着截然不同的发展逻辑。当模型厂商为了参数量和排行榜而陷入“迭代焦虑”时,洪源和他的团队却显得异常清醒和坚定。

“很多大模型卷参数,但你卷完之后到底用在哪?有人说不重要,先把参数提上去,跑分不能输。”洪源一语道破了模型层的浮躁。他认为,这种模式不适用于算力行业。“芯片一个设计就是一两年,再出来产品周期一两年,整个三四年、四五年就过去了。这个行业其实就不适合赚快钱的人来干。”

这种“慢”,并非迟钝,而是一种必然的厚重。算力是基石,追求的是极致的稳定、能效和长周期的经济性。它需要的是战略定力,而不是战术跟风。洪源将这种定力总结为“聚焦应用”。无论是与东润数字能源合作,将HPC与AI的能力注入新能源电厂的选址、调度和交易,还是赋能科研机构进行更复杂的科学计算,太初元碁的每一步都紧紧围绕着“解决真实世界的问题”。

“潮水退去之后,才知道谁在裸泳。”洪源的这句话,是对整个算力产业的最好注脚。在资本和概念的热潮中,唯有那些踏踏实实打磨产品、深入行业创造价值的企业,才能拥有穿越周期的能力。拒绝迭代焦虑,回归应用本质,这不仅是太初元碁的选择,也应是整个国产算力产业走向成熟的必经之路。

百家争鸣,殊途同归

放眼当下的智能计算市场,呈现出一派“百家争鸣”的繁荣景象。从太初元碁的HPC+AI,到其他厂商的多元化探索,不同的技术路线并行发展。对此,洪源表现出开放和乐观。

“生态和市场足够大,其实是能容得下行业里面优秀的企业一起去做一些事情的。”他认为,当前阶段,每家企业首先需要找到自己最擅长的发力方向,明确自身优势与定位。“这是大家协同服务客户的基础。”

然而,百家争鸣只是过程,而非终局。洪源同样认为,构建统一的产业联盟和行业标准,是未来的必经之路。“我们也不希望客户要去适配过程,每家就重新适配一遍,其实切换成本也高。”他透露,太初元碁从一开始就坚持开源开放的路线,并积极参与工信部等机构推动的大生态建设。最终的目标,是殊途同归——共同打造一个强大、协作、繁荣的中国算力新生态。

在对话的最后,洪源对大模型行业的未来给出了自己的看法。洪源认为,当前的文本大模型技术正趋于稳定,而真正的下一个算力需求爆发点,将在于以视频生成为代表的“多模态”应用。

“我个人的判断应该就是在多模态系统,”他分享道,“未来如果视频能够很好的做分析做处理,甚至做合成,这块的算力可能又是一个指数型的(增长)。”

这场围绕算力的长征,依然在路上。而在这场没有硝烟的战争中,以洪源为代表的中国算力建设者们,正以他们的远见、务实与坚持,为未来铸造着最坚实的“中国芯”。

摆脱英伟达依赖,中国超算正在探索一条新路摆脱英伟达依赖,中国超算正在探索一条新路

本文系观察者网独家稿件,文章内容纯属作者个人观点,不代表平台观点,未经授权,不得转载,否则将追究法律责任。关注观察者网微信guanchacn,每日阅读趣味文章。

发表评论

长征号 Copyright © 2013-2024 长征号. All Rights Reserved.  sitemap