首页 抖音热门文章正文

百灵万亿参数模型「Ling-1T」上架华为云,支持专属资源部署

抖音热门 2025年10月18日 21:32 0 aa

IT之家 10 月 18 日消息,华为中国今日发文宣布,蚂蚁集团万亿参数大模型 Ling-1T 上架华为云大模型即服务 MaaS 平台。Ling-1T 是百灵大模型系列的首款旗舰级“非思考”模型,拥有万亿参数,并已开源。华为中国表示,此次模型上架支持专属资源部署,可全面释放 Ling-1T 模型能力。

百灵万亿参数模型「Ling-1T」上架华为云,支持专属资源部署

图源:华为中国官方公众号,后同

据介绍,万亿参数大模型 Ling-1T 每个 token 可激活约 50B 参数。模型基于先进的 Ling 2.0 架构,在超过 20T tokens 的高质量、高推理浓度语料上完成预训练,并支持 128K 的上下文窗口

通过“中训练 + 后训练”演进式思维链(Evo-CoT)技术,Ling-1T 在多项国际权威的复杂推理基准测试中(如代码生成、软件开发、专业数学及逻辑推理等)取得了业界顶尖(SOTA)表现,Ling-1T 在有限输出 token 条件下,于多项复杂推理基准中取得 SOTA 表现,展示出模型兼顾推理效率与准确性。

百灵万亿参数模型「Ling-1T」上架华为云,支持专属资源部署百灵万亿参数模型「Ling-1T」上架华为云,支持专属资源部署

IT之家从华为中国获悉,Ling-1T 模型与 CloudMatrix384 超节点在架构、性能和部署上存在高度互补。Ling-1T 作为高效推理的模型,可利用 CloudMatrix384 超节点为大规模 MoE 模型提供的加速和优化,在实际应用中发挥出更强的性能,具体优势如下:

  • MoE 架构与全对等互联:Ling-1T 模型采用 MoE(混合专家)架构。MoE 模型的核心在于稀疏激活机制,分布式部署时会产生大量 All-to-All 通信需求,而传统网络架构难以高效处理。CloudMatrix384 超节点通过全对等互连架构,高度契合 MoE 模型的通信密集型需求,有效避免通信瓶颈。
  • 专家并行与动态负载均衡:Ling-1T 模型由 256 个专家模块组成,模型推理时需激活约 50B 参数,推理过程会产生大量网络通信。CloudMatrix384 超节点通过超高速互联网络与基于内存语义的零拷贝数据聚合技术,有效突破大规模专家并行计算中的通信瓶颈,为超大规模语言模型推理提供高可靠、低延迟的端到端算力支持,从而在超节点上实现 Ling-1T 的高吞吐量和低延迟推理任务。

目前,华为云大模型即服务 MaaS 平台已预置 DeepSeek、Qwen3、Kimi 等业界主流开源大模型,并基于昇腾 AI 云服务完成深度适配与优化,模型部署和运行在云端,无需自行处理复杂的硬件和部署问题,用户可通过 API 接口快速调用 LLM、多模态等模型服务。

百灵万亿参数模型「Ling-1T」上架华为云,支持专属资源部署

发表评论

长征号 Copyright © 2013-2024 长征号. All Rights Reserved.  sitemap