首页 十大品牌文章正文

华为联合中国信通院发布《大模型推理平台技术能力成熟度》标准

十大品牌 2025年09月29日 09:32 1 admin

9月25日,在2025人工智能产业及赋能新型工业化大会上,中国信通院和中国人工智能产业发展联盟联合华为、工信部人工智能关键技术和应用评测实验室等63家企事业单位共同发布《大模型推理平台技术能力成熟度》标准,旨在规范大模型推理平台的技术能力。会上,华为推理存储首席专家张静斌作为标准编制代表发表主题演讲。


华为联合中国信通院发布《大模型推理平台技术能力成熟度》标准


中国信息通信研究院人工智能研究所专家对《大模型推理平台技术能力成熟度》标准进行解读,表示以KV Cache为核心的系统设计已成为推理优化的关键,主流大模型与AI芯片厂商为突破显存瓶颈,已纷纷开始采用外置存储提升推理效率。其中,英伟达Dynamo架构和华为UCM(Unified Cache Manager,推理记忆数据管理器)架构方案,均可助力产业在时延、精度、成本、资源等多方约束条件下,构建高可用、高性能、可扩展的大模型推理基础设施。

华为推理存储首席专家张静斌指出,下一代AI负载主要表现为快慢思考合一、原生长序列以及多模态融合,在长序列推理与Agentic Context(智能体上下文)两方面对数据存储的挑战巨大。为此,华为推出 UCM推理记忆数据管理技术架构,其支持多样化推理引擎与多元算力生态,保持开放、开源、共建;充分发挥池化存储、CPU/内存等异构资源,系统性优化Token成本;构建面向未来AI集群演进的架构,如支持状态分离、直通加速、弹性P/D、数据安全等。


UCM实现推理加速主要体现在:

  • 以查代算,基于历史推理数据做推理加速,避免重复推理计算;
  • KV Cache分层卸载及稀疏加速,实现长序列场景推理加速能力;
  • 后缀检索,基于历史记忆的智能联想,实现推理吞吐提升;
  • 基于KV Cache池化能力,增强以数据为中心的推理平台能力,面向未来支持Agentic AI数据挖掘能力。


华为联合中国信通院发布《大模型推理平台技术能力成熟度》标准

华为推理存储首席专家张静斌


此外,华为将于近期在魔擎社区正式开源UCM技术,与产学研共建,实现推理加速技术迭代与应用创新,推动形成标准架构,为Agentic AI时代打造更先进、更开放的数据基础设施,助力人工智能产业迈向新高峰。

发表评论

长征号 Copyright © 2013-2024 长征号. All Rights Reserved.  sitemap