潮新闻 记者 张帆 通讯员 张飞虎 王涛浙江海事供图9月27日,“超级工程”杭州湾跨海铁路大桥成功将全桥首孔80米预制混凝土箱梁架设至107-108#...
2025-09-29 0
9月25日,在2025人工智能产业及赋能新型工业化大会上,中国信通院和中国人工智能产业发展联盟联合华为、工信部人工智能关键技术和应用评测实验室等63家企事业单位共同发布《大模型推理平台技术能力成熟度》标准,旨在规范大模型推理平台的技术能力。会上,华为推理存储首席专家张静斌作为标准编制代表发表主题演讲。
中国信息通信研究院人工智能研究所专家对《大模型推理平台技术能力成熟度》标准进行解读,表示以KV Cache为核心的系统设计已成为推理优化的关键,主流大模型与AI芯片厂商为突破显存瓶颈,已纷纷开始采用外置存储提升推理效率。其中,英伟达Dynamo架构和华为UCM(Unified Cache Manager,推理记忆数据管理器)架构方案,均可助力产业在时延、精度、成本、资源等多方约束条件下,构建高可用、高性能、可扩展的大模型推理基础设施。
华为推理存储首席专家张静斌指出,下一代AI负载主要表现为快慢思考合一、原生长序列以及多模态融合,在长序列推理与Agentic Context(智能体上下文)两方面对数据存储的挑战巨大。为此,华为推出 UCM推理记忆数据管理技术架构,其支持多样化推理引擎与多元算力生态,保持开放、开源、共建;充分发挥池化存储、CPU/内存等异构资源,系统性优化Token成本;构建面向未来AI集群演进的架构,如支持状态分离、直通加速、弹性P/D、数据安全等。
UCM实现推理加速主要体现在:
华为推理存储首席专家张静斌
此外,华为将于近期在魔擎社区正式开源UCM技术,与产学研共建,实现推理加速技术迭代与应用创新,推动形成标准架构,为Agentic AI时代打造更先进、更开放的数据基础设施,助力人工智能产业迈向新高峰。
相关文章
潮新闻 记者 张帆 通讯员 张飞虎 王涛浙江海事供图9月27日,“超级工程”杭州湾跨海铁路大桥成功将全桥首孔80米预制混凝土箱梁架设至107-108#...
2025-09-29 0
9月25日,在2025人工智能产业及赋能新型工业化大会上,中国信通院和中国人工智能产业发展联盟联合华为、工信部人工智能关键技术和应用评测实验室等63家...
2025-09-29 1
在2025雷军年度演讲活动结束后,小米集团董事长、CEO 雷军与媒体对话。雷军表示,其实小米最初定位成一个极客品牌,为网络发烧友准备的。我们谁也没有想...
2025-09-29 1
原标题:3位院士眼中的科普工作——把科学梦想“种”进更多人心田(弘扬科学家精神·关注科普月) 郑纬民在授课。吴承蔚摄 舒德干(左一)在和学生交流。西北...
2025-09-29 1
创作减负,创意加速。近期商汤推出的AI视频Agent Seko受到了大众的关注,目前已有10万创作者在使用。Seko不是一个单纯的视频生成器,它是行业...
2025-09-29 1
【无需打开直接搜索微信;-】 操作使用教程: 1.亲,实际上微乐湖北麻将万能开挂器是可以开挂的,确实有挂.2.在"设置DD辅助功能DD微信麻将开挂工具...
2025-09-29 10
现在人们打棋牌麻将谁不想赢?手机微乐麻将必赢神器但是手机棋牌麻将是这么好赢的吗?在手机上打棋牌麻将想赢,不仅需要运气,也需要技巧。掌握的棋牌麻将技巧就...
2025-09-29 7
您好:这款游戏可以开挂,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到-人的牌一样。所以很多小伙伴就怀疑这...
2025-09-29 5
发表评论