首页 今日快讯文章正文

谷歌部署面向AI的新实例:基于第七代TPU“Ironwood”和“Axion”Arm CPU

今日快讯 2025年11月09日 21:55 0 admin

据TomsHardware报道,谷歌推出了面向人工智能(AI)引用的新实例,将由“Axion”Arm架构处理器和基于第七代TPU“Ironwood”提供支持。新实例专为大规模AI模型的训练与低延迟推理而设计,核心优势在于能够高效扩展AI模型,这主要得益于谷歌自研芯片的支持。

谷歌部署面向AI的新实例:基于第七代TPU“Ironwood”和“Axion”Arm CPU

第七代TPU“Ironwood”的峰值算力为4614 TeraFLOPS(第六代TPU芯片“Trillium”的5倍),内存高达192GB(“Trillium”的6倍);HBM带宽达到7.2 Tbps(“Trillium”的4.5倍);每瓦峰值算力为29.3 TeraFLOPS(“Trillium”的2倍);增强的芯片间互连 (ICI) 带宽,双向增至1.2 Tbps(“Trillium”的1.5倍)。此外,“Ironwood”还搭载了增强版专用核心SparseCore,用于处理“高级排序”和“推荐”任务中常见的数据类型,通过最小化芯片内数据移动和延迟来实现节能。

谷歌将“Ironwood”作为Google AI超级计算机架构的核心组件,通过软硬件协同优化,推动生成式AI向更复杂场景演进。在超级计算集群(Superpod)层面,提供了256芯片和9216芯片两种配置选择,后者的AI算力达到了42.5 ExaFLOPS,相比于TPU v4(4096芯片)和TPU v5p(8960芯片)的规模都要更大。

谷歌部署面向AI的新实例:基于第七代TPU“Ironwood”和“Axion”Arm CPU

连同“Ironwood”一起的还有“Axion”处理器,基于Armv9架构内核,不过谷歌并没有公布完整的芯片规格。其围绕Arm Neoverse v2平台构建,相较于现代x86处理器可提供50%的性能提升和60%的能效优势,同时比“当前云端最快的通用型Arm架构实例”性能高出30%。传闻该处理器每个内核对应2MB的L2缓存,共80MB的L3缓存,支持DDR5-5600内存,并为节点提供统一内存访问(UMA)功能。

虽然在AI时代,GPU与TPU抢尽了风头,但是CPU对于应用程序逻辑和服务托管,还有一些AI工作负载仍然能发挥至关重要的作用。

发表评论

长征号 Copyright © 2013-2024 长征号. All Rights Reserved.  sitemap