在食品和饮料行业的生产环境中,设备的可靠性、卫生标准以及安全性是至关重要的考量因素。轴承座作为支撑和保护轴承的关键部件,其性能直接影响生产线的稳定性和...
2025-08-15 0
智东西
作者 | 李水青
编辑 | 云鹏
智东西8月15日消息,今天,谷歌推出史上最小Gemma 3开源模型,一个拥有2.7亿个参数的轻量级模型,底层设计以特定任务微调为目标,具备强大的指令跟踪和文本能力。
在指令执行能力测试中,如IFEval基准测试所示,Gemma 3 270M超越了尺寸更大的Qwen2.5 0.5B Instruct,与Llama 3.2 1B能力比肩。
Gemma 3 270M在一些特定任务上能达到甚至超越大模型的能力。该模型的尺寸和性能使其非常适合离线、基于网页的创意任务。比如谷歌公布了一个案例,其用Gemma 3 270M驱动一款使用Transformers.js的睡前故事生成器网页应用,通过简单的勾选就可以生成精彩的睡前故事。
Gemma 3 270M的核心能力如下:
1、轻量而强大的架构。该模型共有2.7亿个参数,由于词汇量庞大,嵌入参数有1.7亿个,Transformer模块参数有1亿个。得益于256k个token的庞大词汇量,该模型能够处理特定和稀有的token,使其成为可在特定领域和语言中进一步微调的优质基础模型。
2、极致能效。该模型的一大优势在于低功耗,其在Pixel 9 Pro SoC上进行的内部测试表明,INT4量化模型在25次对话中仅消耗0.75%的电量,使其成为谷歌最节能的Gemma模型。
3、指令遵循。该模型同步发布了指令微调版本与预训练检查点(checkpoint)。虽然该模型并非为复杂的对话用例而设计,但其基础指令遵循能力出色,可 “开箱即用” 地响应通用指令。
4、可用于生产的量化。模型提供量化感知训练(Quantization-Aware Trained, QAT)检查点,支持以INT4精度运行,且性能损失极小,这对于在资源受限设备(如手机、边缘设备)上部署至关重要。
换句话说,如果用户有一个高容量、定义明确的任务,在成本上需要精打细算,又需要快速迭代和部署,或是有保护隐私的需求,他都适合选择Gemma 3 270M。
Hugging Face地址: https://huggingface.co/collections/google/gemma-3-release-67c6c6f89c4f76621268bb6d
此前,谷歌Gemma开源模型加速迭代:先是适用于单云和桌面加速器的Gemma 3和Gemma 3 QAT发布,随后是将强大实时多模态AI直接引入边缘设备的Gemma 3n推出,本次Gemma 3 270M的推出填补了轻量模型版块。
轻量化模型正在打破参数迷信。大模型领域长期存在 “参数规模决定性能” 的固有认知,Gemma 3 270M展现出小模型遵循指令的能力以及微调后的威力。从轻量而强大的模型入手,用户可以构建精简、快速且运行成本显著降低的生产系统。
相关文章
在食品和饮料行业的生产环境中,设备的可靠性、卫生标准以及安全性是至关重要的考量因素。轴承座作为支撑和保护轴承的关键部件,其性能直接影响生产线的稳定性和...
2025-08-15 0
在青岛青源峰达太赫兹科技有限公司,研究人员将太赫兹技术应用于各种检测场景。锂电池阴极涂层的厚度、电缆的缺陷、纺织物的纤维成分、中药的活性成分乃至文物的...
2025-08-15 0
智东西作者 | 李水青编辑 | 云鹏智东西8月15日消息,今天,谷歌推出史上最小Gemma 3开源模型,一个拥有2.7亿个参数的轻量级模型,底层设计以...
2025-08-15 0
SOLIDWORKS的工程图模块里有各种各样的视图工具,能把复杂的工程图注解变得简单,让添加工程图注解变得轻松容易。常用的工程图注解有下面这些:中心符...
2025-08-15 0
来源:市场资讯(来源:旭光电子)旭光电子金属化陶瓷的介绍与应用XUGUANG在现代科技飞速发展的浪潮中,材料的革新往往是推动产业升级的核心动力。从精密...
2025-08-15 0
您好:这款游戏可以开挂,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到-人的牌一样。所以很多小伙伴就怀疑这...
2025-08-15 0
多台机器人参与争夺“百米”飞人。潘之望摄来自各地的人形机器人赛队正在北京踏上前所未有的赛道,上演人机互动的交流。他们中,有今年4月刚刚参加了机器人半程...
2025-08-15 0
在全景影像领域深耕多年的 Insta360,如今正式跨足无人机市场。在上月的预告之后,其独立品牌 Antigravity 正式亮相,并带来首款作品 A...
2025-08-15 0
发表评论