前言现在AI科技真是日新月异,短视频的很多视频,已经很难分清画面里的人物是真人实拍还是AI生成。而这种“真假难辨”的效果,正在重塑整个影视广告行业的游...
2025-10-09 0
智东西
作者 | 李水青
编辑 | 心缘
智东西10月9日报道,昨日,以色列AI创企AI21 Labs开源轻量级推理模型Jamba Reasoning 3B。该模型有30亿个参数,可在包括手机、电脑在内的多种设备端运行,性能超过Qwen3-4B、Gemma 3-4B等业界顶尖模型。
Jamba Reasoning 3B开源截图
Hugging Face地址: http://huggingface.co/ai21labs/AI21-Jamba-Reasoning-3B
A21称,Jamba Reasoning 3B基于其新的SSM-Transformer架构构建,上下文窗口长度为256K个token,能够处理高达1M token,与DeepSeek、谷歌、Llama和微软等竞争对手相比效率提升了2-5倍,在基准测试中取得领先成绩。
Jamba Reasoning 3B在人类最后测试等测评中超Qwen 3-4B等模型
其将Jamba Reasoning 3B的优势总结为三点:
1、智能性能不下降:由于采用了混合SSM-Transformer架构,Jamba Reasoning 3B比纯Transformer模型更高效。
大多数基于Transformer的模型在上下文长度超过32K个token时性能会显著下降,而Jamba Reasoning 3B能够处理更长的上下文长度,包括高达100万个token。这使得它在高级智能体系统或多模态应用中非常有用,因为长上下文理解对输出质量至关重要。
Jamba Reasoning 3B的性能虽上下文增长损耗小
2、领先的智能:Jamba Reasoning 3B的表现优于DeepSeek、谷歌、Meta和微软的其他设备端模型。
它在指令跟踪任务(IFBench)和常识性知识(MMLU-Pro和Humanity’s Last Exam)方面尤为出色,这使得Jamba Reasoning 3B成为一款高效且智能的模型,可用于高级智能体工作流程或设备端RAG应用。
这些成果源于训练后流程,A21将RLVR、SFT、DPO和GRPO等对齐训练技术与自主研发的专有方法相结合,以确保模型质量。
Jamba Reasoning 3B测评超阿里、谷歌等模型
3、专为设备安全使用而构建:此模型获得Apache 2.0许可,可直接下载到用户的计算机或手机上,并使用用户自己的文件在设备上进行定制,以实现完全安全的应用程序,即使断网它们也可以继续运行。
Jamba Reasoning 3B的混合SSM-Transformer架构成功利用了比原始Transformer架构小8倍的键值缓存 (KV),即使在上下文增长的情况下也能保持较低的内存占用。
在M3 MacBook Pro上,它每秒可以生成40个token,上下文长度为32K,这一成绩优于Qwen3-4B、DeepSeek Distill Qwen 1.5B、Gemma 3-4B等模型,使其成为高级智能体应用程序中的精简组件。
在M3 MacBook Pro上每秒可以生成40个token
该模型目前支持的语言包括:英语、西班牙语、法语、葡萄牙语、意大利语、荷兰语、德语、阿拉伯语和希伯来语。
随着企业将AI融入运营,基于云端的大型语言模型暴露出经济效率低下的问题。A21援引研究报告称,40%-70%的AI任务可以通过小型语言模型处理,通过智能路由将成本降低10-30倍。
像Jamba Reasoning 3B这样的设备端轻量模型能够实现经济高效的异构计算分配,在本地处理简单任务,同时保留云端资源用于复杂推理。这为制造业和医疗保健领域的实时应用提供了低延迟,为远程操作提供了离线恢复能力,并增强了数据隐私保护,有望开启了一个去中心化的AI时代。
相关文章
前言现在AI科技真是日新月异,短视频的很多视频,已经很难分清画面里的人物是真人实拍还是AI生成。而这种“真假难辨”的效果,正在重塑整个影视广告行业的游...
2025-10-09 0
作者 商迪安为期八天的国庆中秋假期已经结束,但对回归工作岗位的你我而言,假期收获的欢乐、喜悦、焦灼、释然等情绪依然鲜活——有人“为吃奔赴一座城”,在天...
2025-10-09 0
众所周知,全球机器人产业顶尖的国家目前就集中在美、中、日三国。很多80后都会记得日本制造业广泛使用的机器人给我们带来的最初的震撼,也会记得美国波士顿动...
2025-10-09 0
智东西作者 | 李水青编辑 | 心缘智东西10月9日报道,昨日,以色列AI创企AI21 Labs开源轻量级推理模型Jamba Reasoning 3B...
2025-10-09 0
引言:重构计算文明的“量子跃迁”中国科大“九章三号”光子量子计算机以200亿年/秒的算力撕裂经典计算极限;成都中微达信的常温量子测控芯片将设备成本压降...
2025-10-09 0
国庆中秋假期,在辽宁盘锦华锦阿美精细化工及原料工程项目建设工地,施工人员抓住“金九银十”施工黄金期,抓紧施工保证工程进度。走进华锦阿美精细化工及原料工...
2025-10-09 0
本篇文章给大家谈谈小程序微乐麻将开挂起手好牌,以及对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。 怎么才能在微信上开挂? 1、微乐微信小程序开...
2025-10-09 0
10月9日,商务部网站发布了发布了公告,对用于高端芯片研发、生产的稀土实施严格管控,条款原文为:最终用途为研发、生产14纳米及以下逻辑芯片或者256层...
2025-10-09 0
发表评论