首页 AI科技文章正文

全球 AI 国庆竞速!GLM-4.6 携国产芯片破局,成本大降

AI科技 2025年10月03日 17:23 1 aa

国庆前那几天,全球 AI 圈跟赶工期似的热闹,9 月 30 号下午,智谱 AI 直接扔出新一代大模型 GLM-4.6,头一天晚上 DeepSeek 才刚宣布发了 DeepSeek-V3.2-Exp 实验版,国外 Claude 也凑着热闹更了 Sonnet 4.5,谷歌还放话 10 月要推 Gemini 3.0。

全球 AI 国庆竞速!GLM-4.6 携国产芯片破局,成本大降

这架势哪像过假期,明明是 AI 版 “黄金周加班大赛”,谁都不想在竞速里掉队。

GLM-4.6 不是凭空冒出来的,它前一代是 7 月 28 号发的 GLM-4.5,那时候就首次把推理、编码、智能体能力揉在一个模型里,还带动智谱 MaaS 平台的 API 商业化涨了 10 倍多。

本来想觉得 “0.1 代” 的迭代,撑死就是修修小 bug,结果看它的测试数据才发现,这哪是小更,简直是针对性补短板。

在 AIME 25、GPQA 这些 8 个权威基准测试里,它不光超过了 DeepSeek 刚发的新模型,连 Claude Sonnet 4 都被比了下去,稳稳坐在国产模型第一的位置上。

全球 AI 国庆竞速!GLM-4.6 携国产芯片破局,成本大降

在编程领域,它曾大胆放言拥有“国内最强Coding模型”,彼时言论看似张狂,然而时至今日,事实证明这并非虚张声势,而是其实力的有力彰显。

此外,该模型已正式上线智谱的 MaaS 平台 bigmodel.cn,后续,它还将同步至 Hugging Face 与 ModelScope 进行开源,以推动技术的广泛交流与应用。

搞 AI 的朋友都知道,开源意味着更多开发者能拿去用、能改,等于给行业降低了用顶尖模型的门槛,以前国产大模型要么性能差点,要么闭源藏着,现在 GLM-4.6 又强又敢开源,这态度确实让人觉得国产 AI 越来越敞亮了。


实测见真章:GLM-4.6 的编程能力能对标国际选手?

光看榜单数据还不够直观,毕竟榜单是死的,实际用起来咋样才关键,智谱还挺实在,公开了 74 个真实场景的编程测试题和 Agent 轨迹,就在 Hugging Face 上能查着,谁都能去验证。

全球 AI 国庆竞速!GLM-4.6 携国产芯片破局,成本大降

此般测试于 Claude Code 环境中开展,结果着实令人意外。GLM - 4.6 表现卓越,竟超越了 Claude Sonnet 4,展现出非凡实力。相较上一代 GLM - 4.5,此模型所用 token 大幅减少,在成本控制方面表现卓越,相较于同类模型,展现出更为出色的成本把控能力。

全球 AI 国庆竞速!GLM-4.6 携国产芯片破局,成本大降


我特意去看了几个实测案例,差别一下就出来了

有人让模型做 “旋转六边形里的弹跳球”,还要求球 a 质量是球 b 的 2 倍,GLM-4.6 不光能准确模拟旋转的作用、质量对碰撞的影响,还能调旋转速度、重力这些参数,反观 GLM-4.5,弹球直接飞出六边形边界,跟 “越狱” 似的,更别说调参数了。

当时我还琢磨,这代际差咋这么明显?原来 4.6 在物理效果的准确性上,是真下了功夫。

全球 AI 国庆竞速!GLM-4.6 携国产芯片破局,成本大降



还有人测试 “交互式太阳系模拟”,就给了这么简单一句话

GLM-4.6 直接生成了能拖动看 3D 效果、能调运行速度和行星大小的控制台,效果跟 Claude Sonnet 4.5 差不多;可有人用 GPT-5 试了 same 需求,反馈说没生成有效代码。

搞不清为啥 GPT-5 会栽在这,可能训练数据里天文交互的样本少?但 GLM-4.6 能接住这个需求,说明它对抽象词 “交互式” 的理解,确实比以前强了。


更有意思的是 “SVG 水豚骑自行车动画”

有人用 GPT-5 做,结果没画准水豚,怀疑是训练数据里水豚的样本少,但 GLM-4.6 很快就画出来了,水豚的形态像那么回事,还能坐在车座上扶着车把骑车。

全球 AI 国庆竞速!GLM-4.6 携国产芯片破局,成本大降

这种偏冷门的需求最能试出模型的泛化能力,GLM-4.6 这波表现,确实比 GPT-5 稳,除了这些,还有人让它用 Three.JS 做 3D 射击游戏,这框架可是 Web 端做 3D 的主流工具。

全球 AI 国庆竞速!GLM-4.6 携国产芯片破局,成本大降

GLM-4.6 直接生成了 736 行代码,打开预览就是有三维感的空间,点鼠标能射击,还能计分,本来想觉得 “AI 写游戏代码也就凑活看”,结果实际运行起来还挺流畅,这能力怕是能帮小开发者省不少事。

全球 AI 国庆竞速!GLM-4.6 携国产芯片破局,成本大降


国产 AI 不搞单打:大模型 + 芯片协同降成本

GLM-4.6 刚发,国产芯片厂商就跟上来了,寒武纪和摩尔线程几乎第一时间完成了适配,这速度确实超出预期,以前总担心国产大模型得靠国外芯片跑,万一人家卡脖子咋办?现在看,大模型和国产芯片这么快就能配合上,等于给 GLM-4.6 配了 “国产发动机”,不用再看别人脸色了。

寒武纪是把 GLM-4.6 搞成了 FP8+Int4 混合量化部署,这还是国内首次投产这种方案,懂行的都知道,这种部署能在不丢精度的前提下降成本,据说推理成本能少不少。

摩尔线程则是基于 vLLM 框架做的适配,这框架能提推理效率,他们家新一代 GPU 还能在原生 FP8 精度下稳跑模型,算是验证了自己架构的兼容性。

全球 AI 国庆竞速!GLM-4.6 携国产芯片破局,成本大降

这俩芯片厂商的动作,其实是国产 AI 生态的一个信号 —— 以前大模型和芯片是 “各玩各的”,现在开始协同迭代了,之后这些组合还会通过智谱的 MaaS 平台对外开放,企业和个人用的时候,就能直接用 “国产大模型 + 国产芯片” 的方案,不用再折腾适配的事。

如此看来,国产 AI 不是只靠单个模型强,而是整个生态都在往前赶。


更实在的是价格

智谱同步升级了 GLM Coding Plan,出了 20 元包月的套餐,这价格才是 Claude 的 1/7,等于花少钱就能用到接近 Claude 的编码能力。

以前订阅过包月的用户,还能自动升级到 GLM-4.6,新增了图像识别和搜索能力,支持 10 多个主流编程工具。

全球 AI 国庆竞速!GLM-4.6 携国产芯片破局,成本大降

针对企业和高频开发者,智谱还出了企业版和 GLM Coding Max,尤其是 Max 版,用量是 Claude Max (20x) plan 的 3 倍,重度用户用着也够,以前顶尖 AI 工具都不便宜,中小公司和个人开发者想用好的,得掂量掂量成本,现在 GLM-4.6 这么定价,明显是想让更多人用得起,这对 AI 普及来说,比单纯堆性能更重要。

从 7 月的 GLM-4.5 到 9 月的 GLM-4.6,才俩月时间,智谱就实现了这么大的跃升,这速度不光说明技术迭代快,更说明国产大模型找着了 “提质降价” 的节奏。

以前总说国产模型跟国际选手有差距,现在看,至少在编程和成本控制上,已经能掰掰手腕了,GLM-4.6 这波操作,不只是一个模型变强,更是国产 AI 生态的一次练兵,大模型负责提性能,芯片负责降成本,价格再往普惠走,整个链条都动起来了。

接下来,谷歌 Gemini 3.0 要发,国际竞争肯定更激烈,但国产 AI 这波 “国庆竞速” 的表现,已经让大家看到了底气。

全球 AI 国庆竞速!GLM-4.6 携国产芯片破局,成本大降

未来,要是能在更多场景里落地,比如工业编程、教育这些领域,怕是能让更多人实实在在感受到 “国产 AI 有用、好用还不贵”。

发表评论

长征号 Copyright © 2013-2024 长征号. All Rights Reserved.  sitemap