Anthropic最近扔出个大炸弹ClaudeHaiku4.5,这模型性能快追上GPT-5和自家Sonnet4了,成本却只有Sonnet4的三分之一,...
2025-10-18 0
Anthropic最近扔出个大炸弹ClaudeHaiku4.5,这模型性能快追上GPT-5和自家Sonnet4了,成本却只有Sonnet4的三分之一,处理速度还翻了两倍多,现在居然全用户免费开放。
作为天天跟AI工具打交道的人,我第一反应是:这波操作跟手机厂商突然把旗舰机卖中端价似的,直接把行业性价比的天花板给掀了。
Haiku4.5能做到又好又便宜,核心是它的混合推理架构。
这模型挺聪明,能看活儿下菜碟处理简单请求,比如生成个短文案、查个数据,就用轻量流程,速度快还不费算力;碰到要深度分析的任务,比如解复杂数学题、梳理大段代码,就开“扩展思考”模式,专门调配资源攻坚。
这种灵活劲儿,比以前那种“不管啥活儿都用满算力”的模型省太多成本了。
官方说它速度是老款的两倍多,但实际测试里,有个开发者对比后发现,它比Sonnet3.5快了3.5倍。
我自己试了试写一段简单的爬虫代码,以前用Sonnet得等个七八秒,Haiku4.5三秒不到就出来了,连注释都标得清清楚楚。
而且它能处理20万个token的大文件,像那种几百页的商业报告,直接扔进去就能分析,单次还能输出6.4万个token的结果,应付大多数工作场景完全够了。
在具体能力上,Haiku4.5也没拉胯。
计算机操作自动化的OSWorld测试里,它拿了50.7分,比Sonnet4的42.2分还高,这意味着它能帮着做不少重复性操作,比如自动整理文件夹、填表格。
数学方面更厉害,配合Python工具用,准确率能到96.3%,就算不用工具也有80.7%,像金融里算个收益率、工程里列个公式,它都能搞定。
说实话,以前总觉得“便宜没好货”,但Haiku4.5还真打破了这个印象。
Anthropic的人说,Haiku4.5的真正价值,不是自己单打独斗,而是跟其他模型搭班子。
简单说就是Sonnet4.5当“军师”,负责复杂的规划和决策,比如制定整个项目的方案;多个Haiku4.5当“小兵”,干具体的子任务,比如收集数据、生成初步文档。
这种分工模式,在企业里用着特别顺手。
我听说有家金融公司就这么干,让Haiku实时盯着各个渠道的数据流,一发现异常波动就标记出来,再把初步分析传给Sonnet。
Sonnet不用再花时间筛选数据,直接深入分析原因,出应对策略。
以前整个流程得大半天,现在两三个小时就搞定,成本还降了不少。
还有家代码公司Augment说,Haiku4.5能达到Sonnet4.5九成的性能,用来写基础代码、查bug,又快又省钱。
现在Anthropic的日子过得挺红火,年化营收快到70亿了,企业客户超30万家,光ClaudeCode这个代码工具,年收入就快10亿。
他们还喊出2026年要赚200到260亿,这野心可不小。
不过也有分析师泼冷水,说现在AI模型都在拼迭代速度,但没什么真正的差异化,而且多智能体协作的拆分效率、协调问题还没完全解决。
老实讲,这些顾虑不是没道理,比如有时候任务拆太细,Haiku和Sonnet对接反而变慢,还得再调流程。
OpenAI现在还是行业老大,估值5000亿,比Anthropic的1830亿高不少,还出了Sora这种视频工具,产品更全。
但Haiku4.5的出现,相当于给行业提了个醒:AI竞争不只是比谁的模型性能最牛,还要比谁能把成本降下来,让更多人用得上。
以前企业买AI服务,跟买奢侈品似的,得掂量半天预算,现在Haiku一出来,中小公司甚至个人开发者,都能用上接近高端模型的服务了。
Haiku4.5这波操作,其实是AI行业经济模型的一次大转变。
五个月前Sonnet4还卖得挺贵,现在Haiku4.5用更低的成本实现了相近性能,这速度比手机降价还快。
以前企业用AI,多是怕跟不上潮流瞎买,现在更看重能不能算出实实在在的回报,高性价比的模型自然更受欢迎。
对我们普通人来说,这是个好消息。
以后用AI写文案、做设计、查资料,可能不用再纠结哪个便宜哪个贵,甚至免费就能用到不错的服务。
当然,行业还得解决些问题,比如怎么做出真正有差异的功能,怎么让多智能体协作更顺畅。
但不管怎么说,Haiku4.5已经指明了一个方向:AI的未来,不是少数人的高端玩具,而是能让所有人都受益的普惠工具。
相关文章
Anthropic最近扔出个大炸弹ClaudeHaiku4.5,这模型性能快追上GPT-5和自家Sonnet4了,成本却只有Sonnet4的三分之一,...
2025-10-18 0
针对2025年双十一不同预算用户的购机困惑,本次测评采用“预算分层匹配+核心场景深测”模式,将机型划分为高端旗舰(5000元以上)、中端均衡(4000...
2025-10-18 0
编辑:风风木木当你在刷短视频时,看到央视主持人李梓萌微笑着推荐一款“神药”,很多人可能会毫不犹豫地点下“购买”。你可能会想“贷款上班”的梗成真?央视主...
2025-10-18 0
当前,杨浦正着力构建以数字经济为核心主导的“1+2+3+4”创新型现代化产业体系,其中,科技服务业是重点布局的四大新兴赛道之一,检验检测作为科技服务业...
2025-10-18 1
10月18日,民众走进合肥市科技馆杨振宁陈列馆参观缅怀。当日,诺贝尔物理学奖得主、中国科学院院士、著名物理学家杨振宁在北京逝世,享年103岁。中新社记...
2025-10-18 0
数据中心是一种集IT基础设施、电力系统、制冷系统、网络设备、安全防护系统于一体的物理设施,用于集中存储、处理、管理和传输大量数据。其核心目标是为企业、...
2025-10-18 1
10月17日2025沈阳机器人大会在沈阳新世界酒店开幕现场设置了“2+5+N”项重要活动沈阳正在迈入智造新高地探秘机器人技术的无限可能本次大会以“新质...
2025-10-18 1
IT之家 10 月 18 日消息,据雅虎新闻今天报道,任天堂美国公司前销售副总裁布鲁斯・洛里(Bruce Lowry)最近回顾了美版红白机(Ninte...
2025-10-18 1
发表评论