10月9号这天,蚂蚁集团干了件在AI圈炸锅的事,把自己最新的万亿参数通用语言模型Ling-1T给开源了。这可不是小打小闹,毕竟这是目前全球范围内最新的...
2025-10-11 0
10月9号这天,蚂蚁集团干了件在AI圈炸锅的事,把自己最新的万亿参数通用语言模型Ling-1T给开源了。
这可不是小打小闹,毕竟这是目前全球范围内最新的万亿级开源大模型,而且测试数据一出来,不少人都愣了:这性能居然能压过谷歌的旗舰模型。
蚂蚁这两年在大模型领域的动作挺稳,不是突然冒出来的“黑马”。
今年3月的时候,他们就发布过两款开源MoE模型,一个是168亿参数的Ling-Lite,另一个是2900亿参数的Ling-Plus,当时就引起过一波关注。
这次的Ling-1T算是Ling2.0系列的首款旗舰模型,也是他们至今搞出来的规模最大、能力最强的非思考大模型,算是把之前的技术积累都攒到这儿了。
拿大家最关心的性能来说,Ling-1T在不少高难度测试里都排到了开源模型的榜首。
比如竞赛数学的AIME25榜单,本来想是不是数据有水分,后来查了下测试细节才发现,它用平均4000多Token的消耗,就达到了70.42%的准确率。
反观谷歌的Gemini-2.5-Pro,得用5000多Token才能达到70.10%的准确率。
Ling-1T花更少的“成本”,干出了更好的“活”,这性价比在行业里确实少见。
而且做前端开发相关的任务也厉害,在ArtifactsBench前端能力基准测试里拿了59.31分,开源模型里暂时没人能超过它,对做可视化的开发者来说,这算是个实打实的好工具。
Ling-1T能火,还有个很关键的点,它解决了行业里一个老大难问题:不用高级GPU也能搞万亿级模型。
熟悉AI的人都知道,现在主流的MoE模型训练特别依赖H100、H800这种高性能AI芯片,不光贵,还不好买。
蚂蚁的团队倒是挺敢想,他们一开始就定了个目标:“不使用高级GPU”来扩展模型。
为了实现这个目标,他们搞了不少技术创新。
最显眼的就是用了FP8混合精度训练,而且部分技术已经开源了。
之前以为万亿级模型都得靠高端芯片堆着,结果Ling-1T这么一搞,不光省了不少显存,并行处理的策略也更灵活,整体训练速度还比传统方式快了一成多。
这种方式对那些没那么多预算买高端硬件的团队来说,简直是“及时雨”。
除了训练方式,他们还搞了个叫LPO的优化算法,全名叫Linguistics-UnitPolicyOptimization,简单说就是按“句子”为单位调整模型策略,这让万亿参数的模型训练起来更稳定。
另外还加了混合奖励机制,不光要求代码写得对、功能全,还得兼顾视觉上的美观,这点倒是挺贴心,毕竟现在做开发,颜值也是个重要需求。
能搞出这些技术,背后的团队也得提提。
牵头的是蚂蚁集团的副总裁兼CTO何征宇,这人履历挺硬:佐治亚理工学院计算机博士,2012到2018年在谷歌待过,还自己搞了个叫gVisor的开源项目。
2018年加入蚂蚁后,又主导了云原生化、绿色计算这些基础技术的布局。
很显然,没有这些年在技术基建上的积累,想一下子搞出万亿级模型,难度不是一般的大。
而且他们团队的目标很明确,就是把模型用在生活服务、金融、医疗这些实际场景里,比如之前听业内人说,用大模型做金融风控,比老方法的准确率高不少,能帮机构少赔不少钱,这才是技术落地的真正价值。
当然,光看蚂蚁一家还不够,现在全球AI圈都跟“军备竞赛”似的。
国庆中秋那阵,不管是美国的OpenAI,还是国内的阿里、智谱、DeepSeek,都在忙着更新模型。
零一万物的李开复说过一句话,“底座基础模型是一场千亿级别公司的‘军备竞赛’”,小公司还真玩不起。
英伟达的黄仁勋也看得明白,他说过去六个月AI计算需求涨得特别快,他们新一代Blackwell架构的芯片需求“非常非常高”,还说这标志着“新一轮工业革命”开始了。
这话不是空穴来风,英伟达上个月还宣布,未来十年要给OpenAI投1000亿美元,支持他们部署需要10千兆瓦电力的系统,这规模相当于400万到500万个GPU,光想想都觉得夸张。
AI行业这么火,资本自然不会缺席。
据PitchBook统计,今年以来全球AI领域的初创公司已经拿了1927亿美元的风险投资,创了历史纪录,预计今年会成为第一个有超过一半风投资金流入AI行业的年份。
但钱不是随便给的,大多都流到头部公司了。
比如OpenAI,最近刚完成了一笔66亿美元的融资,现在估值已经到了5000亿美元,比马斯克的SpaceX还高,成了全球最值钱的初创公司。
而且他们还签了近1万亿美元的算力采购协议,预计今年年收入能到120亿美元,周活跃用户也突破了8亿,半年就翻了一倍。
反观那些知名度不高的新创公司,尤其是不专注AI的,想拿到投资就难多了。
从地域上看,美国还是核心市场。
最近一个季度,美国风险投资里有62.7%的钱都投给了AI公司,全球范围内这个比例是53.2%。
今年以来全球风投总额是3668亿美元,其中美国就占了2502亿美元,差距还是挺明显的。
PitchBook的研究主管KyleSanford说过一句话,特别形象:“市场正在分化,要么在做人工智能,要么不是,要么是大公司,要么不是。”
本来想是不是中小公司还有机会,后来发现还真难,现在行业里的资源越来越向头部集中了。
而且现在AI公司的“退出”环境也不太好,PitchBook的高级研究分析师DimitriZabelin说,现在的情况是收购特别频繁,但收购价都不高;IPO倒是值钱,可数量太少。
这跟当前宏观环境的流动性也有关系,算是没办法的事。
不过蚂蚁倒是没停下脚步,除了Ling-1T这个非思考模型,他们还在训练一款万亿参数级的深度思考大模型,叫Ring-1T,9月30号已经开源了预览版,现在开发者都能体验。
如此看来,他们是想通过开源拉更多人一起玩,把生态做起来,毕竟AI这事儿,单打独斗很难走远。
蚂蚁开源Ling-1T算是中国企业在全球AI大模型领域的一个重要突破。
它不光在性能上超过了不少国际巨头的产品,还解决了“不用高级GPU”这个行业痛点,给不少中小团队指了条新路子。
现在全球AI行业就是“技术竞速”加“资本聚集”,巨头们主导着核心竞争,中小公司则在找适合自己的细分机会。
未来AI的竞争,可能不再是单纯比参数、比性能,而是看谁能把技术真正落地到生活服务、金融、医疗这些场景里,让普通人也能感受到好处。
说实话,我还挺期待看到这些模型在实际场景里发挥作用的,毕竟技术最终还是要服务于人,这才是它真正的价值所在。
相关文章
10月9号这天,蚂蚁集团干了件在AI圈炸锅的事,把自己最新的万亿参数通用语言模型Ling-1T给开源了。这可不是小打小闹,毕竟这是目前全球范围内最新的...
2025-10-11 0
苏联时代造安-225运输机,本是为航天野心服务的,那会儿Buran航天飞机项目闹得热火朝天,得有这么个庞然大物把整架航天器从工厂扛到发射场去。安东诺夫...
2025-10-11 0
近日,苏州工业园区生物医药企业星明优健(UgeneX Therapeutics)与专注于基因疗法的生物科技公司AviadoBio签订独家许可协议,双方...
2025-10-11 0
近日,中国通号城交公司成功中标合肥市轨道交通安全保护区全空间智能感知巡检服务项目。项目采用中国通号自主研发的低空"一网统飞"智能巡检系统,同时融合光纤...
2025-10-11 0
有“半导体领域的DeepSeek”之称的新凯来(深圳市新凯来技术有限公司)即将在2025湾区半导体产业生态博览会(简称“湾芯展”)上带来“意想不到的惊...
2025-10-11 0
随着科技水平的不断提高,AI医疗成了热门话题,不少人担心机器会抢了医生的饭碗,甚至取代医生。其实,这种想法多半是杞人忧天,在不久前的一场国际科技峰会上...
2025-10-11 0
今年以来,大量消息已经表明苹果即将推出旗下首款折叠屏 iPhone ,而近日又有分析师获得了这款手机的细节消息。从消息来看,苹果将在明年推出的折叠屏...
2025-10-11 0
年轻人划屏3秒付完款,老人戳10分钟还困在广告弹窗里;我们刷视频一滑一个准,爸妈按3次都可能点错下载键。60岁以上人口早破3亿,超六成老人因为手机难用...
2025-10-11 0
发表评论