万亿参数和FP8训练！蚂蚁Ling-1T开源，AI竞赛再升级，行业变天？

抖音热门 2025年10月11日 00:54 0 aa

10月9号这天，蚂蚁集团干了件在AI圈炸锅的事，把自己最新的万亿参数通用语言模型Ling-1T给开源了。

这可不是小打小闹，毕竟这是目前全球范围内最新的万亿级开源大模型，而且测试数据一出来，不少人都愣了：这性能居然能压过谷歌的旗舰模型。

蚂蚁这两年在大模型领域的动作挺稳，不是突然冒出来的“黑马”。

今年3月的时候，他们就发布过两款开源MoE模型，一个是168亿参数的Ling-Lite，另一个是2900亿参数的Ling-Plus，当时就引起过一波关注。

这次的Ling-1T算是Ling2.0系列的首款旗舰模型，也是他们至今搞出来的规模最大、能力最强的非思考大模型，算是把之前的技术积累都攒到这儿了。

拿大家最关心的性能来说，Ling-1T在不少高难度测试里都排到了开源模型的榜首。

比如竞赛数学的AIME25榜单，本来想是不是数据有水分，后来查了下测试细节才发现，它用平均4000多Token的消耗，就达到了70.42%的准确率。

反观谷歌的Gemini-2.5-Pro，得用5000多Token才能达到70.10%的准确率。

Ling-1T花更少的“成本”，干出了更好的“活”，这性价比在行业里确实少见。

而且做前端开发相关的任务也厉害，在ArtifactsBench前端能力基准测试里拿了59.31分，开源模型里暂时没人能超过它，对做可视化的开发者来说，这算是个实打实的好工具。

不用高级GPU也能玩得转

Ling-1T能火，还有个很关键的点，它解决了行业里一个老大难问题：不用高级GPU也能搞万亿级模型。

熟悉AI的人都知道，现在主流的MoE模型训练特别依赖H100、H800这种高性能AI芯片，不光贵，还不好买。

蚂蚁的团队倒是挺敢想，他们一开始就定了个目标：“不使用高级GPU”来扩展模型。

为了实现这个目标，他们搞了不少技术创新。

最显眼的就是用了FP8混合精度训练，而且部分技术已经开源了。

之前以为万亿级模型都得靠高端芯片堆着，结果Ling-1T这么一搞，不光省了不少显存，并行处理的策略也更灵活，整体训练速度还比传统方式快了一成多。

这种方式对那些没那么多预算买高端硬件的团队来说，简直是“及时雨”。

除了训练方式，他们还搞了个叫LPO的优化算法，全名叫Linguistics-UnitPolicyOptimization，简单说就是按“句子”为单位调整模型策略，这让万亿参数的模型训练起来更稳定。

另外还加了混合奖励机制，不光要求代码写得对、功能全，还得兼顾视觉上的美观，这点倒是挺贴心，毕竟现在做开发，颜值也是个重要需求。

能搞出这些技术，背后的团队也得提提。

牵头的是蚂蚁集团的副总裁兼CTO何征宇，这人履历挺硬：佐治亚理工学院计算机博士，2012到2018年在谷歌待过，还自己搞了个叫gVisor的开源项目。

2018年加入蚂蚁后，又主导了云原生化、绿色计算这些基础技术的布局。

很显然，没有这些年在技术基建上的积累，想一下子搞出万亿级模型，难度不是一般的大。

而且他们团队的目标很明确，就是把模型用在生活服务、金融、医疗这些实际场景里，比如之前听业内人说，用大模型做金融风控，比老方法的准确率高不少，能帮机构少赔不少钱，这才是技术落地的真正价值。

当然，光看蚂蚁一家还不够，现在全球AI圈都跟“军备竞赛”似的。

国庆中秋那阵，不管是美国的OpenAI，还是国内的阿里、智谱、DeepSeek，都在忙着更新模型。

零一万物的李开复说过一句话，“底座基础模型是一场千亿级别公司的‘军备竞赛’”，小公司还真玩不起。

英伟达的黄仁勋也看得明白，他说过去六个月AI计算需求涨得特别快，他们新一代Blackwell架构的芯片需求“非常非常高”，还说这标志着“新一轮工业革命”开始了。

这话不是空穴来风，英伟达上个月还宣布，未来十年要给OpenAI投1000亿美元，支持他们部署需要10千兆瓦电力的系统，这规模相当于400万到500万个GPU，光想想都觉得夸张。

AI风投1927亿：钱都往哪儿跑了？

AI行业这么火，资本自然不会缺席。

据PitchBook统计，今年以来全球AI领域的初创公司已经拿了1927亿美元的风险投资，创了历史纪录，预计今年会成为第一个有超过一半风投资金流入AI行业的年份。

但钱不是随便给的，大多都流到头部公司了。

比如OpenAI，最近刚完成了一笔66亿美元的融资，现在估值已经到了5000亿美元，比马斯克的SpaceX还高，成了全球最值钱的初创公司。

而且他们还签了近1万亿美元的算力采购协议，预计今年年收入能到120亿美元，周活跃用户也突破了8亿，半年就翻了一倍。

反观那些知名度不高的新创公司，尤其是不专注AI的，想拿到投资就难多了。

从地域上看，美国还是核心市场。

最近一个季度，美国风险投资里有62.7%的钱都投给了AI公司，全球范围内这个比例是53.2%。

今年以来全球风投总额是3668亿美元，其中美国就占了2502亿美元，差距还是挺明显的。

PitchBook的研究主管KyleSanford说过一句话，特别形象：“市场正在分化，要么在做人工智能，要么不是，要么是大公司，要么不是。”

本来想是不是中小公司还有机会，后来发现还真难，现在行业里的资源越来越向头部集中了。

而且现在AI公司的“退出”环境也不太好，PitchBook的高级研究分析师DimitriZabelin说，现在的情况是收购特别频繁，但收购价都不高；IPO倒是值钱，可数量太少。

这跟当前宏观环境的流动性也有关系，算是没办法的事。

不过蚂蚁倒是没停下脚步，除了Ling-1T这个非思考模型，他们还在训练一款万亿参数级的深度思考大模型，叫Ring-1T，9月30号已经开源了预览版，现在开发者都能体验。

如此看来，他们是想通过开源拉更多人一起玩，把生态做起来，毕竟AI这事儿，单打独斗很难走远。

蚂蚁开源Ling-1T算是中国企业在全球AI大模型领域的一个重要突破。

它不光在性能上超过了不少国际巨头的产品，还解决了“不用高级GPU”这个行业痛点，给不少中小团队指了条新路子。

现在全球AI行业就是“技术竞速”加“资本聚集”，巨头们主导着核心竞争，中小公司则在找适合自己的细分机会。

未来AI的竞争，可能不再是单纯比参数、比性能，而是看谁能把技术真正落地到生活服务、金融、医疗这些场景里，让普通人也能感受到好处。

说实话，我还挺期待看到这些模型在实际场景里发挥作用的，毕竟技术最终还是要服务于人，这才是它真正的价值所在。

为什么飞机舷窗必须留个小洞？关乎每一次飞行的安全

先进制造2025｜中国工业机器人进出口现状、趋势与建议

发表评论

万亿参数和FP8训练！蚂蚁Ling-1T开源，AI竞赛再升级，行业变天？

不用高级GPU也能玩得转

AI风投1927亿：钱都往哪儿跑了？

为什么飞机舷窗必须留个小洞？关乎每一次飞行的安全

先进制造2025｜中国工业机器人进出口现状、趋势与建议

热门文章

最新文章