深夜突袭！万亿参数MoE模型Kimi K2上线即开源，月之暗面能否重归C位？

抖音热门 2025年07月13日 19:51 0 admin

每经记者：李宇彤每经编辑：余婷婷

2025年以来略显沉寂的月之暗面，在深夜突袭。

7月11日晚，月之暗面宣布正式发布Kimi K2模型，并同步开源。从介绍来看，Kimi K2是一款具备更强代码能力、更擅长通用Agent（智能体）任务的MoE（Mixture of Experts，混合专家模型）架构基础模型，总参数1T，激活参数为32B。

本次开源的Kimi K2模型分为Kimi-K2-Base和Kimi-K2-Instruct两个版本，前者是未经过指令微调的基础预训练模型，适合科研与自定义场景；而后者为通用指令微调版本（非思考模型），在大多数问答与Agent任务中有更好的表现。

2025年以来，“Kimi们”的处境正发生着改变。DeepSeek以低成本、高性能的开源模型强势入场；MinMax更是火力全开，今年6月在向开源社区投下一枚“重磅炸弹”，发布自主研发的MiniMax-M1系列模型后，在紧随其后的四个工作日里“一日一更”，直接“五连发”；而一众大厂对于AI（人工智能）热情和野心也在今年再上一个台阶，阿里、腾讯持续加码AI，字节来势汹汹，大模型格局的洗牌还在继续。

抛开一切变化，硬实力才是搏击市场的硬拳头。这次，月之暗面能否靠Kimi K2重归大模型C位？

Kimi K2上线即开源

月之暗面在官方介绍中称，在SWE Bench Verified、Tau2、AceBench等基准性能测试中，Kimi K2均取得开源模型中的SOTA（state-of-the-art）成绩。在其公布的测评结果中，Kimi K2在Agentic Coding（自主编程）、Tool Use（工具调用）和Math&Reasoning（数学推理）三个维度的表现上均超过了同为开源模型的DeepSeek-V3和阿里Qwen3。值得一提的是，Kimi评测中的所有模型均为非思考模型的Kimi-K2-Instruct。

目前，Kimi K2的API（应用程序编程接口）服务已上线，支持最长128K上下文，计费方案为4元/百万“输入”tokens（大模型处理文本时的最小单位），16元/百万“输出”tokens，兼容OpenAI和Anthropic两种API格式。

为了体现Kimi K2在代码、Agent工具调用、风格化写作三项能力上的提升，月之暗面也给出了具体任务下的展示。在前端开发任务中，Kimi K2支持粒子系统、可视化和3D（三维）场景等表现形式。

Kimi K2生成的山川峡谷3D景观图片来源：月之暗面Kimi官方公众号截图

而在Agent工具调用能力方面，月之暗面表示Kimi K2现已具备稳定的复杂指令解析能力，可将需求自动拆解为一系列格式规范、可直接执行的ToolCall（工具调用）结构。在其释出的案例中，Kimi K2规划了参加Coldplay乐队巡演的行程，可以完成演唱会所在城市的机酒与旅游规划，并且生成日历，再用html概括完整行程规划。

《每日经济新闻》记者也使用Kimi K2进行了旅游规划的测试。根据“两个人计划8月份从北京出发，去日本东京以及大阪进行为期5天的旅游，希望能看到花火大会、吃到当地特色食物，帮我做一下包括机酒和行程在内的图文并茂的旅行规划”的需求，Kimi K2花费3分钟左右进行了一份详尽的旅游规划，规划中包括了具体的餐厅、食物、景点以及一些实用攻略。美中不足的是，这份规划是以文字以及表格的形式呈现的，虽然在最后附上了一个百度网盘链接表示可以自取图片内容，但实际上该链接是无法打开的。

随后，记者进一步提出将规划以HTML格式呈现，Kimi K2在随后交付的网页中补充了一些票务的信息，并完成了“图文并茂”的需求。不过，与官方演示的案例相比，网页整体的呈现质量还较为粗糙。

每经记者实测Kimi K2 图片来源：Kimi K2 截图

值得一提的是，此前记者还使用类似的提示词测试过字节的扣子空间。对比两次测试结果可以发现，扣子空间在网页的设计上完成度更高、更为美观。Kimi K2虽然在此略逊一筹，但旅游攻略制定上更为详细，给出了包括餐厅、景点在内的详细信息，还有如“交通卡当地退卡避免异地手续费”等注意事项。

此外，本次Kimi还特别展示了Kimi K2对文字输出风格的掌控，并且在虚构写作任务中，官方还表示：Kimi K2生成的文字更关注细节与情感，不再是抽象泛泛而谈。记者也以2025年北京高考的作文题目“数字闪耀时”为例，假设Kimi K2为高中生，完成一篇一类的记叙文。从完成结果上来说，整体呈现效果良好，但在最后收尾的部分隐约透露出一些“AI味”。

由Kimi K2撰写的北京高考作文图片来源：Kimi K2 截图

Kimi也从技术角度透露，为了支撑万亿参数模型训练的稳定性，Kimi K2没有使用传统的Adam优化器，而是使用Muon优化器。MuonClip优化器能够稳健支撑万亿参数模型训练，显著提升token利用效率。

Kimi的下一步要走向哪？

Kimi K2的突袭中，似乎隐含着要打一场翻身仗的决心。

2024年11月，月之暗面创始人杨植麟在接受《每日经济新闻》记者采访时表示，将提升用户留存视为Kimi眼下最核心的任务。而在当时，Kimi还是国产大模型之中备受瞩目的一个。

商业智能数据服务商QuestMobile数据显示，截至2024年12月份，豆包、Kimi、文小言的月活跃用户规模分别为7523万、2101万和1224万。Kimi位列原生App领域的“三强”之一。

随着今年年初DeepSeek的横空出世，整个市场格局被迅速打乱。

今年5月，《每日经济新闻》联合QuestMobile发布的《2025年一季度AI应用价值榜》显示，Kimi虽仍在月均活跃用户规模上位于第四，但其2000万出头的规模已经和以1.8亿排在第一的DeepSeek相差甚远。在“月均下载用户数环比增长”一项上，Kimi甚至出现了负增长，用户数环比下降3.8%。

2025年以来，Kimi对模型的更新升级速度明显放缓。但从2024年年底到今年5月份，Kimi在似乎瞄准了垂类领域，寻找新的用户群，先后和财新传媒、小红书、网易游戏《逆水寒》达成合作。

此前6月20日，Kimi发布第一个Agent——Kimi-Researcher（深度研究）。

据官方表示：“模型即Agent，Kimi-Researcher是基于端到端自主强化学习（end-to-end agentic RL）技术训练的新一代Agent模型，也是一个专为深度研究任务而生的Agent产品。”当时Kimi还表示将逐步开源Kimi-Researcher基础预训练模型，以及强化学习后的模型，如今来看的话应该就是本次发布的Kimi K2。

知名经济学者、工信部信息通信经济专家委员会委员盘和林在接受《每日经济新闻》记者微信采访时对Kimi上半年的努力进行了分析。在他看来，Kimi的努力方向是对的，但还不够，Kimi需要将自己的AI嵌入到一个生态当中。如今，互联网平台各大生态是封闭的，比如电商的AI可以帮助商家设计网站，自媒体的AI能够帮助自媒体制作视频，那么，Kimi的目标用户是谁？这方面，需要Kimi自己明确。

此外记者注意到，各家今年在升级大模型的时候往往也会“卷”到价格。

6月17日，MiniMax发布MiniMax-M1系列模型，并以token范围分段定价。在0～12.8万token范围内，据官方介绍，其定价均低于DeepSeek-R1。

6月11日，豆包大模型1.6正式发布时，火山引擎总裁谭待现场表示，豆包1.6首创按“输入长度”区间定价，深度思考、多模态能力与基础语言模型统一价格。豆包1.6的综合成本只有豆包1.5深度思考模型或DeepSeek-R1的三分之一。

而本次Kimi K2的定价和DeepSeek-R1基本持平。在盘和林看来，目前价格还不完全是竞争的关键因素，“因为同样价格的话，存在先入为主（的问题）。很多用户用过一个AI，如果价格相同，为什么要去用另一个AI？这个转换理由有两个，另一个AI更便宜，或者另一个AI更符合自己需要。我认为Kimi不能走低价，而是要走差异化路线。”

每日经济新闻