首页 抖音热门文章正文

深夜突袭!万亿参数MoE模型Kimi K2上线即开源,月之暗面能否重归C位?

抖音热门 2025年07月13日 19:51 0 admin

每经记者:李宇彤 每经编辑:余婷婷

2025年以来略显沉寂的月之暗面,在深夜突袭。

7月11日晚,月之暗面宣布正式发布Kimi K2模型,并同步开源。从介绍来看,Kimi K2是一款具备更强代码能力、更擅长通用Agent(智能体)任务的MoE(Mixture of Experts,混合专家模型)架构基础模型,总参数1T,激活参数为32B。

本次开源的Kimi K2模型分为Kimi-K2-Base和Kimi-K2-Instruct两个版本,前者是未经过指令微调的基础预训练模型,适合科研与自定义场景;而后者为通用指令微调版本(非思考模型),在大多数问答与Agent任务中有更好的表现。

2025年以来,“Kimi们”的处境正发生着改变。DeepSeek以低成本、高性能的开源模型强势入场;MinMax更是火力全开,今年6月在向开源社区投下一枚“重磅炸弹”,发布自主研发的MiniMax-M1系列模型后,在紧随其后的四个工作日里“一日一更”,直接“五连发”;而一众大厂对于AI(人工智能)热情和野心也在今年再上一个台阶,阿里、腾讯持续加码AI,字节来势汹汹,大模型格局的洗牌还在继续。

抛开一切变化,硬实力才是搏击市场的硬拳头。这次,月之暗面能否靠Kimi K2重归大模型C位?

Kimi K2上线即开源

月之暗面在官方介绍中称,在SWE Bench Verified、Tau2、AceBench等基准性能测试中,Kimi K2均取得开源模型中的SOTA(state-of-the-art)成绩。在其公布的测评结果中,Kimi K2在Agentic Coding(自主编程)、Tool Use(工具调用)和Math&Reasoning(数学推理)三个维度的表现上均超过了同为开源模型的DeepSeek-V3和阿里Qwen3。值得一提的是,Kimi评测中的所有模型均为非思考模型的Kimi-K2-Instruct。

目前,Kimi K2的API(应用程序编程接口)服务已上线,支持最长128K上下文,计费方案为4元/百万“输入”tokens(大模型处理文本时的最小单位),16元/百万“输出”tokens,兼容OpenAI和Anthropic两种API格式。

为了体现Kimi K2在代码、Agent工具调用、风格化写作三项能力上的提升,月之暗面也给出了具体任务下的展示。在前端开发任务中,Kimi K2支持粒子系统、可视化和3D(三维)场景等表现形式。

深夜突袭!万亿参数MoE模型Kimi K2上线即开源,月之暗面能否重归C位?

Kimi K2生成的山川峡谷3D景观 图片来源:月之暗面Kimi官方公众号截图

而在Agent工具调用能力方面,月之暗面表示Kimi K2现已具备稳定的复杂指令解析能力,可将需求自动拆解为一系列格式规范、可直接执行的ToolCall(工具调用)结构。在其释出的案例中,Kimi K2规划了参加Coldplay乐队巡演的行程,可以完成演唱会所在城市的机酒与旅游规划,并且生成日历,再用html概括完整行程规划。

《每日经济新闻》记者也使用Kimi K2进行了旅游规划的测试。根据“两个人计划8月份从北京出发,去日本东京以及大阪进行为期5天的旅游,希望能看到花火大会、吃到当地特色食物,帮我做一下包括机酒和行程在内的图文并茂的旅行规划”的需求,Kimi K2花费3分钟左右进行了一份详尽的旅游规划,规划中包括了具体的餐厅、食物、景点以及一些实用攻略。美中不足的是,这份规划是以文字以及表格的形式呈现的,虽然在最后附上了一个百度网盘链接表示可以自取图片内容,但实际上该链接是无法打开的。

随后,记者进一步提出将规划以HTML格式呈现,Kimi K2在随后交付的网页中补充了一些票务的信息,并完成了“图文并茂”的需求。不过,与官方演示的案例相比,网页整体的呈现质量还较为粗糙。

深夜突袭!万亿参数MoE模型Kimi K2上线即开源,月之暗面能否重归C位?

每经记者实测Kimi K2 图片来源:Kimi K2 截图

值得一提的是,此前记者还使用类似的提示词测试过字节的扣子空间。对比两次测试结果可以发现,扣子空间在网页的设计上完成度更高、更为美观。Kimi K2虽然在此略逊一筹,但旅游攻略制定上更为详细,给出了包括餐厅、景点在内的详细信息,还有如“交通卡当地退卡避免异地手续费”等注意事项。

此外,本次Kimi还特别展示了Kimi K2对文字输出风格的掌控,并且在虚构写作任务中,官方还表示:Kimi K2生成的文字更关注细节与情感,不再是抽象泛泛而谈。记者也以2025年北京高考的作文题目“数字闪耀时”为例,假设Kimi K2为高中生,完成一篇一类的记叙文。从完成结果上来说,整体呈现效果良好,但在最后收尾的部分隐约透露出一些“AI味”。

深夜突袭!万亿参数MoE模型Kimi K2上线即开源,月之暗面能否重归C位?

由Kimi K2撰写的北京高考作文 图片来源:Kimi K2 截图

Kimi也从技术角度透露,为了支撑万亿参数模型训练的稳定性,Kimi K2没有使用传统的Adam优化器,而是使用Muon优化器。MuonClip优化器能够稳健支撑万亿参数模型训练,显著提升token利用效率。

Kimi的下一步要走向哪?

Kimi K2的突袭中,似乎隐含着要打一场翻身仗的决心。

2024年11月,月之暗面创始人杨植麟在接受《每日经济新闻》记者采访时表示,将提升用户留存视为Kimi眼下最核心的任务。而在当时,Kimi还是国产大模型之中备受瞩目的一个。

商业智能数据服务商QuestMobile数据显示,截至2024年12月份,豆包、Kimi、文小言的月活跃用户规模分别为7523万、2101万和1224万。Kimi位列原生App领域的“三强”之一。

随着今年年初DeepSeek的横空出世,整个市场格局被迅速打乱。

今年5月,《每日经济新闻》联合QuestMobile发布的《2025年一季度AI应用价值榜》显示,Kimi虽仍在月均活跃用户规模上位于第四,但其2000万出头的规模已经和以1.8亿排在第一的DeepSeek相差甚远。在“月均下载用户数环比增长”一项上,Kimi甚至出现了负增长,用户数环比下降3.8%。

2025年以来,Kimi对模型的更新升级速度明显放缓。但从2024年年底到今年5月份,Kimi在似乎瞄准了垂类领域,寻找新的用户群,先后和财新传媒、小红书、网易游戏《逆水寒》达成合作。

此前6月20日,Kimi发布第一个Agent——Kimi-Researcher(深度研究)。

据官方表示:“模型即Agent,Kimi-Researcher是基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代Agent模型,也是一个专为深度研究任务而生的Agent产品。”当时Kimi还表示将逐步开源Kimi-Researcher基础预训练模型,以及强化学习后的模型,如今来看的话应该就是本次发布的Kimi K2。

知名经济学者、工信部信息通信经济专家委员会委员盘和林在接受《每日经济新闻》记者微信采访时对Kimi上半年的努力进行了分析。在他看来,Kimi的努力方向是对的,但还不够,Kimi需要将自己的AI嵌入到一个生态当中。如今,互联网平台各大生态是封闭的,比如电商的AI可以帮助商家设计网站,自媒体的AI能够帮助自媒体制作视频,那么,Kimi的目标用户是谁?这方面,需要Kimi自己明确。

此外记者注意到,各家今年在升级大模型的时候往往也会“卷”到价格。

6月17日,MiniMax发布MiniMax-M1系列模型,并以token范围分段定价。在0~12.8万token范围内,据官方介绍,其定价均低于DeepSeek-R1。

6月11日,豆包大模型1.6正式发布时,火山引擎总裁谭待现场表示,豆包1.6首创按“输入长度”区间定价,深度思考、多模态能力与基础语言模型统一价格。豆包1.6的综合成本只有豆包1.5深度思考模型或DeepSeek-R1的三分之一。

而本次Kimi K2的定价和DeepSeek-R1基本持平。在盘和林看来,目前价格还不完全是竞争的关键因素,“因为同样价格的话,存在先入为主(的问题)。很多用户用过一个AI,如果价格相同,为什么要去用另一个AI?这个转换理由有两个,另一个AI更便宜,或者另一个AI更符合自己需要。我认为Kimi不能走低价,而是要走差异化路线。”

每日经济新闻

发表评论

长征号 Copyright © 2013-2024 长征号. All Rights Reserved.  sitemap