首页 景点排名文章正文

国内公司搞出AI新模型,既便宜又能打,行业要变天?

景点排名 2025年10月08日 23:43 0 aa

一直以来,搞顶级AI模型都是大公司的“专属游戏”,不仅要砸重金投入计算资源,人力成本也高得吓人。

但最近人工智能圈炸了个消息:国内有家公司新研发的AI模型,直接打破了这个局面。​

按行业分析,这款模型的成本比同级闭源模型低了90%到95%,相当于把以前高不可攀的研发门槛拉低了一大截。

国内公司搞出AI新模型,既便宜又能打,行业要变天?

更难得的是,它没因为便宜就牺牲性能,在权威推理测试里,跟行业里很牛的o1模型比起来毫不逊色,完全够得上顶级推理模型的水平。​

更重要的是,这家公司还把模型开源了,全球开发者都能一起优化,这么一来,不光小机构有机会做前沿AI开发,整个行业的玩法恐怕都要跟着变了。​

成本效率颠覆​

国内公司DeepSeek搞出了新模型,在成本上直接给行业来了个“降维打击”,要知道以前想做顶级AI模型,那可是烧钱的活儿。​

但这个新模型不一样,据行业分析,它的成本比同级别的那些闭源模型低了90%到95%,这可不是小数目啊!​

国内公司搞出AI新模型,既便宜又能打,行业要变天?

为啥能这么便宜?关键还是在于训练方法的创新,减少了对昂贵计算资源和人力成本的依赖。​

而且DeepSeek还特别敞亮,选择把模型开源,全球的开发者都能一起琢磨、改进这个模型,技术迭代速度一下子就提上来了。​

这跟有些公司搞闭源的路子完全不一样,也难怪在技术界收获了一大波好评。​

更厉害的是,这个模型性能还不差,在好几个权威的推理能力测试里,它表现得跟行业里很牛的o1模型不相上下。​

国内公司搞出AI新模型,既便宜又能打,行业要变天?

比如在AIME2024数学竞赛测试中,一次性通过率就有79.8%,在MATH-500数据集上得分更是高达97.3%,妥妥的顶级推理模型水平。​

既便宜又能打,这对整个AI行业的格局影响可太大了。

训练方法大变革

以前AI想拥有通用推理能力,那可是个大难题,就像在追求“圣杯”一样。​

传统的训练方法特别依赖人工标注的海量数据,相当于用这些正确答案手把手“教”AI怎么思考,不仅花的钱多多,还没法覆盖人类思维的各种复杂情况,很容易出问题。​

DeepSeek的团队不按常理出牌,换了个新思路。​

国内公司搞出AI新模型,既便宜又能打,行业要变天?

他们觉得与其直接告诉AI答案,不如给AI设定好目标和奖励机制,让AI自己在试错中找到正确的推理路径。​

他们先搞了个叫“DeepSeek-R1-Zero”的模型,训练的时候完全不用人工标注的数据,要是AI解决数学、编程这类复杂问题时答案对了,就给正向奖励,错了,就给负向惩罚。​

就这么训练了几千次之后,神奇的事情发生了,这个模型竟然自己琢磨出了很多像人一样的推理行为,比如会自己生成长篇的“思考链”,还学会了“自我反思”“自我验证”。​

有时候甚至会像人突然“顿悟”一样,主动纠正之前错了的推理路径。​

国内公司搞出AI新模型,既便宜又能打,行业要变天?

后来在此基础上,结合少量高质量“冷启动”数据和多阶段训练,最终的模型不仅推理能力强,输出的结果也更符合人类偏好,还很客观。​

这证明只要目标明确、反馈机制有效,AI不用人手把手教,也能发展出复杂的认知策略,不仅省了大笔训练成本,还为AI能力持续自主提升打开了新空间。​

瞄准通用智能

并且DeepSeek的模型还登上了《自然》杂志,这可是顶级科学期刊,经过了严格的同行评审,这就给它的方法提供了科学严谨性的背书。​

不只是这家公司的成就,对整个AI领域来说都是个重要时刻,现在大家都看明白了,强化学习是让AI拥有高级认知能力的关键。​

国内公司搞出AI新模型,既便宜又能打,行业要变天?

以前AI发展总想着靠增加模型参数和数据量,现在看来,未来更要在训练方法、奖励机制和学习环境的精细设计上下功夫。​​

比如怎么设计出更好的奖励函数,让AI掌握更多样、更抽象的推理能力,这会成为接下来研究的核心方向。​

当然,想实现通用智能也不是一帆风顺的,还有不少挑战。​

比如怎么保证AI在自己学习的时候安全可控,怎么把这么强的推理能力用到更多现实任务中去,但不可否认,国内这家公司开辟的这条路特别有前景。​

国内公司搞出AI新模型,既便宜又能打,行业要变天?

要是能一直让AI保持这种自主探索学习的能力,说不定我们离创造出真正能理解世界、和人类好好合作解决复杂问题的通用人工智能,就越来越近了。​

这种靠奖励驱动的AI“思想解放”,说不定就是未来AI发展的关键一步。

结语

DeepSeek的新AI模型,算是给AI行业来了次“大洗牌”。​

它把顶级模型的成本砍到了原来的零头,性能还能跟上o1模型,再加上开源让大家一起发力,以前大公司垄断的局面肯定要变。​

国内公司搞出AI新模型,既便宜又能打,行业要变天?

不过要实现真正的通用智能,还有安全、应用这些坎要过。但不管怎么说,这个新模型已经指明了方向,接下来就看整个行业怎么借着这股劲儿,把AI的能力用得更实,走得更远了。

发表评论

长征号 Copyright © 2013-2024 长征号. All Rights Reserved.  sitemap