Kimi K2.6 深夜开源:代码能力对标GPT-5.4,还顺手开源了300个Agent

昨晚11点,月之暗面突然在X上发了一条推文,宣布Kimi K2.6正式开源。

说”突然”,是因为这波操作确实有点猛——谁能想到国产模型会在深夜搞突然袭击,而不是开个发布会、请几个KOL吹一通?

我赶紧爬起来看了一下官方公布的基准测试数据。好家伙,博士级难度的「人类最后的考试」(Humanity’s Last Exam),K2.6得分54.0%,第一;Agent深度检索能力的DeepSearchQA,92.5%,碾压GPT-5.4和Claude Opus 4.6。

但最让我感兴趣的不是这个。

是那个「300个Agent集群协同」的能力。

说实话,看到这个消息的时候我第一反应是:等等,300个?这什么概念?

我试着理解了一下——大概就是说,一个任务可以拆成300个小任务,分配给300个Agent同时干,最后再合并结果。这比之前我们看到的「单个Agent替你干活」的说法,不知道高到哪里去了。

好处显而易见:速度更快、容错率更高、任务拆解更细。

但问题也很明显:

第一,300个Agent之间的通信和协调,本身就是一道难题。就像一个公司有300个人同时干活,如果没有好的管理机制,结果可能是一团乱麻。

第二,成本。300个Agent意味着300倍的token消耗。官方说API定价涨了58%,嗯,这就说得通了。

第三,开源这件事本身。K2.6确实开源了,但「开源」两个字的含金量到底有多少?是只开源了模型权重,还是连训练代码、训练数据、评测方法都开源了?这个还得再看看。

不过话说回来,国产模型能在代码能力上和GPT-5.4正面刚,这本身就是一件值得记录的事。

要知道,就在几个月前,国产模型的代码能力还被GPT-4碾压。现在,至少在这个维度,我们有了和最强者掰手腕的底气。

至于300个Agent集群——我倒是挺想试试看实际效果怎么样的。等我拿到API Key,第一时间给大家实测。

说实话,看到这条新闻的时候,我脑子里冒出的第一个念头是:杨植麟这次是真的交了一份不错的答卷。

至于这份答卷能打几分——时间会给出答案。

对了,据说K2.6已经可以在kimi.com上直接使用了,API也同步开放。感兴趣的可以去试试,有结果了记得来评论区聊聊。