📢 转载信息
原文作者:Ivan Mehta
中国获得阿里巴巴和红杉中国(Sequoia China)等机构支持的Moonshot AI,于今日发布了新的开源模型 Kimi K2.5,该模型能够理解文本、图像和视频。
该公司表示,该模型是在15万亿个混合视觉和文本token上进行训练的,因此它具有原生的多模态能力。此外,该公司指出该模型在编码任务和处理智能体集群(agent swarms)方面表现出色——智能体集群是一种允许多个智能体协同工作的编排方式。在发布的基准测试中,该模型的性能可与专有模型相媲美,甚至在某些任务上超越了它们。
例如,在编码基准测试中,Kimi K2.5在SWE-Bench Verified基准测试中超越了Gemini 3 Pro,并在SWE-Bench Multilingual基准测试中得分高于GPT 5.2和Gemini 3 Pro。在视频理解方面,它在衡量模型对视频进行推理能力的VideoMMMU(视频多学科多模态理解)基准测试中,击败了GPT 5.2和Claude Opus 4.5。
Moonshot AI表示,在编码方面,虽然模型可以很好地理解文本,但用户也可以为其输入图像或视频,并要求它创建一个与这些媒体文件中显示的类似界面。
这是我们创始人杨植麟(Zhilin Yang)的一段简短视频。
— Kimi.ai (@Kimi_Moonshot) January 27, 2026
(这是他第一次这样对着镜头讲话,他非常想和大家分享Kimi K2.5!) pic.twitter.com/2uDSOjCjly
为了让人们能够使用这些编码能力,该公司推出了一个名为Kimi Code的开源编码工具,它将与Anthropic的Claude Code或Google的Gemini CLI竞争。开发者可以通过终端使用Kimi Code,或将其集成到VSCode、Cursor和Zed等开发软件中。这家初创公司表示,开发者可以使用图像和视频作为Kimi Code的输入。
编码工具正迅速普及,并成为AI实验室的收入来源。Anthropic在11月宣布,Claude Code的年化经常性收入(ARR)已达到10亿美元。本月早些时候,Wired报道称,到2025年底,该工具在此基础上又增加了1亿美元的收入。根据The Information的报道,Moonshot在中国的竞争对手DeepSeek计划下个月发布一款具有强大编码能力的新模型。
Moonshot由前谷歌和Meta AI研究员杨植麟(Yang Zhilin)创立。该公司在2024年2月的B轮融资中以25亿美元的估值筹集了10亿美元资金。据彭博社报道,这家初创公司在上个月以43亿美元的估值获得了5亿美元的新一轮融资。此外,该报道还提到,Moonshot目前正在寻求以50亿美元的估值进行新一轮融资。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区