Kimi K2發(fā)布：1萬億參數(shù)，128K上下文，還能跑17個工具流程？原創(chuàng) 精華

發(fā)布于 2025-7-16 06:17

瀏覽

0收藏

7月，Moonshot AI發(fā)布了一款重量級的開源大模型——Kimi K2。這不僅是一款規(guī)模達到1萬億參數(shù)的Mixture-of-Experts（MoE）模型，更是一次從「對話模型」到「行動模型」的全面躍遷。

它不僅能“說”，更能“做”。

與ChatGPT、Claude這些語言高手不同，Kimi K2 是為Agentic執(zhí)行型任務(wù)量身打造的。它會自主拆解任務(wù)、調(diào)用工具、編寫和調(diào)試代碼、分析數(shù)據(jù)、甚至控制多步流程。而這些，幾乎不需要人類插手。

一、從“能說會道”到“能干會做”——為什么我們需要Agentic AI？

我們一直在追求更強的語言理解能力，GPT-4、Claude 4 Sonnet、Gemini Pro都能進行非常復(fù)雜的推理與對話。但問題是，它們?nèi)匀煌Ａ粼凇?strong>對話”這一階段——你說一句，我答一句，哪怕內(nèi)容再精準(zhǔn)，也無法真正“動起來”。

Kimi K2不同。

它從一開始就不是為聊天設(shè)計的，而是為執(zhí)行任務(wù)而生的。它具備如下能力：

這不再是傳統(tǒng)意義上的Chatbot，而是一個行動中的AI助手。

Kimi K2是目前開源模型中少有的具備真正Agent能力的產(chǎn)品。我們來拆解它背后的幾大技術(shù)亮點：

采用Mixture-of-Experts（MoE）Transformer架構(gòu)，共有384個專家網(wǎng)絡(luò)，每個token只激活其中8個，加上1個共享專家處理全局信息。這樣設(shè)計既保證了推理效率，也帶來了超大模型規(guī)模的表達能力。

此外，每層還配備了64個注意力頭，上下文窗口擴展至128K tokens，在處理長文檔或多工具任務(wù)中得心應(yīng)手。

在如此龐大的參數(shù)量下，訓(xùn)練穩(wěn)定性成為難題。Kimi K2采用了MuonClip優(yōu)化器——這是對原始Muon算法的一個改進版本。

最終，K2在15.5萬億tokens的多語言多模態(tài)數(shù)據(jù)上完成了大規(guī)模訓(xùn)練，穩(wěn)定性拉滿。

與OpenAI在ChatGPT插件中使用的「工具調(diào)用插件」不同，Kimi K2支持的是**Model Context Protocol (MCP)**，這是一種更適合Agent的系統(tǒng)級通信協(xié)議。

MCP讓模型可以：

模擬人類執(zhí)行多個步驟（multi-step tool use）
自主決定使用哪些工具、以何種順序使用
高效完成一整個任務(wù)鏈，例如：從用戶輸入需求 → 自動調(diào)用接口 → 執(zhí)行SQL → 輸出數(shù)據(jù)分析圖表 → 生成報告

訓(xùn)練過程中，K2使用了數(shù)百萬段合成對話，全部經(jīng)過LLM評估器打分篩選，確保模型不僅知道怎么“說”，更知道怎么“做”。

Kimi K2在多個主流基準(zhǔn)測試中表現(xiàn)亮眼，尤其是在“Agentic”相關(guān)任務(wù)中，一騎絕塵：

其中Tau2和LiveCodeBench兩項Agentic編碼測試，幾乎是Kimi K2的主場。這些評測強調(diào)的是AI是否能完成真實世界的多步驟任務(wù)，而不是只是單步問答或死記硬背。

最讓人驚訝的是——它不僅強，還便宜！