精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Kimi K2官方技術報告出爐:采用384個專家,訓練不靠刷題靠“用自己的話再講一遍”

人工智能 新聞
沒錯,就是整整32頁的Kimi K2官方技術報告。業內人士第一波repo已火速出爐

Kimi K2稱霸全球開源模型的秘籍公開了!

沒錯,就是整整32頁的Kimi K2官方技術報告。業內人士第一波repo已火速出爐:

這篇論文中有很多令人印象深刻的內容。

圖片

nice!它分享了很多關于Kimi(以及中國實驗室)對這些模型的看法(他們關注/優化的內容)。

圖片

Kimi K2,作為Kimi最新MoE基礎模型,總參數1T,激活參數32B,能力領先性尤其展現在代碼、Agent、數學推理任務上。

上線僅一周,它就在競技場千人盲評中擊敗DeepSeek,登頂全球最強開源模型,而且能媲美Grok 4、GPT 4.5等頂尖閉源模型。

那它是咋做到的呢?

別急,這篇最新論文來給答案了——一次性大公開Kimi K2的訓練過程及“秘密配方”

包括但不限于大家已經熱議的:MuonClip優化器、大規模Agentic Tool Use數據合成、通用強化學習等等。

圖片

下面詳細來看。

都有哪些技術亮點

首先,Kimi團隊認為,現如今大語言模型正從靜態模仿學習向Agentic Intelligence轉型。

這意味著,模型需要具備在復雜動態環境中自主感知、規劃、推理和行動的能力。

要實現這一點,當前人們面臨兩大挑戰:

  • 預訓練需在高質量數據有限的約束下,通過提升每token效率構建通用先驗(universal prior)。
  • 后訓練需將先驗轉化為可行動行為,但Agentic能力在自然數據中稀缺且難以規模化。

對此,團隊在Kimi K2中采用了三大核心創新技術

1、MuonClip優化器:拋棄傳統的Adam優化器,創新性地使用了Muon優化器。結合Muon的token效率與QK-Clip的穩定性,支持15.5萬億token無損失spike預訓練。

2、大規模Agentic Tool Use數據合成:構建可大規模生成多輪工具使用場景的合成pipeline,覆蓋數百領域、數千工具。

3、通用強化學習框架:結合可驗證獎勵(RLVR)和自我批判評估獎勵,將對齊從靜態擴展到開放域。

得益于以上技術,Kimi K2在SWE Bench Verified、Tau2、AceBench等基準性能測試中,均取得開源模型中的SOTA成績。

圖片

以下為技術細節部分:

預訓練階段

在Kimi K2預訓練階段,團隊主要對優化器和數據進行了優化。

整體而言,其預訓練采用了MoE架構+穩定優化器+高效token利用這一全新組合拳,以此構建通用語言和推理能力。

模型架構上,一共包含384個專家,每層激活其中8個,通過這種高度稀疏的設計在保證性能的同時優化計算效率。

在注意力機制上,K2使用MLA(Multi-head Latent Attention)結構代替傳統的密集注意力(dense attention),有效減少了計算量和帶寬壓力。

而且將每層的注意力頭數量降至64個,與同類模型相比進一步降低了推理過程中的資源消耗,使模型能更好地處理長上下文。

圖片

優化器選擇上,K2采用了MuonClip優化器,其核心是在Muon優化器基礎上融合了QK-Clip機制。

這一機制會定期檢查模型注意力的關鍵參數(query和key),如果它們的值太大,就自動“收緊”,防止計算過程出現異常,從而顯著提升了訓練穩定性。

團隊最終也發現,借助MuonClip可讓K2在15.5萬億token的預訓練過程中實現零損失spike,確保了大規模訓練的連續性和有效性。

數據方面,其核心目標為,在高質量數據有限時,通過提升每token的有效學習信號(token效用)來增強訓練效率,避免重復訓練導致的過擬合。

而為了讓模型“吃透”有限的優質訓練數據,K2團隊采取了一種所謂的“重述法”

  • 對知識類文本:不是簡單重復讀,而是換著說法再講一遍。
  • 對數學類文本:把枯燥的教材式內容改寫成更易理解的“學習筆記”風格,還加入了多語言版本的翻譯文本,讓模型見多識廣。

一言以蔽之,K2的訓練數據覆蓋網頁、代碼、數學、知識四大板塊,所有數據都經過嚴格的質量篩選,確保模型學到的都是有用的信息。

而且它不是靠“多刷題”訓練出來的,而是靠“換種說法講一遍”讓模型真正理解知識

用重寫10次的數據訓練1輪(28.94%),其準確率超過了用原始數據訓練10輪(23.76%)的結果 。

圖片

概括而言,K2采用了與DeepSeek-V3相似的多頭潛在注意力(MLA),具體對比如下:

圖片

后訓練階段

K2后訓練階段主要涉及監督微調和強化學習。

值得一提的就是大規模Agentic Tool Use數據合成,主要流程如下:

  • 工具生成:3000多真實MCP工具+20000多合成工具,覆蓋金融、機器人控制等領域;
  • Agentic與任務生成:為工具集生成多樣化Agentic(系統提示+工具組合)和帶評估標準的任務;
  • 軌跡生成:模擬用戶交互、工具執行環境(含狀態更新和隨機結果),生成多輪工具使用軌跡;
  • 結合真實執行沙箱(如編碼任務),確保數據真實性。

最終,Judge Agent會依據任務rubrics對軌跡質量進行判斷,只保留高質量樣本用于訓練。

這一過程本質上是一種大規模拒絕采樣(rejection sampling)機制,結合模擬規模與真實反饋,實現了大范圍、高保真的訓練數據構建。

圖片

而在強化學習階段,K2主要經歷了三大步驟:

第一,構建可驗證的獎勵環境(Verifiable Rewards Gym)。

簡單說,團隊為不同任務設計了“可打分”的訓練場景,讓模型的表現可以被客觀評估。

比如對于編碼場景,團隊利用真實世界的數據(如程序競賽題目、GitHub的PR和issue)構建任務,并通過自動化測試來驗證模型的代碼是否正確運行。

第二,除了外部評判,還訓練模型自己評估自己,即引入自我評估獎勵機制(Self-Critique Rubric Reward)。

具體而言,模型會將自己的多個輸出結果進行兩兩比較,并根據一套明確的標準(如語言清晰度、對話是否連貫、是否啰嗦或拍馬屁)給出獎勵分,同時還引入一些規則約束(如“不要無腦稱贊用戶”)來避免生成套路化或迎合性回答。

這個機制不僅增強了模型的自我反饋能力,也能將客觀任務中的評估信號遷移到主觀對話場景(如回答開放性問題等人類主觀評判場景),形成閉環優化。

第三,為了更高效、穩定地進行強化學習訓練,K2還對算法進行了多項改進。

包括但不限于下面這些:

  • 預算控制機制:限制每個樣本的最大token數,避免生成啰嗦、重復或無意義的長文本。
  • 引入PTX輔助損失:使用高質量預訓練樣本時再加一個損失項,以防模型在RL階段“遺忘”已有知識。
  • 溫度衰減策略:訓練初期用高溫度鼓勵模型大膽嘗試、廣泛探索,后期逐步降低溫度,讓模型輸出更穩定、更收斂。

最后據論文介紹,K2的訓練依托于由NVIDIA H800構成的大規模高帶寬GPU集群,通過混合并行策略,既保證了訓練效率,又能在不同規模資源下靈活適配。

每個節點配備2TB內存,并通過NVLink和NVSwitch將8塊GPU在節點內部高速互聯。不同節點之間則使用8×400 Gbps的RoCE網絡互聯,以實現節點間的高效通信。

圖片

One More Thing

就在剛剛,阿里通義Qwen3模型也更新了——

正式由Qwen3-235B-A22B更新至Qwen3-235B-A22B-2507

官方表示,他們停用了混合思維模式,改為分別訓練Instruct和Thinking模型以提升質量,并正式發布性能更強的 Qwen3-235B-A22B-Instruct-2507及其FP8版本。

而且官方測評顯示,最新版Qwen3又擊敗了Kimi K2模型,開源新王或將再次易主。

圖片

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-07-17 08:14:22

2025-07-16 09:29:39

2025-11-12 08:54:13

2019-07-30 14:58:52

人工智能AI

2025-07-22 11:38:38

2021-08-12 10:36:18

order byMySQL數據庫

2023-01-10 19:47:47

Redis原理多線程

2017-12-26 14:17:24

潤乾報表

2025-07-31 01:00:00

LLM架構模型

2025-11-10 16:57:11

Kimi k2ClaudeGPT

2021-06-15 07:15:15

Oracle底層explain

2022-01-17 20:59:37

開發group by思路

2025-07-29 07:46:00

2025-07-22 11:03:07

2025-02-13 09:06:27

2021-12-01 07:26:13

IO模型異步

2024-03-26 07:59:32

IO模型多路復用

2024-03-12 08:20:57

零拷貝存儲開發

2015-10-10 11:10:24

重敲代碼拷貝粘貼

2021-10-07 20:12:03

MVCC事務原理
點贊
收藏

51CTO技術棧公眾號

免费av一区二区| 日本乱码高清不卡字幕| 国产高清一区二区三区| 青青草av在线播放| 俺要去色综合狠狠| 久久精品国产77777蜜臀| 亚洲成人久久久久| 蜜臀av午夜一区二区三区 | 日韩精品在线影院| 国产视频手机在线播放| 男女视频在线| 久久精品亚洲精品国产欧美| 国产有码在线一区二区视频| 国产午夜精品一区二区理论影院 | 国产成人欧美日韩在线电影| 欧美在线激情网| 91 在线视频| 青草影院在线观看| 成人综合影院| 国产伦理精品不卡| 日韩美女视频在线观看| 国内自拍视频网| 日本大片在线播放| 国产精品国产三级国产aⅴ原创| yellow视频在线观看一区二区| 激情视频网站在线观看| 黄色精品免费| 亚洲精品自拍视频| 亚洲成人手机在线观看| 欧美日韩精品免费观看视欧美高清免费大片| 亚洲啪啪综合av一区二区三区| 欧美日韩免费观看一区| 亚洲av综合色区无码一区爱av| 日韩欧美视频专区| 亚洲精品一区二区久| 中文国产在线观看| 成人国产激情在线| 色又黄又爽网站www久久| 高清欧美精品xxxxx| 久热国产在线| 中文字幕一区二区三区不卡| 日韩免费中文专区| 韩国三级av在线免费观看| 99视频国产精品| 欧亚精品中文字幕| 黄色片视频网站| 激情婷婷久久| 亚洲精品在线视频| 中文字幕在线观看网址| 久久九九热re6这里有精品| 污片在线观看一区二区| 激情五月六月婷婷| 亚洲按摩av| 亚洲精品乱码久久久久久黑人| 亚洲国产精品久久久久婷婷老年 | 天天综合色天天| 中国一级大黄大黄大色毛片| 毛片在线看网站| 亚洲欧美在线aaa| 中文字幕一区二区三区有限公司| av资源种子在线观看| 国产欧美日韩综合精品一区二区| 日本婷婷久久久久久久久一区二区| 视频在线不卡| 水蜜桃久久夜色精品一区的特点| 91精品国产91久久久久久最新 | 成人性生交大片免费看96| 欧美一级一区二区| 国产欧美视频一区| 国产精品videossex| 欧美在线观看一区二区| 青青草综合视频| 免费在线中文字幕| 午夜精品影院在线观看| 男人日女人逼逼| 国产精品av一区二区三区 | 成人激情小说乱人伦| 久久免费电影网| 久久av一区二区三区漫画| 激情高潮到大叫狂喷水| 色综合久久网| 你懂的国产精品永久在线| 色老头一区二区三区| 小向美奈子av| 欧美精品三区| 欧美亚洲另类激情另类| 99自拍偷拍视频| 久久久久久久久久久9不雅视频| 美女性感视频久久久| 国产午夜福利一区二区| 久久亚洲风情| 成人在线激情视频| 韩国av永久免费| 久久美女艺术照精彩视频福利播放 | 播播国产欧美激情| 日韩av片在线免费观看| 欧美婷婷在线| 国产成人综合亚洲| 97国产成人无码精品久久久| 国产91精品久久久久久久网曝门 | 男女视频在线观看网站| 国产乱论精品| 成人小电影网站| 欧美亚洲图片小说| 久久久久亚洲av无码麻豆| 国产乱论精品| 久久精品视频网站| 国产又粗又爽视频| 国产精品99久久久久久似苏梦涵| 麻豆久久久9性大片| 高h视频在线观看| 精品人妻一区二区三区含羞草| 国产成人一区| 久久精品精品电影网| 日本少妇裸体做爰| 精品一区二区三区免费观看| 精品国产免费人成电影在线观...| 成年人视频在线观看免费| 亚洲国产精品精华液网站| 色天使在线观看| 神马久久一区二区三区| 在线观看视频一区| 亚洲日本久久久| av一级亚洲| 日韩在线观看你懂的| 男人日女人网站| 国产99久久久国产精品潘金网站| 亚洲视频电影| 欧美影视资讯| 国产亚洲激情在线| 国产黄色大片免费看| 激情一区二区| 国产成人精品免费视频大全最热 | 成人性生活视频免费看| 亚洲欧美在线综合| 综合欧美国产视频二区| 亚洲女同二女同志奶水| 在线午夜精品| 国产一区二区无遮挡| 羞羞电影在线观看www| 欧美精品丝袜中出| 午夜黄色福利视频| 日本亚洲三级在线| 日本一区二区不卡高清更新| 美女的胸无遮挡在线观看| 午夜精品久久久久久久99水蜜桃| 网站在线你懂的| xvideos.蜜桃一区二区| 美女国内精品自产拍在线播放| 一级爱爱免费视频| 亚洲欧洲国产日韩| 午夜天堂在线视频| 亚洲最大av| 91免费在线观看网站| 五十路在线视频| 亚洲成人av福利| 黄色av网址在线观看| 国产精品日本欧美一区二区三区| 国产精品国产三级国产专播精品人 | 国产精品视频网站| h视频网站在线观看| 欧美日韩黄色一区二区| 国产av无码专区亚洲av毛网站| 国产在线播放一区| 久久亚裔精品欧美| 一区二区三区四区日本视频| 亚洲欧美日韩国产中文专区| 亚洲精品中文字幕乱码三区91| 久久麻豆一区二区| 亚洲精品第三页| 欧美激情在线| 精品无人乱码一区二区三区的优势 | 国产精品国产三级国产有无不卡| 老司机午夜性大片| 欧美日韩亚洲一区二区三区在线| 国产亚洲精品久久飘花| 忘忧草在线日韩www影院| 亚洲午夜av电影| 一级黄色免费看| 亚洲精品免费看| 国产香蕉精品视频| 天堂成人国产精品一区| 一区二区成人国产精品 | 日韩免费视频一区二区| 久久久国产高清| 国产精品久久毛片| 久久成人免费观看| 精品久久视频| 96成人在线视频| 美女福利一区二区| 麻豆乱码国产一区二区三区| 亚洲aaaaaaa| 5858s免费视频成人| 综合激情网五月| 日韩美女精品在线| 亚洲一二三四五| 免费看欧美美女黄的网站| 男女日批视频在线观看| 国产最新精品| 国产激情一区二区三区在线观看 | 国产成人在线视频免费观看| 亚洲第一页自拍| 888奇米影视| 色综合欧美在线视频区| 欧美成人三级在线观看| 国产网站一区二区| 久久人妻少妇嫩草av无码专区| 久久精品国产精品青草| 日韩视频第二页| 黑人一区二区| 亚洲免费精品视频| 最新精品国偷自产在线| 91在线中文字幕| 97久久网站| 欧美主播福利视频| 黄网站在线观| 久久影视电视剧免费网站清宫辞电视| 你懂的免费在线观看视频网站| 日韩免费一区二区三区在线播放| 波多野结衣视频观看| 亚洲成人av资源| 69av视频在线| 亚洲素人一区二区| wwwww黄色| 国产日产欧美精品一区二区三区| 亚洲日本久久久| 国产成人av电影在线| 久久综合在线观看| 久久99精品一区二区三区| 亚洲污视频在线观看| 日韩电影免费在线观看网站| www一区二区www免费| 亚洲茄子视频| 9久久9毛片又大又硬又粗| 欧美色图麻豆| 久久久久久久9| 国产精品99一区二区三| 伊人天天久久大香线蕉av色| 日本午夜一区| 一区二区三区久久网| 日韩精品一区二区三区免费观看| 色大师av一区二区三区| 久久亚洲精品爱爱| 日本一区二区在线免费播放| 欧亚av在线| 欧美一区二区三区免费观看| jizz内谢中国亚洲jizz| 日韩av电影在线播放| 免费福利视频一区二区三区| 欧美做受高潮电影o| 欧美momandson| 欧美在线视频网| 国产私拍福利精品视频二区| 国产精品久久久久久久久久久不卡| 欧美xxxx做受欧美护士| 国产成人在线播放| 另类一区二区| 98精品国产高清在线xxxx天堂| 韩国日本一区| 欧美亚洲成人xxx| 香蕉久久免费电影| 成人黄色在线播放| 成人福利一区| 久久精品中文字幕一区二区三区| 国产精品欧美三级在线观看| 亚洲春色在线视频| 欧美在线三区| 黄色动漫网站入口| 奇米在线7777在线精品| 午夜激情影院在线观看| 国产成a人无v码亚洲福利| 亚洲国产综合视频| 欧美国产日本韩| 欧美色图一区二区| 欧美日韩亚洲高清| 怡红院男人的天堂| 精品国产在天天线2019| 可以直接在线观看的av| 精品国产欧美一区二区五十路 | 一区二区三区四区亚洲| 日韩欧美a级片| 在线观看亚洲a| 精品国产无码一区二区| 亚洲精品中文字幕有码专区| 欧美成人精品一区二区男人看| 欧美成人黑人xx视频免费观看| 草草在线视频| 国产日韩专区在线| 好吊妞视频这里有精品| 欧美日韩成人一区二区三区| 国产精品99在线观看| av日韩一区二区三区| 免费高清视频精品| 久久久国产精品无码| 日韩第一区第二区| 亚洲精选在线视频| 欧美乱大交做爰xxxⅹ小说| 尤物精品在线| 国产又黄又猛的视频| 99视频一区二区| 丝袜美腿小色网| 欧美在线影院一区二区| 国精产品乱码一区一区三区四区| 丝袜一区二区三区| 色偷偷偷在线视频播放| 91成人免费观看| 成人动漫免费在线观看| 欧美变态另类刺激| 国产成人免费网站| 日韩一卡二卡在线观看| 欧美性猛交视频| 免费av一级片| 久久电影一区二区| abab456成人免费网址| 国产一区福利视频| 欧美日韩午夜| 999热精品视频| 国产精品久久久久影视| 国产精品69页| 五月婷婷丁香花| 一区二区三区美女xx视频| 男插女视频久久久| 97碰碰视频| 91精品国产自产在线观看永久∴| 少妇性l交大片| 91免费观看在线| 青青草成人av| 亚洲激情在线视频| 国产精品69xx| 99热在线播放| 欧美精品成人| 中文字幕乱妇无码av在线| 国产精品电影一区二区三区| 欧美高清69hd| 亚洲图片欧美色图| 国产精品九九九九| 久久精品福利视频| 欧洲亚洲精品久久久久| 成人激情视频在线播放| 成人在线免费观看视频| 虎白女粉嫩尤物福利视频| 91色|porny| 成人在线免费看视频| 日韩大陆欧美高清视频区| av在线最新| 国产专区欧美专区| 日韩欧美一区二区三区免费看| 男人舔女人下面高潮视频| 久久精品一区四区| 午夜视频网站在线观看| 最近2019年好看中文字幕视频 | 在线影院国内精品| 国产美女性感在线观看懂色av| 国产不卡av在线| 欧美色图国产精品| 亚洲一级免费在线观看| 亚洲欧洲精品天堂一级| aa视频在线免费观看| 久久99亚洲精品| 欧美91在线| 午夜免费精品视频| ●精品国产综合乱码久久久久 | 粉嫩13p一区二区三区| 日本三级网站在线观看| 国产丝袜一区二区| 99riav视频一区二区| 99精品一级欧美片免费播放| 国产成人h网站| 国产又大又粗又爽| 日韩视频在线一区| 精品中文在线| 欧美二区在线视频| 中文一区一区三区高中清不卡| 国产乱人乱偷精品视频a人人澡| 欧美黑人xxxx| 九九在线高清精品视频| 182午夜视频| 亚洲一区二区三区四区的| 免费福利在线观看| 91精品视频免费观看| 99国产精品| 婷婷国产成人精品视频| 精品播放一区二区| 欧美激情福利| 亚洲啊啊啊啊啊| 久久婷婷色综合| 99久久精品国产色欲| 欧美亚洲成人xxx| 在线中文字幕第一区| 调教一区二区| 午夜精品久久久久久99热软件| a级网站在线播放| 好看的日韩精品视频在线| 日韩国产在线观看一区| 草视频在线观看| 亚洲人成毛片在线播放| bl在线肉h视频大尺度| 热舞福利精品大尺度视频| 国产一区二区三区av电影| 久久青青草视频|