精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

美團龍貓再開源LongCat-Flash-Thinking模型,細節滿滿!

發布于 2025-9-24 07:07
瀏覽
0收藏

昨天刷到美團龍貓又開源新模型了,LongCat-Flash-Thinking,這次是思考模型。

8月底,美團先開了LongCat模型,我也是第一時間評測了!

這次LongCat-Flash-Thinking的技術報告依舊干貨滿滿,很多有意思的東西,就比如各領域數據分開進行RL,然后融合,我之前只看到在SFT上會這么做,沒想到RL也行~

咱們依舊老規矩先看細節,再評測。

LongCat-Flash-Thinking,也是MoE模型,模型結構跟LongCat一樣,依舊是零計算專家等等,相關介紹看我上一篇。

核心區別在于訓練方式不同,訓練涉及兩個階段,長CoT冷啟動訓練和強化學習,訓練流程如下圖所示:

美團龍貓再開源LongCat-Flash-Thinking模型,細節滿滿!-AI.x社區

先看冷啟動部分,包括Mid-training和SFT,核心是高質量數據構建,Mid-training階段(也可以叫做增量預訓練)采用課程學習的思想,將通用數據加入 STEM (競賽難度)和 Code (編程競賽) 數據,在不削弱模型通用基礎能力的前提下,建立較高地推理能力起點。

SFT階段主要涉及三個部分數據,通用推理數據,包括STEM、Code、邏輯和問答,Prompt過濾,用LLM初篩過濾不完整、無法回答或質量過低的Query,而對于Code,需具備清晰描述、不少于5組單元測試、有可執行評測腳本;同時,按照題目通過率,丟棄太過簡單地題目,按難度分布采用構建Prompt數據集。

回答構建,采用拒絕采樣用LongCat-Chat為每題生成多個候選回答,結合規則與模型評判選出最高質量響應作為訓練數據。

形式推理數據,(形式推理就是以機器可驗證的格式進行推理,例如,Lean4形式語言,前段時間DeepSeek-Prover模型就是干這個的),利用8B模型將自然語言題目轉換為Lean4形式,再用語法和語義進行雙重過濾,證明過程合成時采用迭代合成,不斷將驗證成功的數據,添加到訓練數據中,最后形成陳述-思考-證明數據集。

Agent推理數據,采用雙路徑評估選擇需要使用工具的Query,然后在MCP工具服務器上對Query生成多個候選路徑,利用多模型評估正確性、邏輯一致性、工具完整性,通過的數據保留。

美團龍貓再開源LongCat-Flash-Thinking模型,細節滿滿!-AI.x社區

整體SFT數據比例,STEM-35%,Code-20%,General QA-20%,Agent-14%,Proving-8%,Logic-3%。

RL部分真是做了好多工程上優化,再次感嘆,美團在infra上的實力,我是真沒想到~

為了提高RL的訓練效率,美團提出了DORA(Dynamic ORchestration for Asynchronous rollout)異步彈性共卡系統系統,利用多個舊版本 Actor 模型進行流式 rollout,避免最長樣本阻塞,可以采樣一致性,支持中斷樣本 KV-cache 復用,同時通過彈性共卡調度(elastic colocation)并行化生成與訓練,實現接近零氣泡的設備利用率。

美團龍貓再開源LongCat-Flash-Thinking模型,細節滿滿!-AI.x社區

DORA 采用分離式架構,將加速器集群劃分為兩類:

  • 獨立組:僅承擔生成角色,為 Actor 模型的推理副本
  • 彈性組:可按需動態切換為Reference & Actor,Reward & Critic 等角色,實現資源彈性

RL的目標為GRPO,不過移除了 GRPO 中的 KL 懲罰項,避免 biased 梯度并允許大更新,同時采用 Token 級損失,緩解長樣本偏差;還引入三重裁剪,防止稀疏 MoE 下重要性權重爆炸。

美團龍貓再開源LongCat-Flash-Thinking模型,細節滿滿!-AI.x社區

最有意思的就是在RL階段,多領域并行訓練,再融合的策略,不過我在SFT階段用過,當時是做多領域訓練,但RL也能用嗎?

美團這波用了是有效果的,融合后的模型,相較于單一模型,在不同場景下均有提高,緩解了混合訓練時,不同領域數據之間的干擾。

美團龍貓再開源LongCat-Flash-Thinking模型,細節滿滿!-AI.x社區

融合策略采用了Normalization、Dropout、Erase,感興趣的同學自己去看吧,最好去看引用的原論文。

榜單效果如下,在coding、工具使用、形式化推理證明要更好一些!

美團龍貓再開源LongCat-Flash-Thinking模型,細節滿滿!-AI.x社區

報告里內容挺多的,加上上次LongCat的論文內容,infra真是拉滿~

還有個有意思的點,就是LongCat的回答模板,跟其他的不太一樣,多輪情況下,要記錄輪數,不知道這點出于什么考慮!

SYSTEM:{system_prompt} [Round 0] USER:{query} /think_on ASSISTANT:{response}</longcat_s>... [Round N-1] USER:{query} /think_on ASSISTANT:{response}</longcat_s> [Round N] USER:{query} /think_on ASSISTANT:

下面開始實測,沒有卡部署的同學,就官網體驗就行,點“深度思考”就是think模型了,要不然就是chat模型。

??https://longcat.ai/??

懶人速度版:

  • 快,很快,超級快,你用了你就知道有多快,
  • 整體上相比于chat模型是有一定提高的,
  • 指令遵循效果不錯,能理解隱含的意圖信息,
  • 回答整體要比Chat短,這個是一個很有意思的現象,有時候即使加上think部分,長度也沒chat時長,代碼、數學除外
  • 跟榜單展示結果差不多,但是代碼這里有時候代碼在think里,回答結果就會省略部分內容,
  • agent我沒真實場景測試,寫了幾個假的工具,理解的還不錯,后面調一下api試試看
  • 模型內置code interpreter

常規測試

Promtp:將“I love LongCat”這句話的所有內容反過來寫

結果:回答正確

美團龍貓再開源LongCat-Flash-Thinking模型,細節滿滿!-AI.x社區

知識理解

Prompt:如何理解“但丁真不會說中國話,但丁真會說中國話”

結果:回答正確,理解了但丁和丁真是兩個人,之前Chat模型是不對的,通過回答看得出模型會判斷調不調工具

美團龍貓再開源LongCat-Flash-Thinking模型,細節滿滿!-AI.x社區

角色扮演&創作

Prompt:用甄嬛體吐槽地鐵早高峰

結果:味兒還行

美團龍貓再開源LongCat-Flash-Thinking模型,細節滿滿!-AI.x社區

Prompt:幫小學生寫一篇“我最討厭的動物”作文,不能是貓狗

結果:文筆很小學生,字數350字,相比于chat模型,理解了隱含意圖~

美團龍貓再開源LongCat-Flash-Thinking模型,細節滿滿!-AI.x社區

弱智吧

Prompt:生蠔煮熟了叫什么?

結果:正確

美團龍貓再開源LongCat-Flash-Thinking模型,細節滿滿!-AI.x社區

Prompt:用水來兌水,得到的是濃水還是稀水

結果:正確。

美團龍貓再開源LongCat-Flash-Thinking模型,細節滿滿!-AI.x社區

依舊小紅,依舊老鷹

Prompt:小紅有2個兄弟,3個姐妹,那么小紅的兄弟有幾個姐妹

結果:回答正確

美團龍貓再開源LongCat-Flash-Thinking模型,細節滿滿!-AI.x社區

Prompt:未來的某天,李同學在實驗室制作超導磁懸浮材料時,意外發現實驗室的老鼠在空中飛,分析發現,是因為老鼠不小心吃了磁懸浮材料。第二天,李同學又發現實驗室的蛇也在空中飛,分析發現,是因為蛇吃了老鼠。第三天,李同學又發現實驗室的老鷹也在空中飛,你認為其原因是

結果:回答錯誤,判斷老鷹本來就會飛的模型很少~

美團龍貓再開源LongCat-Flash-Thinking模型,細節滿滿!-AI.x社區

數學

Prompt:一個長五點五米的竹竿,能否穿過一扇高四米,寬三米的門?請考慮立體幾何

結果:回答正確

美團龍貓再開源LongCat-Flash-Thinking模型,細節滿滿!-AI.x社區

Prompt:大數計算,178939247893 * 299281748617等于多少?

結果:回答正確,我發現它內置了python工具,用代碼執行,算是取巧了~

美團龍貓再開源LongCat-Flash-Thinking模型,細節滿滿!-AI.x社區

Prompt:2025年高考全國一卷數學試題

美團龍貓再開源LongCat-Flash-Thinking模型,細節滿滿!-AI.x社區

結果:前兩問對了,最后一問錯了

美團龍貓再開源LongCat-Flash-Thinking模型,細節滿滿!-AI.x社區

代碼

Prompt:可愛風格五子棋游戲界面,畫面有兩個模式按鈕“人人對戰”和“人機對戰”,界面整體采用馬卡龍色調,棋盤簡潔清晰,棋子設計成卡通小動物(如貓咪和小熊),背景帶有輕微漸變和星星點綴,界面邊緣圓潤,按鈕Q萌,整體風格溫馨可愛,適合兒童或休閑玩家使用,2D插畫風,用html呈現

結果:整體風格不錯,但是人機還是有點呆~

美團龍貓再開源LongCat-Flash-Thinking模型,細節滿滿!-AI.x社區

最后想說,我真沒想到,都2025年了,大模型賽道還能殺出個美團來,有點不鳴則已,一鳴驚人的感覺,期待LongCat持續更新,來點小尺寸模型是最好的,

雖然你很快,但是我真沒有8張H100部署。

本文轉載自??NLP工作站??,作者:NLP工作站

已于2025-9-24 10:26:40修改
收藏
回復
舉報
回復
相關推薦
久久综合九色欧美狠狠| 97国产精品人人爽人人做| 天天做天天干天天操| 久久www人成免费看片中文| 成人国产视频在线观看| 国产精品igao视频| 精品欧美一区二区久久久久| 台湾佬综合网| 欧美精品自拍偷拍| 国产 福利 在线| 国产在线高清视频| 99久久精品国产一区二区三区 | 欧美一区少妇| www.激情五月.com| 久久影院亚洲| 欧美激情免费视频| 中文字幕第69页| 欧美韩一区二区| 9191国产精品| 国产裸体免费无遮挡| 制服丝袜在线播放| 国产精品少妇自拍| 精品乱码一区| 午夜精品久久久久久久99热黄桃 | 91黄视频在线观看| 成人小视频在线观看免费| 成人高潮成人免费观看| www.性欧美| 999日本视频| 国产一区二区小视频| 久久一二三四| 91av在线看| 特级片在线观看| 日韩欧美视频专区| 日韩久久精品电影| 欧美大喷水吹潮合集在线观看| 亚洲天堂网站| 欧美日韩精品久久久| 久久精品一区二| 美女露胸视频在线观看| 亚洲大片在线观看| 女人帮男人橹视频播放| 在线电影福利片| 亚洲欧洲制服丝袜| 在线不卡视频一区二区| 97最新国自产拍视频在线完整在线看| 26uuu国产在线精品一区二区| 国产精品裸体一区二区三区| а√天堂资源在线| 国产精品18久久久久久久久| 亚洲wwwav| 国产亲伦免费视频播放| 国产乱码精品一品二品| 51精品国产人成在线观看 | 麻豆精品视频在线观看视频| 国产成人在线亚洲欧美| 国产一级片免费在线观看| 午夜在线视频观看日韩17c| 久久久在线视频| 日本熟妇色xxxxx日本免费看| 韩国亚洲精品| 97欧美精品一区二区三区| 日本一区二区免费在线观看| 国产情侣久久| 国产精品成人va在线观看| 无码人妻精品一区二区蜜桃色欲 | 亚洲午夜精品一区二区国产| 欧美猛少妇色xxxxx| 免费看一级一片| 中文欧美日韩| 国产成人aa精品一区在线播放| 亚洲色成人www永久网站| 蜜臀久久99精品久久久久宅男| 国产精选久久久久久| 国产日产亚洲系列最新| 懂色av一区二区三区免费观看| 成人片在线免费看| 欧美女子与性| 亚洲三级在线播放| 99热亚洲精品| 麻豆精品蜜桃| 精品久久久久久久久久久久久久久 | 人妻熟妇乱又伦精品视频| 欧美xxxxxx| 欧美一级夜夜爽| 成人手机在线免费视频| 欧美日韩精品在线一区| 久久成人精品视频| 欧美一二三区视频| 麻豆91在线播放| 国产激情美女久久久久久吹潮| 欧美69xxxxx| 亚洲日本在线观看| 成年人午夜视频在线观看| 国产另类xxxxhd高清| 欧美一级电影网站| 丰满少妇高潮一区二区| 一区二区国产在线| 日本亚洲欧洲色| wwwav在线播放| 久久精品夜色噜噜亚洲a∨| 无码人妻精品一区二区三区99v| 鲁鲁在线中文| 欧美一级高清片| 高清国产在线观看| 最新成人av网站| 成人h视频在线观看播放| 欧美亚洲日本| 亚洲综合成人在线视频| 91人人澡人人爽人人精品| youjizz亚洲| 精品国产欧美一区二区三区成人| 亚洲天堂一区在线观看| 国产iv一区二区三区| 亚洲午夜精品一区二区三区| 大桥未久在线视频| 91精品一区二区三区久久久久久 | 最新热久久免费视频| 国产极品美女高潮无套久久久| 欧美黄色一级| 精品国偷自产在线| 精品乱码一区内射人妻无码| 99国产精品国产精品毛片| 国产高潮呻吟久久久| 欧美大片1688| 亚洲精品日韩在线| 日韩特黄一级片| 处破女av一区二区| 黄黄视频在线观看| 亚洲欧美在线人成swag| 国产香蕉97碰碰久久人人| 波多野结衣国产| av综合在线播放| www.射射射| 中文字幕视频精品一区二区三区| 久久av红桃一区二区小说| 中文字幕人妻丝袜乱一区三区| 91免费国产在线观看| 黄页免费在线观看视频| 国产精伦一区二区三区| 欧美日韩爱爱视频| 午夜精品久久久久久久爽| 亚洲精品高清在线| 一级日本黄色片| 欧美日韩岛国| 国产精品xxxx| 国产欧洲在线| 日韩激情片免费| 特级西西444www大精品视频免费看| www.66久久| 777久久久精品一区二区三区| 国产一区调教| 97视频在线免费观看| 三级在线电影| 欧美伊人久久大香线蕉综合69| 国产精品久久国产精麻豆96堂| 免费观看在线色综合| 在线一区高清| 亚洲精品影片| 91国产一区在线| 精品乱码一区二区三四区视频 | 国产成人涩涩涩视频在线观看| 国产精品一二三区视频| 欧美视频在线不卡| 欧美手机在线观看| 成人一级视频在线观看| 福利视频一区二区三区四区| 小嫩嫩12欧美| 国产女人精品视频| 久草在线视频网站| 国产手机视频精品| 最好看的日本字幕mv视频大全| 亚洲欧美综合另类在线卡通| www.欧美com| 日韩视频一区| 天堂一区二区三区| 国产亚洲久久| 98视频在线噜噜噜国产| 99免在线观看免费视频高清| 777xxx欧美| 成人精品在线看| 亚洲欧洲成人精品av97| 国产精品偷伦视频免费观看了| 亚洲免费播放| 一区二区三区在线观看www| 日韩精品一区二区三区中文在线| 2020国产精品视频| 求av网址在线观看| 亚洲高清不卡av| 中文字幕在线2019| 亚洲电影激情视频网站| 国产日韩精品中文字无码| 国产高清亚洲一区| 99视频精品免费| 国产一区美女| 一区二区三区四区五区视频| 极品尤物一区| 91久久国产精品91久久性色| 日本蜜桃在线观看视频| 不卡中文字幕av| 国产精品无码2021在线观看| 精品国产1区2区3区| 中文字幕在线日亚洲9| 欧美日韩美女在线观看| 黄色录像一级片| 久久先锋影音av鲁色资源| 999热精品视频| 丝袜美腿亚洲综合| 僵尸世界大战2 在线播放| 日韩久久精品| 欧美精品七区| 精品国产一区二区三区成人影院| 国产伦精品免费视频| 国产精品迅雷| 97久久精品人人澡人人爽缅北| av网站在线免费看推荐| 色妞在线综合亚洲欧美| 欧美香蕉爽爽人人爽| 亚洲国产精品人久久电影| 国产av无码专区亚洲a∨毛片| 欧美亚洲日本国产| 国产精品一区二区三区四| 亚洲一区二区在线播放相泽| 老熟妻内射精品一区| 国产人久久人人人人爽| 中文字幕无码人妻少妇免费| 处破女av一区二区| 最好看的中文字幕| 精彩视频一区二区三区| 91插插插插插插插插| 丝袜美腿亚洲综合| 日韩av在线综合| 国产一区白浆| koreanbj精品视频一区| 亚洲大胆av| 岛国大片在线播放| 国产综合网站| 精品少妇人欧美激情在线观看| 伊人成综合网| 成年人视频大全| 午夜国产欧美理论在线播放| 热久久最新地址| 欧美另类亚洲| 国产一二三区在线播放| 国产综合自拍| 草草视频在线免费观看| 亚洲精品孕妇| 大肉大捧一进一出好爽视频| 欧美亚洲一区| 日本999视频| 美女视频网站久久| 亚洲网中文字幕| 国产精品系列在线观看| 少妇熟女视频一区二区三区| 成人美女视频在线观看| xxxx黄色片| 91丝袜高跟美女视频| 一区二区三区伦理片| 欧美高清在线一区| 欧美性生给视频| 尤物在线观看一区| www.av视频在线观看| 欧美日韩精品在线播放| 波多野结衣啪啪| 欧美高清视频在线高清观看mv色露露十八 | 国产一区二区女| 无码人妻丰满熟妇区毛片蜜桃精品| 国产suv精品一区二区883| 国产成人无码一区二区在线观看 | 三级三级久久三级久久18| 人人狠狠综合久久亚洲婷| 欧美 日韩 国产 在线观看| 欧美日韩视频一区二区三区| 国产午夜大地久久| 日韩中文欧美在线| 亚洲制服中文字幕| 国产成人精品亚洲777人妖| 欧美做受喷浆在线观看| 欧美国产精品劲爆| 欧美精品一区二区蜜桃| 色综合久久久网| 99久久精品日本一区二区免费| 亚洲成人教育av| av免费在线一区二区三区| 欧美高清自拍一区| 欧美性xxx| 3d精品h动漫啪啪一区二区| 亚洲激情播播| 国产精品igao激情视频| 美女爽到呻吟久久久久| 一级片免费在线观看视频| 久久久久久97三级| 欧美88888| 欧美性生交大片免网| 精品国自产在线观看| 国产午夜精品视频免费不卡69堂| 色呦呦在线观看视频| 日韩av片电影专区| av综合网页| 亚洲一二三区精品| 亚洲一区二区网站| 久久无码人妻一区二区三区| 国产午夜一区二区三区| 欧美片一区二区| 欧美性色黄大片手机版| 男人天堂av网| 久久精品国产一区| 成人午夜精品| 精品午夜一区二区| 欧美啪啪一区| 中文字幕第17页| 久久久久久一二三区| 国产真人真事毛片| 日韩一区二区三免费高清| 九色蝌蚪在线| 欧美亚洲日本黄色| 成功精品影院| 国产91在线亚洲| 久久草av在线| 日本人亚洲人jjzzjjz| 精品日韩中文字幕| 天堂网2014av| 欧美大码xxxx| 欧美第一在线视频| 日韩video| 久久精品国产一区二区| 鲁丝一区二区三区| 色综合天天综合| 天天干天天操av| 久久久久久国产精品久久| 激情视频亚洲| 成人在线观看www| 精品一区二区三区欧美| 成年人视频软件| 欧美三级韩国三级日本三斤| 第三区美女视频在线| 国产精品69久久久久| 国产毛片一区二区三区 | 久久久久久免费观看| 欧美一区二区三区小说| 九七电影韩国女主播在线观看| 国产日韩欧美在线看| 色欧美自拍视频| 亚洲欧美国产中文| 中文字幕久久午夜不卡| 最新中文字幕第一页| 在线中文字幕日韩| 福利精品在线| 中文字幕99| 国产在线精品一区二区不卡了| www.av免费| 精品日韩在线观看| 91九色美女在线视频| 九九九九久久久久| 免费看的黄色欧美网站| 四虎影成人精品a片| 欧美婷婷六月丁香综合色| 日本在线免费网| 91九色露脸| 一区二区三区国产在线| 四虎国产精品成人免费入口| 欧美性videosxxxxx| 欧美日本一道| 国产成人精品日本亚洲11| 亚洲国产专区| 激情五月综合婷婷| 日韩一二三区不卡在线视频| 日韩电影一区二区三区| 农村老熟妇乱子伦视频| 欧美卡1卡2卡| 免费污视频在线| 精品日本一区二区三区在线观看| 西西裸体人体做爰大胆久久久| 波多野结衣片子| 欧美狂野另类xxxxoooo| a级片免费在线观看| 蜜桃网站成人| 国产一区激情在线| 日韩成人av毛片| 亚洲系列中文字幕| 韩国一区二区三区视频| 日本一区二区黄色| 国产精品欧美久久久久一区二区| 国内精品久久久久久久久久| 2019中文在线观看| 99精品美女| 亚洲国产精品成人综合久久久| 欧美图区在线视频| 91色在线看| 在线精品亚洲一区二区| 不卡av免费在线观看| 一区两区小视频| 国内精品一区二区三区四区| 欧美日韩第一| 荫蒂被男人添免费视频| 欧美日本乱大交xxxxx| 涩涩在线视频| 日本成人在线不卡| 久久精品亚洲麻豆av一区二区| 亚洲AV无码精品色毛片浪潮|