精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

NeurIPS 2025 | 中科大、港中深、通義千問聯合發布CoRT:僅30個樣本教會大模型高效推理,token消耗降低50%

人工智能 新聞
來自中國科學技術大學、香港中文大學(深圳)、通義千問的聯合研究團隊給出了他們的答案:CoRT (Code-Optimized Reasoning Training) —— 一個旨在教會大型語言模型高效利用代碼工具進行推理的后訓練(post-training)框架。

近年來,以 OpenAI-o1、Qwen3、DeepSeek-R1 為代表的大型推理模型(LRMs)在復雜推理任務上取得了驚人進展,它們能夠像人類一樣進行長鏈條的思考、反思和探索。然而,這些模型在面對精確的數學計算時,仍然會「心有余而力不足」,常常出現效率低下甚至算錯的問題。

一個直觀的解決方案,是為模型配備代碼解釋器(Code Interpreter)等計算工具。但這引入了一個更深層次的挑戰,也是當前領域面臨的關鍵瓶頸:

  1. 認知沖突:模型內部基于概率的、模糊的「思考」,與外部工具返回的確定性的、精確的「知識」之間存在沖突,導致模型陷入無意義的反復驗證和「糾結」。
  2. 行為低效:模型傾向于先用自然語言進行冗長的推演,再用代碼驗證,造成「延遲計算」;或者不信任代碼返回的結果,進行不必要的「結果不信任」和手動核算,白白浪費了大量計算資源(tokens)。
  3. 數據稀缺:如何為這種新型的「模型 - 工具」協同推理模式,合成高質量的訓練數據,本身就是一個開放性難題。

那么,如何讓大模型學會「何時」以及「如何」高效地使用工具,將自身的抽象推理能力與工具的精確計算能力完美結合?

來自中國科學技術大學、香港中文大學(深圳)、通義千問的聯合研究團隊給出了他們的答案:CoRT (Code-Optimized Reasoning Training) —— 一個旨在教會大型語言模型高效利用代碼工具進行推理的后訓練(post-training)框架。該框架通過創新的數據合成策略和多階段訓練流程,顯著提升了模型的數學推理能力和效率。

目前,該論文已被 NeurIPS 2025 接收,相關模型和代碼均已開源。

  • 論文鏈接:https://arxiv.org/abs/2510.20342
  • 項目倉庫:https://github.com/ChengpengLi1003/CoRT

方法核心:從「數據冷啟動」到「智能體調優」的三步走

CoRT 框架的核心思想是,通過高質量的數據和精細化的訓練,重塑模型與工具的交互模式,使其從低效的「驗證」思維轉向高效的「計算」思維。

1.Hint-Engineering (提示工程):數據冷啟動的藝術

  • 挑戰:高質量的「模型 - 工具」交互數據極度稀缺。簡單地提示模型使用代碼,會產生大量冗長、低效的推理軌跡。
  • 核心思路:研究團隊首次提出了一種名為「提示工程」(Hint-Engineering) 的全新數據合成策略。其核心是在推理路徑的關鍵決策點,策略性地注入引導性提示,從而糾正模型的低效行為。

a.當模型試圖手動進行復雜計算時,注入提示:「這看起來很繁瑣,我們可以用 python 代碼來簡化推理」,引導其立即計算。

b.當模型得到代碼結果后試圖手動驗證時,注入提示:「我們不需要懷疑 python 計算的準確性」,打消其結果不信任。

  • 效果:遵循「數據質量遠重于數量」的原則,團隊僅手動標注了 30 個高質量樣本,就為后續訓練奠定了堅實基礎。這種方法生成的推理軌跡不僅正確,而且極其簡短高效。

2.多階段訓練流程:精細化能力塑造

在高質量數據的基礎上,CoRT 設計了一套包含 SFT、RFT 和 RL 的完整訓練管線:

  • 監督微調 (SFT):使用 30 個「提示工程」樣本進行初步微調,讓模型快速學習到高效交互的基本模式。
  • 拒絕采樣微調 (RFT):讓初步微調后的模型生成大量解答,并自動過濾掉錯誤的、或存在「延遲計算」「結果不信任」等不良行為的軌跡,只保留優質軌跡用于進一步訓練,強化模型的「好品味」。
  • 強化學習 (RL):將模型視為一個智能體 (Agent),將代碼解釋器視為環境 (Environment)。通過精心設計的獎勵函數(同時獎勵最終答案的準確性和代碼執行的成功率),讓模型在與環境的交互中,通過試錯自主學習最優的工具使用策略。這一步極大地提升了模型的穩定性和上限,尤其對于小尺寸模型效果顯著。

實驗結果:性能與效率的雙重飛躍

CoRT 框架在 5 個極具挑戰性的數學推理基準上進行了全面評估,結果證明了其卓越的性能。

  • 性能顯著提升:在同等規模的開源模型基礎上,CoRT 為 DeepSeek-R1-32B 帶來了 4% 的絕對精度提升,為 1.5B 模型帶來了高達 8% 的絕對提升,效果媲美乃至超越了許多依賴更多數據訓練的模型。
  • 效率革命性優化:與純自然語言推理的基線模型相比,CoRT 將 32B 模型的 token 消耗降低了約 30%,1.5B 模型更是降低了驚人的 50%。這意味著用一半的計算成本,就能達到更高的準確率。
  • 重塑代碼使用行為:分析顯示,傳統方法促使模型將代碼主要用于「驗證」(占比 68.2%),而 CoRT 成功地將模型行為轉變為以「計算」為核心(占比 51.1%),從根本上提升了推理效率。
  • 強大的泛化能力:在完全沒見過的化學問題(OOD)測試中,CoRT 訓練的模型不僅性能更優,還能自發地發現并使用一個從未在訓練中出現過的專業工具庫(RDKit),使用率高達 81.3%,展現了真正的智能涌現。

意義與展望

CoRT 框架的提出,為解決大型語言模型在精確推理領域的短板提供了一條高樣本效率、高計算效率的全新路徑。

它證明了,通過精巧的數據設計和先進的智能體強化學習框架,我們不僅能教會模型「使用」工具,更能教會它們「高效、智能」地 與工具協作。

這項工作展示了構建更強大、更可靠、更經濟的 AI 智能體系統的巨大潛力,為 AI 在科學發現、教育輔助、工程設計等需要精確推理的領域的落地應用,掃清了一大障礙。未來,將此框架擴展到更多樣化的工具和更復雜的任務場景,將是該方向激動人心的研究路徑。

作者介紹

核心作者:

  • 唐正陽,香港中文大學(深圳)博士生,參與了 Qwen3 模型的開發,提出了 MathScale、ORLM 等代表性工作。
  • 李成鵬,中國科學技術大學博士生,參與了 Qwen2.5、QwQ、Qwen3 等模型的開發,提出了 Mugglemath, START 等代表性工作。
  • 李子牛,香港中文大學(深圳)博士生,提出了 ReMax、Knapsack RL 等代表性工作。
責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-10-27 09:15:00

2023-10-30 15:06:00

模型數據

2024-06-17 07:10:00

2023-12-04 13:23:00

數據訓練

2025-06-05 11:49:21

AI模型數據

2025-06-10 09:07:00

2025-03-03 08:00:00

小紅書AI圖像檢測模型AI

2025-03-19 09:10:00

2025-09-15 03:00:00

2025-09-01 08:51:00

2024-07-10 12:38:22

2025-05-08 09:10:30

2024-12-02 10:40:00

AI模型

2024-09-18 11:00:00

AI工具數據

2024-04-07 09:00:00

數據模型

2023-04-07 14:01:18

ChatGPT人工智能

2025-08-28 09:09:00

AI強化學習模型

2024-01-26 16:33:00

2024-01-15 13:11:22

模型數據
點贊
收藏

51CTO技術棧公眾號

日韩在线 中文字幕| 三级在线视频观看| 亚洲欧美另类一区| 亚洲国产综合在线看不卡| 亚洲精品一区二区三区99| 国产亚洲黄色片| 欧美成人综合在线| 蜜臀av在线播放一区二区三区| 日韩在线观看你懂的| 国产老头和老头xxxx×| 久久黄色美女电影| 九一九一国产精品| 久久91精品国产| 丰满少妇一区二区三区| 久久久成人av毛片免费观看| 91麻豆成人久久精品二区三区| 日韩暖暖在线视频| 青青青在线免费观看| 欧美jizz19性欧美| 欧美性受xxxx黑人xyx性爽| 在线观看欧美亚洲| 天天干天天做天天操| 丝袜亚洲另类欧美| 超碰97人人做人人爱少妇| 私密视频在线观看| 亚洲综合资源| 亚洲自拍与偷拍| 日韩欧美一区二区三区四区五区| 国产又大又黄的视频| 国产精品久久久免费| 精品国产欧美一区二区五十路 | 91精品论坛| 亚洲欧洲精品一区二区三区不卡| 极品日韩久久| 精品国产亚洲一区二区麻豆| 日韩av高清在线观看| 国内精品一区二区三区四区| 国产盗摄一区二区三区在线| jiujiure精品视频播放| 亚洲乱亚洲乱妇无码| 国产香蕉精品视频| 日本99精品| 91麻豆精品国产91| 久久综合伊人77777麻豆最新章节| sm久久捆绑调教精品一区| 亚洲女人的天堂| 一区二区三区在线视频111| 免费在线毛片| 久久夜色精品一区| 久久视频在线观看中文字幕| 人人妻人人澡人人爽精品日本| 国产精品一二三四| 91在线视频精品| 999久久久久| 国产在线观看一区二区| 91亚洲精品在线| 伊人久久成人网| 日本不卡一二三区黄网| 国产精品久久久久秋霞鲁丝| 波多野结衣绝顶大高潮| 天堂在线亚洲视频| 国产精品黄色av| 天天干天天操天天爱| 老**午夜毛片一区二区三区 | 亚洲中文字幕无码一区二区三区| 欧美18一19xxx性| 成人欧美一区二区三区黑人麻豆| 中文字幕一区二区三区四区五区六区| 91福利在线视频| 中文字幕中文字幕一区| 久久久成人精品一区二区三区| 国产精品实拍| 亚洲成人av一区| 成人午夜视频免费在线观看| 欧洲精品一区二区三区| 欧美日韩一卡二卡| 国产精品久久久久久久99| 日韩精品一区二区三区中文| 亚洲国产欧美一区二区三区久久| 精品国产av色一区二区深夜久久 | 久久午夜无码鲁丝片午夜精品| 激情综合自拍| 日本亚洲欧美三级| 亚洲av综合一区| 国产一区二区三区不卡在线观看| 亚洲一区亚洲二区| 天天操天天射天天| 日本一区二区免费在线| 国产激情在线看| 麻豆理论在线观看| 欧美日韩精品是欧美日韩精品| 91亚洲一区二区| 猫咪成人在线观看| 日韩在线激情视频| 粉嫩aⅴ一区二区三区| 日韩av一区二| 国产精品免费一区二区三区| 黄色的视频在线免费观看| 亚洲色图欧洲色图婷婷| 成人在线观看你懂的| 成人自拍视频网| 亚洲成人精品在线| 成人影视免费观看| 911精品美国片911久久久| 69影院欧美专区视频| 一本到在线视频| 99国产精品久| 先锋影音男人资源| 在线成人av观看| 日韩欧美二区三区| 永久免费毛片在线观看| 影院欧美亚洲| 国产在线日韩在线| 日韩欧美在线番号| 亚洲一区中文在线| 中文字幕成人免费视频| 午夜欧洲一区| 久久久久久久久久久免费 | 都市激情亚洲一区| 欧美成人精品1314www| 林心如三级全黄裸体| 性欧美xxxx大乳国产app| 91成人免费观看| 91精彩在线视频| 欧美性20hd另类| 免费黄视频在线观看| 日韩国产专区| 日韩美女在线播放| 亚洲色偷精品一区二区三区| 一区二区三区在线免费观看| 一区二区三区 欧美| 亚洲免费毛片| 97香蕉久久超级碰碰高清版| 亚洲精品一区二区三区区别| 成人免费在线播放视频| 婷婷激情四射五月天| 亚洲另类av| 欧美专区第一页| 深爱激情五月婷婷| 樱花草国产18久久久久| 中文字幕第22页| 91精品观看| 成人性生交大片免费看小说 | 欧美激情三级免费| 精品国产无码AV| 一区二区三区在线高清| 国产又粗又猛大又黄又爽| 婷婷亚洲最大| 成人亲热视频网站| 国产激情视频在线观看| 欧美精品久久天天躁| 超碰人人干人人| 美日韩一区二区三区| 亚洲国产精品视频一区| 成人国产一区| 精品国偷自产在线| 99久久精品无免国产免费| 中文字幕一区二区不卡| 九九九九九伊人| 亚洲综合自拍| 999国产视频| 久草成色在线| 亚洲精品乱码久久久久久金桔影视| 日本熟女一区二区| 91美女片黄在线| 国产视频一区二区三区在线播放 | 国产精品免费看久久久无码| av日韩精品| 2019中文字幕在线| 国产三级在线看| 欧美日韩午夜在线视频| avtt天堂在线| 91亚洲精品久久久蜜桃| 好男人www社区| 97精品国产| 99精品国产高清一区二区| 国产精品xx| 在线观看欧美日韩国产| 精品国产无码一区二区| 欧美日韩亚洲一区二区| 992在线观看| 成人亚洲一区二区一| 日韩视频第二页| 91久久电影| 久久国产精品一区二区三区四区| 日韩av电影资源网| 欧美高跟鞋交xxxxhd| 国产在线一二| 日韩欧美一级二级三级久久久| 97久久久久久久| 综合中文字幕亚洲| theav精尽人亡av| 极品美女销魂一区二区三区| 日本丰满少妇xxxx| 91一区在线| 欧美精品尤物在线| 欧洲精品99毛片免费高清观看 | 欧洲亚洲精品| 97超视频免费观看| 黄色片网站在线| 国产视频亚洲视频| a级片在线播放| 日本韩国一区二区三区| 国产在线一区视频| 成人欧美一区二区三区小说| 亚洲av无码一区二区二三区| 国产麻豆一精品一av一免费 | 欧美在线三区| 美女黄毛**国产精品啪啪| 日本欧美不卡| 久久久91精品| 色综合888| 日韩一区二区三| 午夜久久久久久久久久影院| 亚洲福利一区二区| 手机看片国产日韩| 99视频一区二区| 国产精品欧美性爱| 老鸭窝一区二区久久精品| 日本www在线视频| 欧美在线1区| 天天爱天天做天天操| 免费不卡中文字幕在线| 国产91色在线|亚洲| 国产精品久久免费视频| 国产99在线|中文| 国内小视频在线看| 久久色在线播放| 一级毛片视频在线| 亚洲美女视频网站| 日韩一级在线播放| 精品久久久久一区| 国产三级视频在线播放| 欧美性做爰猛烈叫床潮| 手机在线免费看毛片| 亚洲国产精品精华液ab| 性色av蜜臀av色欲av| 日韩在线一二三区| 国产成人久久婷婷精品流白浆| 欧美日本久久| 国产精品夜夜夜爽张柏芝| 你懂的一区二区三区| 久久99久久精品国产| 久久久久97| 国产偷国产偷亚洲高清97cao| 高清一区二区中文字幕| 国产精品美女主播| 涩涩涩久久久成人精品| 国产精品福利网站| 日韩天堂在线| 国产日韩精品电影| 2019年精品视频自拍| 日韩av电影手机在线观看| 色香欲www7777综合网| 欧美多人乱p欧美4p久久| 18视频在线观看| 精品国产网站地址| 免费在线观看黄色网| 久久国产精品久久久| 秋霞午夜在线观看| 久久精品国产亚洲7777| 黄网址在线观看| 欧美精品在线免费| 黄页网站在线观看免费| 91精品国产色综合久久不卡98口 | 国产精品理伦片| 欧美精品久久久久久久久46p| 成人免费在线播放视频| 国产探花在线视频| 亚洲午夜久久久| 国产中文字幕免费| 激情亚洲一区二区三区四区| 波多野结衣激情视频| 欧美三级乱人伦电影| 91久久久久国产一区二区| 精品av综合导航| 天堂а√在线8种子蜜桃视频| 亚洲欧美资源在线| 国产中文在线| 欧美激情亚洲另类| 欧美日韩国产观看视频| 久久久久久91| 最新日韩一区| 亚洲一二三区在线观看| 国产精品21p| 欧美日韩国产高清一区二区三区 | 亚洲国产欧美一区二区三区同亚洲| 男人天堂一区二区| 中文字幕亚洲激情| 日本三级在线观看网站| 国产91精品高潮白浆喷水| 日韩在线你懂得| 国产精品久久九九| 国产成人影院| 成年人网站国产| japanese国产精品| 日韩一区二区高清视频| 欧美日韩成人| 自拍偷拍21p| 高清成人在线观看| 2一3sex性hd| 亚洲蜜臀av乱码久久精品| 国产精品久久久免费视频| 欧美无砖专区一中文字| 色婷婷av一区二区三区之红樱桃 | 欧美午夜xxx| 999久久久久久| 亚洲欧美中文日韩v在线观看| 777电影在线观看| 91av在线免费观看| 91精品国产一区二区在线观看| 国产综合18久久久久久| 中文字幕免费一区二区| 国产激情在线观看视频| 国产精品一区二区在线播放| 极品蜜桃臀肥臀-x88av| 亚洲国产毛片aaaaa无费看 | 在线看一区二区| 成人毛片在线免费观看| 色偷偷av亚洲男人的天堂| 热三久草你在线| 国产视频观看一区| 竹菊久久久久久久| 久久手机在线视频| 国产一区二区视频在线播放| 国产成人精品无码免费看夜聊软件| 亚洲精品菠萝久久久久久久| 一级黄色片免费| 亚洲人成网站在线播| 啊啊啊久久久| 国产欧美一区二区三区不卡高清| 91精品秘密在线观看| 无码少妇一区二区三区芒果| 久久综合五月天婷婷伊人| 久青草免费视频| 日韩一二三区不卡| 在线免费av导航| 国产精品尤物福利片在线观看| 色天天色综合| 美女av免费在线观看| 国产福利一区二区三区视频| 日韩一卡二卡在线观看| 精品视频免费看| 福利小视频在线观看| 日本高清不卡在线| 色综合综合色| 久久婷婷国产精品| 99re亚洲国产精品| 偷偷操不一样的久久| 亚洲国产中文字幕久久网 | 欧美伦理影院| 污色网站在线观看| 国产女主播一区| 在线观看视频二区| 麻豆成人在线看| 精品三级久久久| 可以在线看黄的网站| 国产91在线观看丝袜| 国产在线视频99| 亚洲色在线视频| 国产精品字幕| 色爱区成人综合网| 国产呦精品一区二区三区网站| 免费在线黄色网| 精品黑人一区二区三区久久| 99riav视频在线观看| 久久99精品久久久久子伦| 青青国产91久久久久久| 天天干天天操天天拍| 欧美日韩一级二级三级| 羞羞电影在线观看www| 高清视频一区二区三区| 日韩一区二区免费看| 亚洲图片另类小说| 欧美日韩国产综合一区二区三区 | av中文字幕不卡| 日韩精品久久久久久久酒店| 亚洲色图国产精品| 国产精品诱惑| 欧美美女黄色网| 国产亚洲欧美在线| 91在线精品入口| 欧美成人免费va影院高清| 欧美人体视频| 国产高潮免费视频| 亚洲成人在线网站| 免费av在线电影| 91久久精品在线| 亚洲欧美日韩在线观看a三区| 午夜在线观看一区| 日韩欧美成人一区二区| 高清在线视频不卡| 视频一区二区综合| 成人av网址在线观看| 黄色污污视频软件| 久久精品国产一区二区电影| 蜜桃成人av| 黑人巨大猛交丰满少妇| 91黄色免费版| 欧美寡妇性猛交xxx免费|