精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

ReTool:AI工具使用的突破性進展,推理能力顯著提升

發(fā)布于 2025-4-22 06:38
瀏覽
0收藏

?1、AI終于學(xué)會了"工欲善其事,必先利其器"

ReTool:AI工具使用的突破性進展,推理能力顯著提升-AI.x社區(qū)圖片

你有沒有這樣的經(jīng)歷:面對復(fù)雜計算題,純靠腦力計算往往容易出錯,而借助計算器或編程工具卻能事半功倍?

人類在解決問題時懂得適時借助工具,而AI呢?當(dāng)前的大型語言模型(LLM)雖然在純文本推理方面表現(xiàn)出色,但在涉及精確計算、符號操作等領(lǐng)域,它們往往捉襟見肘。為何不讓AI也學(xué)會"工欲善其事,必先利其器"的智慧?

論文提出了一種創(chuàng)新方法,通過強化學(xué)習(xí)讓AI自主掌握何時、如何使用代碼解釋器(Code Interpreter)這一強大工具,顯著提升了模型在數(shù)學(xué)奧賽級別難題上的解題能力,甚至超越了OpenAI的頂尖模型!

2、ReTool:讓AI學(xué)會使用工具的方法

ReTool:AI工具使用的突破性進展,推理能力顯著提升-AI.x社區(qū)圖片

傳統(tǒng)上,研究人員通常通過有監(jiān)督微調(diào)(SFT)來教會AI使用工具,這相當(dāng)于給AI看例子讓它模仿。然而,這種方法存在明顯局限性——AI只會機械復(fù)制已見過的模式,難以靈活應(yīng)對多變的問題場景。

ReTool開創(chuàng)性地將強化學(xué)習(xí)(RL)引入工具使用訓(xùn)練,讓AI通過不斷嘗試、犯錯、修正來自主發(fā)現(xiàn)最佳工具使用策略。這一方法包含兩個關(guān)鍵創(chuàng)新:

(1)代碼執(zhí)行的動態(tài)交織:在推理過程中,AI可以隨時編寫代碼并獲取實時執(zhí)行結(jié)果,將這些信息無縫融入后續(xù)推理。這就像人類在解題過程中隨時拿起計算器進行驗證,然后繼續(xù)思考一樣自然。

(2)基于結(jié)果反饋的自動化強化學(xué)習(xí):系統(tǒng)根據(jù)最終答案正確與否給予獎勵,引導(dǎo)AI探索何時以及如何最有效地使用代碼解釋器。這種方法無需人工規(guī)定工具使用規(guī)則,而是讓AI自主發(fā)現(xiàn)最優(yōu)策略。

具體來說,ReTool的訓(xùn)練流程分為兩個階段:

(1)冷啟動階段:首先構(gòu)建高質(zhì)量的初始數(shù)據(jù)集,展示如何在推理過程中適時調(diào)用代碼解釋器。這相當(dāng)于給AI打基礎(chǔ),教會它基本的工具使用方法。

(2)強化學(xué)習(xí)階段:AI通過與代碼沙盒環(huán)境交互,嘗試不同的工具使用策略。系統(tǒng)僅根據(jù)最終答案正確與否給予簡單反饋(正確+1分,錯誤-1分),讓AI自主探索最優(yōu)工具使用模式。

3、驚人的實驗結(jié)果:數(shù)學(xué)奧賽水平大幅提升

ReTool:AI工具使用的突破性進展,推理能力顯著提升-AI.x社區(qū)圖片

研究團隊在美國數(shù)學(xué)邀請賽(AIME)這一高難度數(shù)學(xué)奧賽基準(zhǔn)測試上評估了ReTool的性能,結(jié)果令人振奮:    

(1)基于Qwen2.5-32B-Instruct的ReTool在AIME2024上達(dá)到了67.0%的準(zhǔn)確率,僅用了400步訓(xùn)練,大幅超越了基于相同模型但僅使用文本推理的強化學(xué)習(xí)基線(40.0%準(zhǔn)確率,用了1080步訓(xùn)練)。

(2)當(dāng)使用更強大的DeepSeek-R1-Distill-Qwen-32B作為基礎(chǔ)模型時,ReTool更是達(dá)到了72.5%的準(zhǔn)確率,遠(yuǎn)超OpenAI的o1-preview模型整整27.9個百分點!

這些結(jié)果清晰地表明,教會AI策略性地使用工具不僅能突破純文本推理的天花板,還能大幅提升訓(xùn)練效率。即使在冷啟動階段,ReTool基于Qwen2.5-32B-Instruct的模型就已達(dá)到40.9%的準(zhǔn)確率,與純文本強化學(xué)習(xí)方法相當(dāng),且大幅領(lǐng)先未經(jīng)訓(xùn)練的基礎(chǔ)模型(26.7%)。

ReTool:AI工具使用的突破性進展,推理能力顯著提升-AI.x社區(qū)圖片

4、"啊哈時刻":AI的工具使用能力自主進化

ReTool:AI工具使用的突破性進展,推理能力顯著提升-AI.x社區(qū)圖片

研究者對ReTool在強化學(xué)習(xí)過程中的行為進行了深入分析,發(fā)現(xiàn)了一系列令人著迷的現(xiàn)象:

(1)回答長度減少約40%:訓(xùn)練后的模型回答長度從平均約10k減少到6k,表明代碼輔助推理能夠更高效地解決問題。這就像專業(yè)人士用專業(yè)工具,往往比業(yè)余者用原始方法更簡潔高效。

(2)代碼使用能力顯著增強:

  • 包含代碼的回答比例穩(wěn)步上升,最終覆蓋近98%的問題
  • 平均代碼行數(shù)增長5倍,表明模型掌握了更復(fù)雜的代碼策略
  • 測試集上正確代碼總數(shù)從1k增至5k

(3)代碼調(diào)用時機前移:隨著訓(xùn)練進行,模型傾向于更早地在推理過程中調(diào)用代碼,表明它學(xué)會了更戰(zhàn)略性地規(guī)劃工具使用時機。    

最令人驚訝的是,模型展現(xiàn)出了代碼自我糾錯的能力。在沒有專門訓(xùn)練的情況下,模型能夠識別執(zhí)行失敗的代碼,理解錯誤原因,并生成修正版本!這種"啊哈時刻"標(biāo)志著AI自主掌握了適應(yīng)性工具使用能力,展現(xiàn)出元認(rèn)知能力的萌芽。

研究者還發(fā)現(xiàn),訓(xùn)練后的模型代碼用途變得更加多樣化,不僅能進行基本計算和驗證,還能執(zhí)行更復(fù)雜的任務(wù),這進一步增強了它在各類問題上的泛化能力。

5、解題案例:工具輔助vs純文本推理

ReTool:AI工具使用的突破性進展,推理能力顯著提升-AI.x社區(qū)圖片

論文中展示了一個生動的對比案例:同一個問題,經(jīng)ReTool訓(xùn)練的模型使用簡潔代碼替代了繁瑣的文本計算過程,不僅保證了計算準(zhǔn)確性,還能讓模型將更多注意力集中在整體解題策略上。這正如熟練的工程師知道何時使用計算器或編程工具,而不是陷入冗長的手算過程。

ReTool的成功不僅是在數(shù)學(xué)問題上的突破,更揭示了一條AI能力提升的新路徑——通過強化學(xué)習(xí)教會AI靈活運用外部工具。這種方法讓人想起人類智能的關(guān)鍵特征:不是單純依靠內(nèi)部知識和推理,而是善于識別何時以及如何利用外部工具來擴展自身能力邊界。

這項研究也為未來AI系統(tǒng)設(shè)計提供了重要啟示:與其努力將所有能力內(nèi)置于模型參數(shù)中,不如設(shè)計能夠靈活調(diào)用專業(yè)工具的架構(gòu)。就像專業(yè)人士依靠工具箱中的專用工具解決復(fù)雜問題,未來的AI可能會依靠一系列專門工具來處理各種任務(wù)。    

隨著ReTool這類技術(shù)的發(fā)展,我們或許很快就能看到更加智能的AI助手,它們不再局限于生成文本,而是能夠自主判斷何時調(diào)用計算、編程、繪圖等工具來解決實際問題,真正實現(xiàn)"AI+工具"的協(xié)同增強效應(yīng)。

你認(rèn)為未來的AI將如何進一步發(fā)展工具使用能力?歡迎在評論區(qū)分享你的觀點!

論文標(biāo)題:ReTool: Reinforcement Learning for Strategic Tool Use in LLMs 

論文鏈接https://arxiv.org/abs/2504.11536 

本文轉(zhuǎn)載自?????AI帝國?????,作者:無影寺

標(biāo)簽
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦
日本一本不卡| 日本午夜大片a在线观看| 久久99国产精品免费| 不卡中文字幕av| 精品伦一区二区三区| 美女扒开腿让男人桶爽久久软| 久久综合视频网| 国产精品视频一区国模私拍| 亚洲女同二女同志奶水| 9l亚洲国产成人精品一区二三| 懂色av影视一区二区三区| 欧美二区三区| 国产理论片在线观看| 99综合视频| 久久久精品一区| 国产精品1000部啪视频| 欧美经典一区| 色av综合在线| 国产真人做爰毛片视频直播| 国产高清av在线| 丁香桃色午夜亚洲一区二区三区| 国产精品久久久av久久久| 国产无遮挡免费视频| 久久久久国产| 亚洲天堂久久av| 在线播放第一页| www.成人| 欧美午夜寂寞影院| 无码人妻精品一区二区三区在线| 成人日日夜夜| 国产精品色婷婷| 免费成人在线观看av| 国精产品一品二品国精品69xx | 色婷婷av一区二区三区软件| 国产激情一区二区三区在线观看| 中国一级片黄色一级片黄| 亚洲小说区图片区| 久久艹在线视频| 影音先锋男人看片资源| 国产成人一区| 日韩精品在线免费观看| 欧类av怡春院| 精品国产一区二区三区成人影院| 欧美一区二区三区在线电影| 亚洲 欧美 日韩系列| 快播电影网址老女人久久| 天天av天天翘天天综合网 | 91亚洲精选| 久久久五月婷婷| 欧美极品一区二区| 性感美女一级片| 成人夜色视频网站在线观看| 亚洲va电影大全| 精品国产亚洲AV| 国产精品一区二区久久精品爱涩 | 国产91精品入| 精品国产伦一区二区三区免费 | 久久精品夜夜夜夜夜久久| 精品亚洲aⅴ无码一区二区三区| 亚洲精品国产setv| 国产午夜精品视频| www.黄色com| 91精品国产91久久久久久密臀| 色青青草原桃花久久综合| 亚洲不卡的av| 91超碰成人| 欧美乱妇高清无乱码| 精品无码一区二区三区电影桃花| 亚洲黄色大片| 日本一区二区三区在线播放| 波多野结衣 久久| 蜜桃久久精品一区二区| 成人精品一区二区三区| 亚洲乱色熟女一区二区三区| 成人美女视频在线观看18| 精品一区在线播放| 1024视频在线| 亚洲乱码中文字幕| 亚洲中文字幕无码av永久| 一区二区三区四区日本视频| 91九色最新地址| 中日韩av在线播放| 精品人妻无码一区二区三区| 欧美精品密入口播放| 亚洲欧美在线一区二区| 亚洲欧美另类日本| 在线日韩欧美| 国产精品日韩欧美综合| 国产口爆吞精一区二区| 99久久伊人精品| 亚洲一二区在线| 国产区美女在线| 色久综合一二码| 亚洲国产欧美91| 杨幂一区二区三区免费看视频| 最近中文字幕日韩精品 | 综合久久久久| 91av视频在线播放| 一本色道久久综合亚洲| www.欧美色图| 在线观看一区二区三区三州| ririsao久久精品一区| 欧美亚洲国产一区在线观看网站| 国偷自产av一区二区三区麻豆| 日本福利一区| 久久91亚洲精品中文字幕| 九九精品免费视频| 国产米奇在线777精品观看| 精品国产乱码久久久久久108| 国产在线不卡一区| 在线观看亚洲区| 欧美人妻精品一区二区三区 | 欧美疯狂性受xxxxx另类| 国产视频1区2区| 国产成人av电影| 亚洲国产精品123| 国产高清自产拍av在线| 欧美一区二区啪啪| www色com| 免费欧美日韩| 懂色av一区二区三区在线播放| av在线播放网| 五月综合激情婷婷六月色窝| 国产又粗又长又爽又黄的视频| 久久不见久久见国语| 国产做受高潮69| aaa一区二区三区| 国产精品日产欧美久久久久| 欧洲av无码放荡人妇网站| 在线精品国产亚洲| 久久精品国产2020观看福利| 国产一卡二卡三卡| 91蝌蚪porny| 国产精品后入内射日本在线观看| 亚洲一区二区免费在线观看| 久久躁狠狠躁夜夜爽| 亚洲综合一区中| 国产精品美女久久久久aⅴ | 精品无码免费视频| 国产成人综合网| 欧美一级黄色录像片| 欧美综合社区国产| 在线一区二区日韩| 最新中文字幕第一页| 久久久久久久久久久久久女国产乱| 国产素人在线观看| 免费福利视频一区| 69影院欧美专区视频| 少妇精品视频一区二区| 舔着乳尖日韩一区| 37p粉嫩大胆色噜噜噜| 夜久久久久久| 久久综合婷婷综合| 精品国产第一福利网站| 亚洲性av在线| 一卡二卡在线观看| 亚洲日本丝袜连裤袜办公室| 亚洲第一成肉网| 欧美成人嫩草网站| 成人片在线免费看| 国产伦久视频在线观看| 亚洲欧美日韩精品久久| www.亚洲激情| 中文字幕一区二区三区不卡 | 国产午夜久久久久| 日本熟妇人妻中出| 91av精品| 国精产品一区二区| 欧美国产大片| 日韩中文字幕在线观看| 国内精品国产成人国产三级| 亚洲国产成人porn| 一级黄色片大全| 蜜臀av一区二区在线免费观看| 综合操久久久| jizz性欧美2| 国产成人精品a视频一区www| 91ph在线| 欧美精品一区二区三区久久久| 国语对白永久免费| 国产精品美女久久久久久久网站| 男生和女生一起差差差视频| 亚洲美女少妇无套啪啪呻吟| 日本不卡久久| 日韩av综合| 日本免费久久高清视频| 黄a在线观看| 亚洲精品国产美女| 一级成人免费视频| 午夜精品成人在线视频| 日韩福利在线视频| 成人精品鲁一区一区二区| 国产视频一区二区三区在线播放| 亚洲精品网址| 欧美亚洲免费高清在线观看| 成人在线精品| 欧美孕妇孕交黑巨大网站| 免费大片黄在线观看视频网站| 亚洲国产精品电影在线观看| 最近中文在线观看| 精品国产91久久久久久老师| 26uuu成人网| 久久综合久久99| 欧美污在线观看| 日韩va欧美va亚洲va久久| www国产无套内射com| 精品国产一区二区三区久久久蜜臀| 5566av亚洲| 精品123区| 亚洲3p在线观看| www.欧美日本韩国| 中文字幕亚洲欧美| 五月婷婷激情在线| 欧美一区二区视频在线观看2022| 波多野结衣黄色网址| 亚洲成av人片www| 欧美激情图片小说| 国产精品视频看| 中文字幕国产专区| 成人av在线影院| 91极品尤物在线播放国产| av成人毛片| 欧美日韩福利在线| 午夜精品剧场| 一级全黄肉体裸体全过程| 九九久久婷婷| 欧美日韩大片一区二区三区| 精品国产乱子伦一区二区| 91福利入口| 高清不卡一区| 成人免费自拍视频| 青草综合视频| 91精品久久久久久久久久久久久久| 免费看av不卡| 日本成熟性欧美| 色网在线免费观看| 欧美有码在线观看| 91吃瓜在线观看| 国内精品伊人久久| 欧美videos另类精品| 欧美片一区二区三区| 日本动漫同人动漫在线观看| 欧美激情欧美激情在线五月| 中文字幕免费高清电视剧网站在线观看| 中文国产成人精品| 在线观看a视频| 中文字幕亚洲二区| 免费在线看a| 久久这里有精品| 69xxx在线| 久久久久国产视频| 欧美亚洲日本精品| 日本精品视频网站| 最新日韩一区| 成人激情视频在线播放| 精品一区二区三区亚洲| 91入口在线观看| 成人高潮视频| 精品国产乱码久久久久久88av| 欧美绝顶高潮抽搐喷水合集| 免费看成人片| japanese国产精品| 欧美与动交zoz0z| 国产精品v亚洲精品v日韩精品 | 中文字幕亚洲欧美| 国产黄色小视频在线| 久久99久国产精品黄毛片入口| 国产黄大片在线观看| 日本一本a高清免费不卡| 黄页免费欧美| 国产精品二区在线观看| 亚洲三级性片| 亚洲午夜精品国产| 欧美激情亚洲| 国产免费毛卡片| 蜜桃视频在线一区| 亚洲av午夜精品一区二区三区| 99精品偷自拍| youjizz亚洲女人| 亚洲一区二区三区四区五区黄| 99超碰在线观看| 9191成人精品久久| 无码精品人妻一区二区三区影院| 一区二区亚洲欧洲国产日韩| 伊人福利在线| 日韩av手机在线看| 亚洲五码在线| 亚洲精品无人区| 99成人在线| 亚洲综合av在线播放| 91丝袜美腿高跟国产极品老师| 欧美激情精品久久久久久免费 | 99久久国产综合精品五月天喷水| 久久一日本道色综合久久| 热久久久久久久久| 99国产精品久久久久久久久久久| 美女网站视频色| 岛国av午夜精品| av男人天堂av| 一本色道久久综合亚洲精品小说 | 国产二区三区在线| 国产91在线播放精品91| 亚洲一区二区免费在线观看| 天天爽天天狠久久久| 亚洲视频成人| 操人视频免费看| 国产欧美一区二区精品忘忧草| 激情综合五月网| 欧美绝品在线观看成人午夜影视| 天堂在线中文字幕| 欧美黑人巨大精品一区二区| 精品福利在线| 色狠狠久久av五月综合| 一本综合精品| 奇米777第四色| 夜夜嗨av一区二区三区四季av| 一区精品在线观看| 亚洲精品影视在线观看| 国产色婷婷在线| 99视频国产精品免费观看| 国产精品99视频| 成人性生生活性生交12| 91一区一区三区| 欧美日韩偷拍视频| 欧美丰满少妇xxxxx高潮对白| 国产在线观看高清视频| 热久久99这里有精品| 欧美交a欧美精品喷水| 欧美精品卡一卡二| 国产激情视频一区二区三区欧美 | 这里只有精品视频在线观看| 国产福利电影在线| 日韩美女视频在线观看| 亚洲人挤奶视频| 久久综合色视频| 久久综合九色综合欧美就去吻| 国产第100页| 亚洲国产成人一区| 欧美久久天堂| 茄子视频成人在线观看 | 亚洲永久网站| 亚洲国产精品无码久久久久高潮| 亚洲成人免费影院| 人妻丰满熟妇av无码区hd| 久久免费精品视频| jazzjazz国产精品麻豆| 亚洲 自拍 另类小说综合图区| 成人av网站免费| 日韩精品视频播放| 亚洲精品在线观看www| 午夜日韩成人影院| 亚洲精品免费在线看| 久久se精品一区二区| 欧美h片在线观看| 日韩一区二区三| 678在线观看视频| 欧美日韩最好看的视频| 石原莉奈在线亚洲二区| 999久久久国产| 欧美一区二区久久| 欧美hdxxx| 久久综合给合久久狠狠色| 久久蜜桃精品| 91香蕉国产视频| 精品日产卡一卡二卡麻豆| 交100部在线观看| 快播亚洲色图| 久久精品国产精品亚洲精品| 老女人性淫交视频| 精品国产乱码久久久久久蜜臀 | 欧美色图亚洲激情| 欧美在线你懂得| caopo在线| 精品欧美一区二区三区久久久| 天堂精品中文字幕在线| 懂色av粉嫩av蜜臀av一区二区三区| 欧美一三区三区四区免费在线看| 日韩电影免费观看| 欧美日韩在线一二三| 精品一区二区三区免费毛片爱| 久久网免费视频| 亚洲毛片在线看| 国产色99精品9i| 久久9精品区-无套内射无码| 国产精品成人午夜| 日本黄色三级视频| 国产精品视频自在线| 亚洲黄色在线| 日韩av片在线免费观看| 亚洲国产天堂久久综合| 久久人体av| 人妻久久久一区二区三区| 中文字幕av一区二区三区| 亚洲女同志亚洲女同女播放| 国产精品jvid在线观看蜜臀 | 97人洗澡人人免费公开视频碰碰碰| 日韩美女精品| 91精产国品一二三| 欧美图区在线视频| 美女搞黄视频在线观看|