精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大語言模型(LLM)是如何思考的?講講推動下一代人工智能推理的五種途徑 原創(chuàng)

發(fā)布于 2025-4-8 08:14
瀏覽
0收藏

大語言模型(LLMs)最早時期只是具備自動完成的功能,迄今為止,進(jìn)步巨大,與當(dāng)初已經(jīng)不可同日而語。然而,僅僅是生成流暢的文本并不足以體現(xiàn)真正的智能——真正的智能是需要推理能力的。這意味著,大語言模型需要能夠解決數(shù)學(xué)問題、能夠調(diào)試代碼、能夠得出合乎邏輯的結(jié)論,還要能夠檢查和改正自身的錯誤。通常而言,現(xiàn)代大語言模型的訓(xùn)練目標(biāo)往往是預(yù)測下一個詞語是什么,而不是去思考。那么,它們是如何突然變得非常擅長推理的呢?

答案是一系列新技術(shù)使然——從提示工程到代理工具使用——這些技術(shù)推動著、指導(dǎo)著或在一定程度上直接促成著大語言模型日益成為有條不紊的思考者。下面,讓我們講講五種最具有影響力的策略,正是它們,推動著推理型大語言模型不斷邁向新的領(lǐng)域。

1.思維鏈提示:教大語言模型“逐步思考”

提高大型語言模型推理能力,起步最早且最能打的技術(shù)之一異乎尋常地簡單:讓模型解釋自身。

這種方法被稱為思維鏈(Chain-of-Thought,CoT)提示。意指提示模型在給出最終答案之前產(chǎn)生中間推理步驟。例如,不采用直接去問“17乘以24等于多少?”這種簡單直接的方式,而是用“讓我們一步一步地思考”來提示模型,引導(dǎo)它將問題分解為:17×24=(20×17)+(4×17),諸如此類,等等。

這一理念最早于2022年正式提出,至今仍然是基礎(chǔ)性的指導(dǎo)思想。OpenAI的o1模型就被訓(xùn)練為“在回答之前更多地思考”——其本質(zhì)就是內(nèi)化了類似CoT的推理鏈。它的繼任者o3則更進(jìn)一步,以模擬推理的方式,在推理過程中暫停,用以反思和完善自身響應(yīng)。

原理呢,則很簡單:通過強(qiáng)制實(shí)施中間步驟,避免模型草率地、跳躍式地一步得出結(jié)論,從而提升多步推理演繹能力。

2.推理時間計(jì)算擴(kuò)展:給每個問題更多的思考時間

如果一個問題難度很大,那就用更多的時間去思考——人類是會這么做的,現(xiàn)在大語言模型也可以。

推理時間計(jì)算擴(kuò)展,是指通過在生成過程中分配更多的計(jì)算這一途徑,來增強(qiáng)推理能力。模型可能會生成多個推理路徑,但最后會選出最佳路徑。這種“自洽性”方法已成為推理基準(zhǔn)的標(biāo)準(zhǔn)。

OpenAI的o3-mini定義了三種推理程度選項(xiàng)(低、中、高),這些選項(xiàng)決定了模型在回答問題之前內(nèi)部推理的時間長短。在高推理水平下,o3-mini在數(shù)學(xué)和編碼任務(wù)上??的表現(xiàn)甚至優(yōu)于??完整的o1模型。?

2025年的論文《s1:簡單測試時間擴(kuò)展》中引入了一種相關(guān)技術(shù),預(yù)算強(qiáng)制(budget forcing),它使用特殊標(biāo)記來控制推理深度。通過附加重復(fù)的“等待”標(biāo)記,引導(dǎo)模型生成更長的響應(yīng)、自我驗(yàn)證并自我糾正。使用類似“最終答案”這樣的結(jié)束思考信號標(biāo)記何時停止。這種方法在不修改模型權(quán)重的情況下擴(kuò)展推理,從而提高了準(zhǔn)確性——這是對經(jīng)典“逐步思考”提示的現(xiàn)代化升級和改造。

代價也是有的,那就是準(zhǔn)確性的延遲。但是如果是面對棘手或艱巨的任務(wù),這通常是值得的,并且是利大于弊的。

3.強(qiáng)化學(xué)習(xí)和多階段訓(xùn)練:優(yōu)秀推理予以獎勵

另一個改變游戲規(guī)則的因素:不要僅僅局限于預(yù)測單詞,而是要獎勵正確的推理。

OpenAI的o1和DeepSeek-R1這樣的模型是通過強(qiáng)化學(xué)習(xí)(RL)進(jìn)行訓(xùn)練的,以鼓勵優(yōu)秀的推理模式。這些模型不僅僅是模仿數(shù)據(jù),還能夠獎勵生成有邏輯多步答案的推理。DeepSeek-R1的第一個迭代版本R1-Zero僅僅是使用了RL——并沒有監(jiān)督微調(diào)——就開發(fā)出了非常強(qiáng)大的推理能力。

然而,僅僅使用強(qiáng)化學(xué)習(xí)(RL)訓(xùn)練有可能導(dǎo)致語言不穩(wěn)定的問題出現(xiàn)。所以最終DeepSeek-R1采用了多階段訓(xùn)練方法:先進(jìn)行強(qiáng)化學(xué)習(xí)推理,然后使用監(jiān)督微調(diào)來提高可讀性。同樣,阿里巴巴的QwQ-32B將強(qiáng)大的基礎(chǔ)模型和持續(xù)的強(qiáng)化學(xué)習(xí)擴(kuò)展相結(jié)合,在數(shù)學(xué)和代碼方面體現(xiàn)了出色的性能。

結(jié)果如何?這些模型不僅能夠給出正確的答案,還能展示出正確答案是如何得到的——甚至學(xué)會了自我糾正。

4.自我糾正和回溯:推理,然后倒帶

當(dāng)模型出錯時會發(fā)生什么情況?它自己能夠意識到并改正錯誤嗎?

一直以來,大語言模型都在努力進(jìn)行自我糾正,但這方面一直有問題存在。2023 年,研究人員??發(fā)現(xiàn)??,僅僅是簡單地讓模型“再試一次”,對答案鮮有改善——有時甚至?xí)骨闆r變得更糟。但2025年有了新的進(jìn)展,回溯——一種經(jīng)典AI策略,被引入到大語言模型中來。?

騰訊AI實(shí)驗(yàn)室的王姓工程師等人發(fā)現(xiàn),在o1型模型中存在“思考不足”的問題:模型會在不同的想法之間跳躍,而不是一直堅(jiān)持一條推理路線。他們的策略是對推理切換進(jìn)行懲罰,鼓勵對每個想法進(jìn)行深入探索。

與此同時,楊姓工程師等人提出了自回溯——當(dāng)模型陷入僵局時,讓其重新回放,然后探尋更好的替代方案。這一策略與只依賴最優(yōu)推理解決方案的策略相比,準(zhǔn)確率提高了超過四十個百分點(diǎn)。

這些創(chuàng)新有效地增加了推理時的搜索和規(guī)劃能力,呼應(yīng)了深度優(yōu)先搜索等傳統(tǒng)AI方法,并將它們疊加在大語言模型的靈活功能之上。

5.工具的使用以及外部知識的整合:超越模型的推理

有時候,推理意味著知道何時該去尋求幫助。

現(xiàn)代大語言模型越來越多地調(diào)用外部工具——計(jì)算器、代碼解釋器、各種API甚至網(wǎng)絡(luò)搜索——來處理復(fù)雜的查詢。

阿里巴巴的QwQ-32B直接集成了代理功能,使其能夠在推理過程中調(diào)用函數(shù)或訪問API。谷歌的Gemini 2.0(Flash Thinking)也支持類似的功能——例如,它可以在推理過程中啟用代碼執(zhí)行,允許模型在其推理過程中運(yùn)行和評估代碼。

這一點(diǎn)非常重要,原因在于某些任務(wù)——比如驗(yàn)證實(shí)時數(shù)據(jù)、執(zhí)行符號數(shù)學(xué)或執(zhí)行代碼——超出了模型內(nèi)部的能力。將這類子任務(wù)轉(zhuǎn)移出去,能夠讓大語言模型更專注于高階邏輯,從而顯著提高準(zhǔn)確性和可靠性。

從本質(zhì)上講,外部工具能夠讓大語言模型發(fā)揮超出其自身能耐的潛力——就像是一把數(shù)字瑞士軍刀,用精密儀器來擴(kuò)展推理能力。

結(jié)論:推理是一個堆棧,而不是一個開關(guān)

大語言模型并不是一蹴而就就能“學(xué)會推理”——它們是通過一系列分層的技術(shù)來獲取這種能力的。這些技術(shù)包括訓(xùn)練、提示、推理以及與外部世界的互動。思維鏈提示加強(qiáng)了結(jié)構(gòu),推理時間擴(kuò)展增加了深度,強(qiáng)化學(xué)習(xí)(RL)改善了對齊性,回溯增強(qiáng)了自我意識,外部工具使用增加了覆蓋面。

至于像OpenAI的o1和o3、DeepSeek的R1、谷歌的Gemini 2.0 Flash Thinking以及阿里巴巴的QwQ這樣的頂級模型,則結(jié)合了這些策略中的幾種——可以稱之為將巧妙設(shè)計(jì)與認(rèn)知支架融合在一起的混合方案。

隨著該領(lǐng)域的不斷發(fā)展,可以預(yù)見,內(nèi)部推理過程與外部決策工具之間的耦合將會更加緊密。逐步走近我們的,不是僅僅能夠猜測下一個單詞,而是還能夠真正思考的大語言模型。

譯者介紹

張哲剛,51CTO社區(qū)編輯,系統(tǒng)運(yùn)維工程師,國內(nèi)較早一批硬件評測及互聯(lián)網(wǎng)從業(yè)者,曾入職阿里巴巴。

原文標(biāo)題:??How Do LLMs Think? 5 Approaches Powering the Next Generation of AI Reasoning??,作者:Kate Koidan?


?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請注明出處,否則將追究法律責(zé)任
已于2025-4-8 09:33:19修改
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦
欧美日韩喷水| 亚洲国产成人久久综合一区| 五月婷婷一区| 国产精品久久久久精| 艳女tv在线观看国产一区| 日韩三级高清在线| av动漫在线观看| 午夜激情在线观看| 国产精品996| 日韩av电影免费观看高清| 亚洲激情图片网| 国产精品视屏| 欧美日韩在线亚洲一区蜜芽| 99热这里只有精品免费| 韩国精品视频| 高清不卡一区二区| 日韩免费av一区二区| 中文国语毛片高清视频| 国产精品jk白丝蜜臀av小说| 欧美视频在线不卡| 人妻夜夜添夜夜无码av| 黄色视屏免费在线观看| 久久综合丝袜日本网| 成人欧美一区二区三区在线 | 国内自拍欧美| 欧美色涩在线第一页| 国产免费一区二区视频| 888av在线| 91丨九色丨国产丨porny| 7777奇米亚洲综合久久| 超碰在线免费97| 亚洲专区在线| 久久久久国产视频| 成年人一级黄色片| 欧美一区二区三区激情视频| 亚洲国产女人aaa毛片在线| 制服丝袜中文字幕第一页| 一区二区精品伦理...| 一区二区三区在线看| 亚洲一区二区三区涩| 男同在线观看| 91丨九色丨蝌蚪丨老版| 国产精品免费一区二区三区在线观看| 国产精品羞羞答答在线| 蜜臀av国产精品久久久久| 2019亚洲男人天堂| 国产亚洲小视频| 中文字幕一区二区三区在线视频 | 91精品国产综合久久国产大片| av片中文字幕| 欧亚av在线| 亚洲不卡在线观看| 久久av综合网| 超碰97免费在线| 一区二区欧美视频| 欧美极品少妇无套实战| 伊人222成人综合网| 亚洲欧美日韩小说| 日本精品福利视频| 爆操欧美美女| 一区二区三区日韩在线观看| 椎名由奈jux491在线播放| 日本高清在线观看wwwww色| 亚洲国产精品成人综合色在线婷婷| 欧美久久久久久久| 国产在线中文字幕| 欧美激情中文不卡| 伊人久久99| 亚洲图区一区| 亚洲黄色影片| 久久精品在线播放| 青青草手机在线观看| 欧美日韩国产欧| 久久久久久久国产精品视频| 日产欧产va高清| 国产精品久久久一区二区| 欧洲s码亚洲m码精品一区| 手机在线看片1024| 免费成人av在线| 亚洲www在线观看| 成人午夜免费福利| 久久综合av免费| 日韩精品国内| 毛片在线不卡| 午夜影院久久久| 青青在线视频观看| 日韩黄色三级| 精品999久久久| 免费看污片网站| 99久久精品费精品国产| 欧美精品久久久久a| 亚洲日本视频在线观看| 免费在线成人网| 99三级在线| 国产小视频在线观看| 中文字幕色av一区二区三区| 国产真实老熟女无套内射| 中文字幕在线直播| 91精品国产免费| 日韩一级视频在线观看| 99热国内精品永久免费观看| 久久人人爽人人爽人人片av高清| 亚洲中文一区二区| 国产成人高清视频| 日本一区二区三区四区在线观看 | 国产视频一二三四区| 成人综合在线观看| 三级三级久久三级久久18| 色婷婷av在线| 欧美三级在线播放| xxxx黄色片| 91精品在线观看国产| 国产mv免费观看入口亚洲| 精品人妻一区二区三区日产乱码| 久久中文字幕电影| 日韩精品在线中文字幕| 图片一区二区| 国产亚洲精品久久久| 国产在线拍揄自揄拍| 欧美aaaaaa午夜精品| 国产青春久久久国产毛片| 日本福利专区在线观看| 日韩欧美国产激情| 欧美xxxxx少妇| 亚洲天堂一区二区三区四区| 国产成人一区二| 午夜成人免费影院| 亚洲永久精品大片| 亚洲激情在线看| 日本一区二区三区视频| 国产视频亚洲| 国产欧美日韩一级| 久久成人人人人精品欧| 国产偷人爽久久久久久老妇app| 成人白浆超碰人人人人| 少妇高潮流白浆| 激情欧美一区二区三区黑长吊| 亚洲精品国偷自产在线99热| 91大神免费观看| 日本黄色录像片| 国产精品传媒| 欧美成人精品激情在线观看| 中文字幕人妻精品一区| 久久久久久99久久久精品网站| 国产真人做爰毛片视频直播| 亚洲精品一区二区三区中文字幕| 不卡av日日日| 国产又粗又猛又色又| 国产精品视频一区二区三区不卡| avav在线看| 最新国产一区| 日韩免费在线免费观看| 欧美美女色图| 一本久久综合亚洲鲁鲁五月天| 老熟妇精品一区二区三区| 亚洲国产网站| 精品国产一区二区三| 啊啊啊久久久| 亚洲精品在线视频| 97人妻一区二区精品视频| 久久伊99综合婷婷久久伊| 亚洲熟女乱色一区二区三区| 精品视频免费| 成人做爰www免费看视频网站| 国产在线观看av| 日韩欧美高清在线| 奇米影视第四色777| 久久欧美中文字幕| 性猛交ⅹ×××乱大交| 亚洲精品一区二区妖精| www.成人三级视频| 老色鬼在线视频| 一区二区三欧美| 国产日韩精品suv| 香蕉av福利精品导航| 伊人网伊人影院| 精品在线一区二区| bt天堂新版中文在线地址| 欧美日韩一本| 国产精品香蕉在线观看| 欧洲黄色一区| 精品视频中文字幕| 在线免费观看高清视频| 亚洲一区在线免费观看| 欧美一区二区三区成人精品| 毛片av一区二区三区| 国产性生活免费视频| 麻豆一区二区| 国产日韩欧美91| 888av在线视频| 亚洲欧美www| 中文字幕黄色片| 国产精品久久久久9999吃药| 久久久精品人妻一区二区三区| 国产日韩欧美一区二区三区在线观看| 欧美不卡在线一区二区三区| 成人a在线观看高清电影| www国产91| 色久视频在线播放| 欧美日韩免费在线视频| 激情五月婷婷在线| 久久久亚洲欧洲日产国码αv| 亚洲男人天堂2021| 国产午夜精品一区二区三区欧美| 午夜精品亚洲一区二区三区嫩草 | 亚洲 激情 在线| 在线观看免费一区二区| 久久国产精品高清| 日韩国产一二三区| 日韩中文视频免费在线观看| 手机av在线免费观看| 精品婷婷伊人一区三区三| 加勒比av在线播放| 中文字幕精品在线不卡| 亚洲国产果冻传媒av在线观看| 青青国产91久久久久久| 成人小视频在线观看免费| 国产在线观看91一区二区三区| 国产精品一 二 三| 成人国产精选| 午夜精品久久久久久久男人的天堂 | 欧美videofree性高清杂交| 激情五月婷婷网| 亚洲国产综合91精品麻豆| 久久精品国产亚洲av麻豆| 成人精品一区二区三区四区| 欧美性猛交xxx乱久交| 亚洲国产专区校园欧美| 欧美少妇一级片| 99精品视频在线观看播放| 欧美日韩一区二区视频在线 | 欧美一区二区三区四区高清 | 青梅竹马是消防员在线| 欧美一级一区二区| 国产片在线播放| 欧美性色aⅴ视频一区日韩精品| 国产91av视频| 亚洲在线视频免费观看| 免费一级肉体全黄毛片| 国产精品久久久久影视| 亚洲精品国产91| 91蝌蚪porny九色| 亚洲专区区免费| 国产福利不卡视频| 成人亚洲免费视频| 美女视频一区在线观看| 午夜剧场高清版免费观看| 日韩精品一级二级| 精品视频无码一区二区三区| 欧美日韩影院| 拔插拔插海外华人免费| 极品av少妇一区二区| 激情成人开心网| 影音先锋亚洲一区| 国产九色porny| 激情久久久久久| 国产传媒久久久| 99精品久久久| 5月婷婷6月丁香| 国产日韩精品视频一区二区三区 | 欧美一区二区性放荡片| 91精品国产综合久| 91麻豆精品国产91久久久 | 欧美成人有码| 一区二区三区av在线| 久久精品国产大片免费观看| 中文字幕在线乱| 自产国语精品视频| 亚洲黄色网址在线观看| 99精品视频在线观看播放| 欧美另类videosbestsex日本| 国产精品porn| av高清在线免费观看| 亚洲综合国产| 国产成人a亚洲精v品无码| 亚洲一区二区三区免费在线观看| 日韩av一二三四| 久久精品免费看| 亚洲熟女乱综合一区二区| 99国产精品久久久久久久久久久| 国产精品1000部啪视频| 国产午夜三级一区二区三| 欧美福利第一页| 亚洲一区二区在线免费看| 国产手机在线视频| 91激情在线视频| 正在播放亚洲精品| 欧美va日韩va| 五月天激情开心网| 中文字幕在线观看日韩| 性国产高清在线观看| 97婷婷涩涩精品一区| 日韩美女在线看免费观看| 国产欧美韩国高清| 台湾色综合娱乐中文网| 日韩欧美视频一区二区| 欧美在线黄色| 精品999在线| 国产不卡视频在线观看| 日韩在线免费观看av| 最近日韩中文字幕| 日本视频www| 欧美私模裸体表演在线观看| 国产黄色av片| 伊人久久久久久久久久| 性欧美videoshd高清| 国产成人亚洲精品| 激情小说一区| 亚洲欧美在线网| 亚洲国产专区校园欧美| 日本肉体xxxx裸体xxx免费| 99精品欧美一区二区蜜桃免费| 国产综合精品久久久久成人av| 一区二区三区在线观看动漫| 日韩乱码一区二区三区| 欧美大片一区二区| 成人精品一区二区| 久久综合电影一区| 成人在线观看免费播放| 国产伦精品一区二区三区视频黑人| 成人情趣视频网站| 成人在线激情网| 成人中文字幕在线| 色偷偷www8888| 欧美在线小视频| 开心激情综合网| 久久影院免费观看| 在线高清av| 国产欧美在线一区二区| 欧美黄色一区| 中文字幕第100页| 日本一区二区三区视频视频| 免费看日韩毛片| 日韩无一区二区| 久久77777| 国产精品免费观看在线| 牛牛影视一区二区三区免费看| 日韩久久久久久久久久久久| 九色综合狠狠综合久久| 精品人妻无码一区二区三区| 亚洲色图第一区| 国产麻豆免费视频| 中文字幕亚洲欧美在线| 美女18一级毛片一品久道久久综合| 精品产品国产在线不卡| 国产综合色产| 自拍偷拍激情视频| 亚洲国产sm捆绑调教视频| 99精品在线看| 久久综合久久88| 无码国模国产在线观看| 最近中文字幕免费mv| 九九视频精品免费| 青青青手机在线视频| 欧美唯美清纯偷拍| 大片免费播放在线视频| 国产欧美日韩高清| 青青草成人影院| 日韩一区二区三区不卡视频| 中文字幕一区二区三中文字幕| 中日精品一色哟哟| 在线日韩精品视频| 超碰国产精品一区二页| 不卡中文字幕在线| 国产美女av一区二区三区| 精品视频在线观看免费| 国产成人精品三级麻豆| 精品国模在线视频| 少妇愉情理伦三级| 一区二区三区四区国产精品| 精品久久久久中文慕人妻| 精品国内自产拍在线观看| 欧美欧美在线| 国产精品av免费观看| 国产麻豆视频一区二区| 国产香蕉在线视频| 亚洲精品wwww| gay欧美网站| 国产日韩欧美亚洲一区| 亚洲av毛片成人精品| 欧美精品电影免费在线观看| 久久91在线| 尤物av无码色av无码| 欧美激情一区二区在线| 91在线视频国产| 久久99精品视频一区97| 日韩深夜影院| www欧美激情| 一区在线观看免费| 少妇喷水在线观看| 国产精品高清在线| 91亚洲自偷观看高清| 精品国产免费久久久久久婷婷| 午夜av电影一区| 免费在线看a| 好吊色欧美一区二区三区视频| 免费日韩av片| 欧美日韩亚洲国产另类| 日韩精品视频免费在线观看| 欧美男男gaygay1069|