精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大語言模型(LLM)是如何思考的?講講推動下一代人工智能推理的五種途徑

譯文 精選
人工智能
大語言模型需要能夠解決數學問題、能夠調試代碼、能夠得出合乎邏輯的結論,還要能夠檢查和改正自身的錯誤。通常而言,現代大語言模型的訓練目標往往是預測下一個詞語是什么,而不是去思考。那么,它們是如何突然變得非常擅長推理的呢??

譯者 | 張哲剛

審校 | 重樓

大語言模型(LLMs)最早時期只是具備自動完成的功能迄今為止,進步巨大,與當初已經不可同日而語。然而,僅僅是生成流暢的文本并不足以體現真正的智能——真正的智能需要推理能力。這意味著大語言模型需要能夠解決數學問題、能夠調試代碼、能夠得出合乎邏輯的結論,還要能夠檢查和改正自身的錯誤。通常而言,現代大語言模型的訓練目標往往是預測下一個詞語是什么,而不是思考。那么,它們是如何突然變得非常擅長推理的呢?

答案一系列新技術使然——從提示工程到代理工具使用——這些技術推動、指導在一定程度上直接促成著大語言模型日益成為有條不紊的思考者。下面,讓我們講講五種最具影響力的策略,正是它們推動著推理型大語言模型不斷邁向新的領域。

1.思維鏈提示:教大語言模型“逐步思考”

提高大型語言模型推理能力起步最早且最能打的技術之一異乎尋常地簡單:讓模型解釋自身。

這種方法被稱為思維鏈(Chain-of-Thought,CoT)提示。意指提示模型在給出最終答案之前產生中間推理步驟。例如,不采用直接去問“17乘以24等于多少?”這種簡單直接的方式,而是用“讓我們一步一步地思考”來提示模型,引導它將問題分解:17×24=(20×17)+(4×17),諸如此類,等等。

這一理念最早2022年正式提出,至今仍然是基礎性的指導思想。OpenAI的o1模型被訓練“在回答之前更多地思考”——本質就是內化了類似CoT的推理鏈。它的繼任者o3更進一步,模擬推理的方式,在推理過程中暫停,以反思和完善自身響應。

原理呢,則很簡單:通過強制實施中間步驟,避免模型草率地、跳躍式地一步得出結論,從而提升多步推理演繹能力。

2.推理時間計算擴展:每個問題更多思考時間

如果一個問題難度很大,那就更多的時間思考——人類會這么做,現在大語言模型也可以。

推理時間計算擴展,是指通過在生成過程中分配更多計算這一途徑,來增強推理能力。模型可能會生成多個推理路徑,最后會選出最佳路徑。這種“自洽性”方法已成為推理基準的標準。

OpenAI的o3-mini定義了三種推理程度選項(低、中、高),這些選項決定了模型在回答問題之前內部推理的時間長短。在高推理水平下,o3-mini在數學和編碼任務上的表現甚至優于完整的o1模型。

2025年的論文s1:簡單測試時間擴展中引入了一種相關技術,預算強制(budget forcing),它使用特殊標記來控制推理深度。通過附加重復的“等待”標記,引導模型生成更長的響應、自我驗證并自我糾正。使用類似“最終答案”這樣的結束思考信號標記何時停止。這種方法在不修改模型權重的情況下擴展推理,從而提高準確性——這是對經典“逐步思考”提示的現代升級和改造。

代價有的,那就是準確性的延遲。但是如果是面對棘手或艱巨的任務,這通常是值得的,并且是利大于弊的。

3.強化學習和多階段訓練:優秀推理予以獎勵

另一個改變游戲規則的因素:不要僅僅局限于預測單詞,而是獎勵正確的推理。

OpenAI的o1和DeepSeek-R1這樣的模型是通過強化學習(RL)進行訓練的,以鼓勵優秀的推理模式。這些模型不僅僅是模仿數據,還能夠獎勵生成有邏輯多步答案的推理。DeepSeek-R1的第一個迭代版本R1-Zero僅僅是使用了RL——沒有監督微調——就開發出了非常強大推理能力。

然而,僅僅使用強化學習(RL)訓練有可能導致語言不穩定的問題出現所以最終DeepSeek-R1采用了多階段訓練方法:先進行強化學習推理,然后使用監督微調提高可讀性。同樣,阿里巴巴的QwQ-32B強大的基礎模型和持續的強化學習擴展相結合,在數學和代碼方面體現了出色的性能。

結果如何?這些模型不僅能夠給出正確的答案,展示出正確答案是如何得到的——甚至學會自我糾正。

4.自我糾正和回溯:推理,然后倒帶

當模型出錯時會發生什么情況?它自己能夠意識到并改正錯誤嗎?

一直以來,大語言模型都在努力進行自我糾正,但這方面一直有問題存在。2023 年,研究人員發現,僅僅是簡單地讓模型“再試一次”,對答案鮮有改善——有時甚至會使情況變得更糟。但2025年有了新的進展,回溯——一種經典AI策略被引入到大語言模型中來。

騰訊AI實驗室的王姓工程師等人發現,在o1模型中存在“思考不足”的問題:模型會在不同的想法之間跳躍而不是一直堅持一條推理線。他們策略推理切換進行懲罰,鼓勵對每個想法進行深入探索。

與此同時,楊姓工程師等人提出了自回溯——當模型陷入僵局時,讓其重新回放,然后探尋更好的替代方案。這一策略依賴最優推理解決方案的策略相比,準確率提高了超過四十個百分點。

這些創新有效地增加了推理時的搜索和規劃能力呼應了深度優先搜索等傳統AI方法,并將它們疊加在大語言模型的靈活功能之上。

5.工具使用以及外部知識整合:超越模型的推理

有時候,推理意味著知道何時該去尋求幫助。

現代大語言模型越來越多地調用外部工具——計算器、代碼解釋器、各種API甚至網絡搜索——來處理復雜的查詢。

阿里巴巴的QwQ-32B直接集成了代理功能,使其能夠在推理過程中調用函數或訪問API。谷歌的Gemini 2.0(Flash Thinking)支持類似的功能——例如,它可以在推理過程中啟用代碼執行,允許模型在其推理過程中運行和評估代碼。

這一點非常重要,原因在于某些任務——比如驗證實時數據、執行符號數學或執行代碼——超出了模型內部的能力。將這類子任務轉移出去,能夠讓大語言模型專注于高階邏輯,從而顯著提高準確性和可靠性。

從本質上講,外部工具能夠讓大語言模型發揮超出其自身能耐的潛力——就像一把數字瑞士軍刀,用精密儀器擴展推理能力。

結論:推理是一個堆棧,不是一個開關

大語言模型并不是一蹴而就就能“學會推理”——它們通過一系列分層的技術來獲取這種能力的。這些技術包括訓練、提示、推理以及與外部世界的互動。思維鏈提示加強了結構,推理時間擴展增加了深度強化學習(RL)改善了對齊,回溯增強了自我意識,外部工具使用增加了覆蓋面。

至于像OpenAI的o1和o3、DeepSeek的R1、谷歌的Gemini 2.0 Flash Thinking以及阿里巴巴的QwQ這樣的頂級模型,結合了這些策略中的幾種——可以稱之為將巧妙設計與認知支架融合在一起的混合方案。

隨著該領域的不斷發展,可以預見,內部推理過程與外部決策工具之間的耦合將會更加緊密。逐步走近我們的,不是僅僅能夠猜測下一個單詞,而是還能夠真正思考的大語言模型。

譯者介紹

張哲剛,51CTO社區編輯,系統運維工程師,國內較早一批硬件評測及互聯網從業者,曾入職阿里巴巴。

原文標題:How Do LLMs Think? 5 Approaches Powering the Next Generation of AI Reasoning,作者:Kate Koidan

責任編輯:姜華 來源: 51CTO內容精選
相關推薦

2021-04-01 15:30:35

人工智能

2020-10-30 14:31:26

人工智能

2020-10-30 14:07:27

人工智能

2022-08-11 10:11:39

人工智能疾病診斷

2023-09-14 10:15:53

人工智能

2018-06-14 09:55:37

高校人工智能教育部

2023-03-21 14:30:47

2024-04-19 10:02:17

2018-11-21 16:00:24

2019-01-21 09:39:26

人工智能AI互聯網

2023-09-28 13:08:22

2020-08-07 18:22:14

人工智能AI標準體系

2024-07-10 08:12:34

2020-10-27 10:10:39

人工智能機器學習技術

2021-12-02 22:38:29

人臉識別人工智能傳感技術

2022-02-23 17:51:45

無人機人工智能

2013-08-27 13:52:32

鮑爾默微軟

2010-09-27 08:10:22

JVMScalaGroovy

2023-09-07 15:05:57

人工智能音頻助手

2024-03-07 16:19:52

人工智能AI聊天機器人
點贊
收藏

51CTO技術棧公眾號

久久久这里只有精品视频| 亚洲国产精品麻豆| 成人福利视频在线观看| tube国产麻豆| 99久久免费精品国产72精品九九| 亚洲国产精品久久久男人的天堂| 欧美国产综合视频| 91亚洲欧美激情| 欧美区亚洲区| 亚洲欧美制服第一页| 在线观看国产福利| 超碰在线公开| 亚洲婷婷在线视频| 狠狠色狠狠色综合人人| 亚洲性生活大片| 亚洲大胆在线| www.日韩av.com| 人人妻人人澡人人爽人人精品| 国产一区二区色噜噜| 亚洲韩国一区二区三区| 精品国产乱码久久久| 美女视频免费一区| 久久久久久综合网天天| 欧美激情一级欧美精品| 六十路息与子猛烈交尾| 欧洲精品久久久久毛片完整版| 亚洲一级二级三级| 伊人久久av导航| 日韩有码电影| 国产高清不卡二三区| 国产精品第1页| xxxx 国产| 天天综合网91| 中文字幕在线观看亚洲| 亚洲成人网在线播放| 中文字幕一区二区三区四区久久 | 久久综合av免费| 亚洲影院高清在线| 一级片免费观看视频| 亚洲欧美清纯在线制服| 国内免费精品永久在线视频| 国产精品成人69xxx免费视频| 欧美美乳视频| 亚洲免费电影在线观看| 黄色性生活一级片| 精品精品精品| 欧美精品一区二区在线播放| 99热这里只有精品2| 日本在线一区二区| 欧美性猛交xxxx| 国产精品裸体瑜伽视频| 久草成色在线| 亚洲国产精品久久不卡毛片 | 国产精品日本欧美一区二区三区| 欧美激情视频在线| 久久久久香蕉视频| 国内精品美女在线观看| 欧美极品xxxx| 日韩aaaaaa| 亚洲一区二区伦理| 国产suv精品一区二区| 91视频免费网址| 久久精品盗摄| 国产精品久久久久久久久久三级 | 欧美一级高清大全免费观看| 天天操精品视频| 午夜精品在线| 亚洲韩国日本中文字幕| 成人影视免费观看| 国产成人a v| 亚洲区国产区| 3344国产精品免费看| 天天操中文字幕| 日韩精品三区四区| 成人午夜激情网| 性猛交富婆╳xxx乱大交天津| 国产ts人妖一区二区| 国产成人免费观看| 日韩av资源站| 国产精品久久久久久福利一牛影视 | 2020国产精品久久精品美国| 欧美日韩国产高清视频| 在线看免费av| 一区二区三区**美女毛片| 免费拍拍拍网站| 一本大道色婷婷在线| 在线观看网站黄不卡| 精品国产鲁一鲁一区二区三区| 亚洲天堂中文字幕在线观看| 亚洲成人激情在线观看| 在线观看福利片| 99久久99热这里只有精品| 欧美激情2020午夜免费观看| 国产精品男女视频| 久99久精品视频免费观看| 动漫美女被爆操久久久| 国产理论电影在线观看| 一区二区高清在线| 日韩精品无码一区二区三区免费| 欧美综合影院| 亚洲精品在线不卡| 成年人av电影| 日韩黄色免费网站| 国产日本一区二区三区| a天堂在线资源| 亚洲成人动漫一区| 色呦色呦色精品| 亚洲人成网站77777在线观看| 久久久国产成人精品| 韩国av中文字幕| 国产自产2019最新不卡| 欧美男人的天堂| 欧美videos另类精品| 欧美亚一区二区| 午夜久久久久久久| 欧美激情视频一区二区三区在线播放| 欧美有码在线视频| 亚洲av综合色区无码一二三区 | 日韩电影中文字幕在线观看| 中文字幕美女视频| 日韩av网站在线观看| 国产三级精品在线不卡| 99福利在线| 欧美日韩激情一区二区| 波多野结衣福利| 99精品国产福利在线观看免费| 91九色国产社区在线观看| 国产高清一区在线观看| 精品久久久久久久大神国产| 国产裸体视频网站| 国产精品99一区二区三| 国产成人精品综合久久久| 隣の若妻さん波多野结衣| 亚洲少妇30p| 日本人69视频| 欧美xxxxx视频| 国产精品美乳在线观看| 国产免费av高清在线| 一本到不卡免费一区二区| 成人在线视频免费播放| 一区二区亚洲精品| 国产精品久久久久久久久久久久午夜片 | 中文字幕亚洲一区| 中国一级特黄视频| 久久久精品国产免大香伊| 国产精品333| 精品网站aaa| 午夜一区不卡| 伊人成人网在线看| 欧美精品午夜视频| 国产欧美一区二区三区在线看| 丰满少妇一级片| 亚洲精品欧美激情| 伊人五月天婷婷| 五月激情久久久| 久久久久久久久久久网站| 国产艳妇疯狂做爰视频| 亚洲成人二区| 92看片淫黄大片看国产片| 麻豆91在线| 在线不卡一区二区| 免费国产羞羞网站美图| 国产乱码字幕精品高清av| 亚洲黄色免费在线观看| 毛片在线导航| 精品国产91洋老外米糕| 久久久久久福利| 成人h动漫精品| 免费av观看网址| 一个色免费成人影院| 国产成人高清激情视频在线观看 | 欧美人在线视频| www.中文字幕av| 三级不卡在线观看| 亚洲自拍三区| 国产一区二区久久久久| 欧美国产视频一区二区| 日韩一级片免费看| 福利一区福利二区微拍刺激| 色哟哟精品观看| 天堂资源在线中文| 欧美网站一区二区| 成人免费黄色小视频| 成人中文字幕合集| 久章草在线视频| 亚洲va在线| 精品国产乱码久久久久久88av | 亚洲欧美黄色片| 欧美性猛交视频| 亚洲女人久久久| 99久久精品国产导航| 国产一级做a爰片久久| 欧美一区二区三区免费看| 好吊色欧美一区二区三区| 日本在线精品| 久久男人的天堂| 性开放的欧美大片| 亚洲第一福利网站| 亚洲一区中文字幕在线| 亚洲va欧美va国产va天堂影院| 国产黄片一区二区三区| 国产麻豆精品在线观看| 黑森林福利视频导航| 午夜精品久久99蜜桃的功能介绍| 蜜桃精品久久久久久久免费影院| 国产美女视频一区二区| 国产乱子伦视频一区二区三区| 免费看黄色a级片| 国产成人精品一区二区免费看京| 亚洲综合色激情五月| 欧美电影h版| 久久久久久久999精品视频| av成人手机在线| 亚洲护士老师的毛茸茸最新章节| 国产裸体永久免费无遮挡| 欧美性猛交xxxx免费看漫画 | 黄色成人在线免费| 日本裸体美女视频| 久久精品视频网| 女同性恋一区二区三区| 国产精品原创巨作av| 日本免费观看网站| 国产精品毛片在线看| 国产乱淫av片杨贵妃| 91精品高清| 永久免费精品视频网站| blacked蜜桃精品一区| 精品在线视频一区二区三区| 日韩一区二区三区高清在线观看| 国产精品免费久久久久影院| 在线免费三级电影网站| 97精品久久久中文字幕免费| 午夜av在线免费观看| 久久久精品视频成人| 色哟哟免费在线观看| 日韩在线精品一区| 日本免费中文字幕在线| 在线观看国产精品91| 欧美成人免费| 亚洲欧洲第一视频| 精品欧美不卡一区二区在线观看| 日韩精品中文字| 青青久在线视频| 亚洲乱亚洲乱妇无码| 天堂在线观看av| 日韩电影中文字幕av| 偷拍精品一区二区三区| 日韩电影第一页| 加勒比一区二区三区在线| 风流少妇一区二区| 日本午夜精品一区二区| 人人精品视频| 久久伦理网站| 综合亚洲色图| 欧美精品七区| 国产成人手机高清在线观看网站| 欧美日本国产精品| 精品国产一区探花在线观看| 视频一区视频二区视频三区视频四区国产 | 欧美性色综合网| 在线观看日韩一区二区| 在线播放中文一区| 精品欧美一区二区精品少妇| 精品欧美黑人一区二区三区| 少妇荡乳情欲办公室456视频| 亚洲国产高潮在线观看| 青青操视频在线| xxxxx91麻豆| 亚洲在线观看一区| 欧美三级精品| 国产日产亚洲精品| 天堂久久av| 欧美国产一区二区在线| 日韩成人激情| 久久天天东北熟女毛茸茸| 国产综合婷婷| 无码人妻丰满熟妇区五十路百度| 蜜桃一区二区三区四区| 原创真实夫妻啪啪av| www.av亚洲| 懂色av粉嫩av浪潮av| 亚洲自拍另类综合| 日本久久综合网| 欧美精品 国产精品| 色一情一乱一乱一区91av| 亚洲美女黄色片| 成人免费看片| 热99在线视频| 日韩三级av高清片| 欧美一区二区三区精美影视| 久久久9色精品国产一区二区三区| 波多野结衣与黑人| 日韩成人午夜电影| 国产午夜在线一区二区三区| 久久久蜜桃精品| 五月婷婷一区二区| 欧美在线免费观看亚洲| 亚洲国产www| 在线午夜精品自拍| 涩涩涩在线视频| 亚洲伊人第一页| 波多野结衣在线观看一区二区三区| 国产精品视频二| 另类欧美日韩国产在线| 无码人妻精品一区二区三区温州| 亚洲私人影院在线观看| av片免费观看| 亚洲精品久久久一区二区三区| 日本成a人片在线观看| 69视频在线播放| 香蕉大人久久国产成人av| 亚洲国产综合自拍| 亚洲综合社区| 婷婷五月精品中文字幕| 亚洲欧洲国产专区| 性高潮视频在线观看| 日韩成人高清在线| 国产三线在线| 亚洲一区二区三| 日韩欧美网址| 亚洲这里只有精品| 久久众筹精品私拍模特| 久久久久久久中文字幕| 欧美一区二区女人| 免费在线看黄网站| 国产精品视频26uuu| 一本色道久久综合狠狠躁的番外| 2018日日夜夜| 成人激情av网| 国产精品7777| 精品国产免费人成电影在线观看四季 | 国产精久久一区二区| 性高潮久久久久久久久| 日韩—二三区免费观看av| 日韩av一二区| 欧美性jizz18性欧美| 天天爱天天干天天操| 久久久久久久久91| a看欧美黄色女同性恋| 日本男女交配视频| 国产不卡视频一区二区三区| 国产福利视频网站| 911精品国产一区二区在线| 亚洲天天影视| 91视频8mav| 亚洲国产精品成人| 中文字幕第10页| 亚洲午夜在线电影| 特级丰满少妇一级aaaa爱毛片| 国语自产精品视频在免费| 成人搞黄视频| 免费在线观看的av网站| xfplay精品久久| 久久国产乱子伦精品| 亚洲天堂影视av| 免费成人高清在线视频| 亚洲免费av网| 国产成人h网站| 久久久久久久久久影院| 亚洲裸体xxxx| 巨大黑人极品videos精品| 成人在线观看www| 国产成人免费视频| 日本道在线观看| 中文字幕亚洲图片| 综合激情五月婷婷| 欧美 日韩精品| 国产精品不卡在线| 高h放荡受浪受bl| 乱码第一页成人| 亚洲激情 欧美| 欧美性色xo影院| 欧美午夜电影一区二区三区| 亚洲一区二区三区xxx视频| 国产美女网站视频| 欧美久久久久免费| 黑人极品ⅴideos精品欧美棵| 久久99精品久久久久久久青青日本| 欧美一级久久| 国产色无码精品视频国产| 亚洲精品wwwww| 亚洲福利影视| 欧美二区在线视频| 国产精品久久夜| 姝姝窝人体www聚色窝| 国产精品扒开腿爽爽爽视频| 亚洲综合小说| 国产色视频一区二区三区qq号| 欧美日韩国产综合久久 | 国产一区二区三区四区| 国产精品久久久久久久99| 亚洲成国产人片在线观看| 成年在线电影| 国产区一区二区三区| 精品综合免费视频观看| 国产69精品久久久久久久久久| 色99之美女主播在线视频| 国产精品色在线网站| 三级av免费观看| 欧美日韩在线观看视频|