精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

o1推理框架最新成果:斯坦福&伯克利提出元鏈式思維,升級模型推理能力

人工智能 新聞
在最新的一篇長達100頁的論文中,他們將o1模型背后的推理機制提煉成了一個通用的框架——元鏈式思維(Meta-CoT)。

o1背后的推理原理,斯坦福和伯克利幫我們總結好了!

在最新的一篇長達100頁的論文中,他們將o1模型背后的推理機制提煉成了一個通用的框架——元鏈式思維(Meta-CoT)

圖片

這個元鏈式思維(Meta-CoT)到底是什么意思呢?

簡單來說,它可以讓模型在推理過程中反思推理任務——

這樣不僅能得出結論,它還可以幫助我們找到更多新的研究思路和方法

比如在經典的24點問題中,傳統的CoT雖然也能得出正確的結論,但是Meta-CoT在推理過程中不止會關注輸入的問題,而是在推理過程中思考更多的子問題并進行嘗試

圖片

這也是o1模型可以在HARP等數學基準中大幅領先的原因:

圖片

SynthLabs公司的CEO Nathan Lile還自信地表示:

元鏈式思維(Meta-CoT)是通往超級智能(Superintelligence)的正確道路。下一波人工智能就是元鏈式思維(Meta-CoT)循環。

圖片

元鏈式思維(Meta-CoT)框架

為什么傳統CoT不管用了

在提出新框架之前,我們先要理解一個問題:為什么傳統模型經常在高級推理任務中“卡殼”。

其實啊,主要原因在于大語言模型的預訓練和指令調整語料庫數據中,不包含真實數據生成過程

以數學問題為例,網上和教科書中雖有會有解答,但對于錯誤的論證方法為何失效,卻很少有相關的資料,

如此一來,在遇到復雜推理問題時,被中間環節困住的模型就很難調整到正確的思考方向。

而在全新的高中奧數水平數學基準測試中,OpenAI的o1模型系列表現出眾,不僅遠超以往的模型,而且問題越難優勢越明顯。

圖片

從生成tokens數量看,其他大語言模型生成的解決方案長度與人類相近,這也就是說明,它們只是在搜索匹配訓練數據。

而o1模型在簡單問題上生成的tokens數與人類相當,在高難度問題上,生成tokens數則大幅增加,與傳統模型拉開差距。

這表明o1模型的CoT覆蓋范圍更廣,能更好地接近真實數據生成過程。

圖片

Meta-CoT的主要思想

我們先來看一道2011年國際數學奧林匹克競賽的 “風車問題”:

平面上有至少兩個點的有限集合,假設任意三點不共線,從過其中一點的直線開始,讓直線繞該點順時針旋轉,碰到集合中另一點時,新點成為旋轉軸繼續旋轉,此過程無限持續。能否選一個點和過該點的直線,讓集合中每個點都無限次成為旋轉軸呢?

圖片

官方給出的解答如下:

圖片
圖片

這道題的解答雖然很簡短,不依賴先驗知識,但卻是競賽中最難的題之一,600 多名參賽者中只有少數人答對。

主要難點在于,它的解答過程不是線性的。很多人會選擇用凸包構造或哈密頓圖論方法,最終都會失敗。

而答對的人主要是依靠大量幾何探索和歸納推理,才最終找到了答案。

也就是說,這個解答過程不是從左到右按部就班生成的。

從潛在變量過程角度看,經典思維鏈是對潛在推理鏈進行邊緣化,得出最終答案的概率。

但對于復雜問題,真實解答生成過程應該是解答的聯合概率分布,取決于潛在生成過程

這就是團隊所說的元思維鏈(Meta - CoT)過程,使用這個思路,就可以大大提升大語言模型在復雜問題上的推理能力。

內部化搜索過程

Meta-CoT的一個重要步驟是,在面對高級推理問題時,大語言模型會努力提高搜索的效率

以前模型通常會使用Best-of-N方法,也就是獨立生成多個完整答案,然后挑出最好的,但這個方法比較耗時。

在Meta-CoT中,研究人員把推理過程想象成一個“步步走”的游戲,也就是馬爾可夫決策過程(MDP)

圖片

在這個過程里,他們還引入一個過程獎勵模型(PRM),它可以用來評估中間步驟能能否得出正確答案。

如果發現某個解答方向沒希望,模型就會盡快停下,回到可能成功的中間狀態,重新尋找解決方案。

這種樹搜索方法在簡單推理任務里已經顯出明顯的優勢,在實際應用中也有成功案例。

論文的主要作者之一Rafael Rafailov是斯坦福畢業的博士,也參加過很多數學競賽,他表示這個新的搜索過程和他自己解答題目時的狀態也是一樣的:

評估解決方案的潛在方法、修剪沒有取得進展的方向、探索其他可能的分支主張、嘗試根據直覺構建通往最終目標的路徑

圖片

合成元鏈式思維

另外一個挑戰在于,大模型通常會使用強化學習方法從過去經驗里學習好的推理策略,但當遇到新領域的推理問題時,用傳統RL訓練出來的策略就不太好用了。

為了提高大模型解決不熟悉領域問題的能力,研究人員嘗試在Meta-CoT中讓大模型把推理過程當成一場“冒險游戲”,也就是部分可觀測馬爾可夫決策過程(POMDP),非常適合用來升級模型。

在這個過程中,模型可以根據不同情況調整策略。

以下圖中的迷宮游戲為例,模型一開始可以隨意行走,但慢慢地,通過將不同的頂點加入到路徑數據集或刪除數據集中,就會逐漸找到正確的方向。

圖片

而且,通過過程監督,模型能及時得到反饋,知道自己是否走在正確的解答道路上。

圖片

研究人員還發現,讓模型主動探索不同的推理路徑,能大大提升它的表現。在實驗里,模型會努力嘗試各種方法,結果在解決復雜問題時,答對的概率也提高了很多。

論文還探討了通過搜索算法(如下圖中的蒙特卡羅樹搜索(MCTS)和A*搜索)生成合成訓練數據的更多方法,這些方法可以幫助模型在上下文中學習并執行復雜的搜索策略。

圖片

圖片

使用新框架的LLM表現全面提升

那么相比原始的CoT,使用Meta-CoT新框架的LLM性能到底變強了多少呢?下面一起來看看論文中的實驗部分。

實驗設計

數據收集方面,本論文主要使用了多個數學問題數據集,包括HARP、NuminaMath、Omni-MATH和OpenMathInstruct-2。通過對這些數據集進行過濾和處理,生成了適合訓練的合成數據。

實驗中的模型包括當前主流的多個LLM,包括Llama 3.1 8B、70B和GPT-4o等。

實驗設計包括指令調優和強化學習后訓練兩個階段。指令調優階段使用線性化的搜索軌跡進行訓練,強化學習后訓練階段使用E-RL2目標進行訓練。

在指令調優階段,團隊使用了多種優化目標,包括標準過程克隆方法和元鏈式思維優化目標。

在強化學習后訓練階段,他們使用了不同的折扣率和優化算法,如PPO和REINFORCE。

結果與分析

小規模的實驗結果:在小規模實驗中,使用MCTS和A*搜索算法生成的合成數據顯著提高了模型在復雜數學問題上的表現。

圖片

上下文探索的實驗結果:在上下文探索實驗中,模型在數學問題上的表現隨著上下文探索序列長度的增加而提高。然而,過長的序列長度也會導致性能下降,這也提醒我們需要在探索和推理之間找到平衡。

圖片

回溯實驗結果:在回溯實驗中,o1、DeepSeek-R1、Gemini 2.0 Flash Thinking等模型在解答數學題的過程中,在復雜數學問題上的表現都隨著回溯次數的增加而提高。這表明回溯是一種有效的錯誤糾正機制。

圖片

綜合實驗結果:綜合實驗結果表明,使用元鏈式思維框架可以顯著提高LLMs在復雜推理任務上的表現。例如,使用 E-RL2 目標訓練的模型在HARP數學基準測試中的表現比基線模型提高了約25%。

圖片

團隊還在規劃更多數學研究

論文提出的通過自教推力器、A*算法等方法進行合成的元鏈式思維(Meta-CoT)的框架,通過顯式建模推理過程和搜索過程,使得LLMs在各項常見的實驗任務中進行復雜推理的表現都有所提升。

團隊成員也表示,未來會進一步驗證所提出方法效率的必要性,開發出更有效的過程監督和驗證技術。

此外,針對當前LLM普遍在數學問題等邏輯性較強的任務上表現不佳的現象,他們還正在構建大數學(Big Math) 項目。

這個項目的目標是聚合超過50萬個高質量、可驗證的數學問題,并最終完全開源

圖片

對相關項目感興趣的朋友們可以點擊下面的鏈接了解更多內容~

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-10-15 09:05:05

2023-04-04 13:17:00

GPUCMU開源

2024-06-11 08:25:00

2025-02-14 09:20:00

模型數據訓練

2025-04-30 09:09:00

2024-09-24 11:01:03

2025-04-23 09:10:00

AI系統模型

2023-01-13 13:29:33

量子研究

2023-12-25 09:23:07

模型技術

2025-04-18 08:42:52

模型推理AI

2023-11-15 13:40:00

訓練數據

2025-03-12 10:38:05

2023-03-31 13:55:00

模型智能

2025-11-10 08:51:00

LLMOpenAI模型

2024-09-23 14:46:27

2024-11-15 13:42:25

2018-10-09 14:00:41

SQL深度學習神經網絡

2025-11-04 08:42:27

2025-01-13 00:00:00

訓練數據模型

2025-07-21 11:51:12

模型AI工具
點贊
收藏

51CTO技術棧公眾號

色综合久久悠悠| 色网在线免费观看| 亚洲天堂激情| 精品亚洲一区二区三区在线观看| 国产精品免费观看久久| 福利成人在线观看| 国产一区 二区 三区一级| 国内精品小视频| 国产7777777| 国产91精品入| 精品视频一区三区九区| 91视频 - 88av| 国产小视频在线播放| 久久99精品国产麻豆不卡| 欧美极品少妇与黑人| 一卡二卡三卡四卡| 精品国产鲁一鲁****| 欧美小视频在线| 91免费视频黄| 黄色软件在线| 成人免费视频视频在线观看免费| 国产精品美女在线观看| 国产91av视频| 91成人精品| 亚洲天堂2020| 中文字幕乱码在线| 精品国产不卡一区二区| 欧美性色黄大片手机版| 亚洲欧洲日产国码无码久久99| 人人干在线视频| 久久亚洲一区二区三区明星换脸| 97视频资源在线观看| 中文在线免费看视频| 中文亚洲免费| 久久久欧美一区二区| 精品亚洲乱码一区二区| 国产成人一区| 日韩久久免费电影| 人妻互换一二三区激情视频| 亚洲欧美专区| 欧美日韩你懂的| 色诱视频在线观看| 五月天国产在线| 亚洲18女电影在线观看| 国产情侣第一页| 国产盗摄在线观看| 综合网在线视频| 丝袜美腿玉足3d专区一区| 天天av综合网| 成人sese在线| 国产精品视频一区二区三区经| 99国产精品99| 国内外成人在线| 91久久精品一区| 国产在成人精品线拍偷自揄拍| 日本不卡123| 国产精品人人做人人爽| 91porny九色| 日韩av中文字幕一区二区三区| 热久久免费国产视频| 日韩成人一区二区三区| 国产欧美综合一区二区三区| 午夜精品在线视频| 久久黄色精品视频| 香蕉成人久久| 国产精品大陆在线观看| 中文字幕一区二区在线视频 | 国产乱码字幕精品高清av| 成人免费在线视频网站| 国产成人三级在线播放| 国产成人午夜精品5599| 国内精品国语自产拍在线观看| 日本毛片在线观看| 久久亚洲精品小早川怜子| 日本精品一区二区三区不卡无字幕| 深夜福利在线看| 成人精品动漫| 亚洲激情影院| 97超视频免费观看| 波多野结衣午夜| 麻豆精品在线视频| 97se亚洲综合在线| 污污视频在线观看网站| 国产日韩精品一区二区三区在线| 日韩av在线一区二区三区| 欧美精品videos另类| 亚洲最大的成人av| 午夜肉伦伦影院| 黄色精品视频网站| 日韩欧美一区电影| 人妻精品久久久久中文字幕| 成人写真视频| 午夜精品一区二区三区在线 | 黄色网页在线免费看| 一区二区欧美国产| 免费在线观看亚洲视频| 国产69精品久久| 精品国产乱码久久久久久久| 久久精品成人av| 我不卡伦不卡影院| 欧美在线xxx| 国产日本精品视频| 久久久久久久久一| www.在线观看av| 高清亚洲高清| 日韩精品在线免费观看视频| 极品美妇后花庭翘臀娇吟小说| 9色精品在线| 国产欧美一区二区三区久久| 日日躁夜夜躁白天躁晚上躁91| 亚洲国产高清在线| 国产中文字幕二区| 国产日韩一区二区三免费高清| 亚洲精品www久久久久久广东| 在线观看亚洲大片短视频| 激情综合激情| 91亚洲精华国产精华| 国产一级片在线| 亚洲成人动漫一区| 三级黄色片播放| 波多野结衣在线播放一区| 久久免费视频网站| 国产视频手机在线| 国产精品免费网站在线观看| 动漫av网站免费观看| 日本精品国产| 尤物九九久久国产精品的特点 | 天堂中文8资源在线8| 午夜精品久久久久久久久久| 亚洲视频在线不卡| 999国产精品永久免费视频app| 欧美在线www| 色屁屁草草影院ccyycom| 亚洲人成精品久久久久久| 黄色一级二级三级| 免费不卡中文字幕在线| 午夜免费在线观看精品视频| 亚洲精品久久久久久无码色欲四季| 国产精品麻豆久久久| 91av俱乐部| 最新国产精品视频| 97精品免费视频| 欧美 日韩 人妻 高清 中文| 亚洲精品欧美激情| 久久人人爽人人片| 91成人免费| 亚洲综合第一页| 成人看av片| 欧美一级视频精品观看| 国产福利视频网站| 国精产品一区一区三区mba视频 | 99久久综合狠狠综合久久止| 米奇777四色精品人人爽| 欧美视频在线一区二区三区| 国产三级短视频| 日韩成人精品在线| 中文字幕一区二区三区四区五区六区| 不卡亚洲精品| 久久精品亚洲热| av男人天堂网| 亚洲精品成人在线| 男人的天堂免费| 亚洲高清不卡| 欧美日韩在线不卡一区| 91精品韩国| 中文字幕久久久| 国产毛片毛片毛片毛片毛片| 亚洲欧美激情插| 久久久久久婷婷| 久久不射中文字幕| 亚洲一区高清| 在线精品视频一区| 欧美怡春院一区二区三区| 你懂得网站在线| 欧美色精品在线视频| 国产三级国产精品国产国在线观看| 国产成人超碰人人澡人人澡| 日韩视频免费播放| 国产剧情在线观看一区| 成人福利在线观看| av日韩国产| 一区二区三区 在线观看视| 亚洲天堂中文网| 一个色在线综合| av网站有哪些| 麻豆91在线观看| cao在线观看| 欧美日韩一二| 国产91社区| 伊人久久高清| 久久99精品视频一区97| 欧美偷拍视频| 91精品国产综合久久久久久久久久 | 国产精品第6页| 亚洲日本成人在线观看| 中国av免费看| 韩国v欧美v亚洲v日本v| 成人免费观看视频在线观看| 五月开心六月丁香综合色啪 | 国产a久久精品一区二区三区| 国产免费成人av| caoprom在线| 日韩在线视频导航| 香港一级纯黄大片| 91精品国产综合久久久久| 天天操天天操天天操天天| 综合在线观看色| 成人午夜福利一区二区| 国产高清不卡一区| 日本老熟妇毛茸茸| 雨宫琴音一区二区在线| 一区二区三区观看| 男男gay无套免费视频欧美| 超碰97人人人人人蜜桃| 日韩欧美2区| 97在线视频一区| 国产黄色在线免费观看| 亚洲人成77777在线观看网| 超碰在线人人干| 欧美日韩久久久一区| 麻豆久久久久久久久久| 综合色中文字幕| x88av在线| 91亚洲国产成人精品一区二区三| 欧美体内she精高潮| 久久精品国产亚洲高清剧情介绍 | 国产精品99久久久久久宅男| 日本999视频| 久久久久久亚洲精品杨幂换脸| 日韩黄色片在线| 亚洲精品小说| 亚洲国产精品www| 一区二区三区视频免费观看| 国内精品一区二区| www国产精品| 成人免费看片网址| 精品国产麻豆| 成人免费视频网| www一区二区三区| 国产日韩欧美日韩大片| 国产精品久久久久77777丨| 国产福利精品视频| 粉嫩一区二区| 日本一区二区不卡| 成人小电影网站| 日本高清视频精品| 一区二区三区电影大全| 欧美亚洲国产日韩2020| 性欧美freesex顶级少妇| 97色在线视频| 三级中文字幕在线观看| 26uuu日韩精品一区二区| 涩涩涩在线视频| 日本高清不卡的在线| 亚洲成a人片| 国产精品久久久久久久电影 | 黄色网在线免费看| 免费不卡欧美自拍视频| 丝袜中文在线| 国内精品久久久久伊人av| 美女网站在线看| 国产成人亚洲精品| 免费视频观看成人| 91蜜桃网站免费观看| 91在线一区| 久久精品国产第一区二区三区最新章节 | 中文字幕一区二区三区人妻不卡| 久久这里只有精品视频网| 国产免费一区二区三区网站免费| 中文无字幕一区二区三区 | 成人两性免费视频| 日本一区二区乱| 国产在线精品一区| 欧美精品色图| 欧洲精品视频在线| 国产视频一区在线观看一区免费| 不卡影院一区二区| 久久精品噜噜噜成人av农村| 亚洲黄色小说在线观看| 99久免费精品视频在线观看| 黄色片网站免费| 亚洲乱码一区二区三区在线观看| 国产第一页在线播放| 在线视频一区二区三| 国产男男gay体育生网站| 精品日韩在线一区| 男女网站在线观看| 麻豆成人在线看| 中文在线中文资源| 91精品中文在线| 奇米777国产一区国产二区| 亚洲激情一区二区| 亚洲国产精品一区制服丝袜| 男人搞女人网站| 国产99一区视频免费| 女人黄色一级片| 亚洲国产精品久久人人爱| 成人黄色三级视频| 亚洲国产精品久久91精品| av黄色在线观看| 97久久久久久| 国产成年精品| 秋霞在线观看一区二区三区 | 免费毛片小视频| 精品一区二区三区欧美| 3d动漫精品啪啪一区二区下载 | 在线精品免费视| 欧美sm极限捆绑bd| 91女主播在线观看| 欧美一区第一页| 一区二区三区自拍视频| 亚洲看片网站| 天堂精品中文字幕在线| 男人的天堂影院| 亚洲黄色免费网站| 亚洲性在线观看| 亚洲人成网站999久久久综合| 欧美24videosex性欧美| 国产日韩在线视频| 国产精品亚洲片在线播放| 黄色激情在线视频| 国产一区二区不卡在线| 香蕉成人在线视频| 色偷偷久久一区二区三区| 蜜桃av噜噜一区二区三区麻豆| 色妞在线综合亚洲欧美| 亚洲承认视频| 久久国产精品久久| 亚洲美女一区| 人妻无码中文久久久久专区| 夜夜嗨av一区二区三区中文字幕 | 国产三级国产精品国产国在线观看| 欧美性做爰猛烈叫床潮| 成人影视在线播放| 热久久这里只有精品| 神马久久影院| 俄罗斯av网站| 北条麻妃国产九九精品视频| 久一视频在线观看| 日韩欧美国产午夜精品| 国产1区在线| 91嫩草国产在线观看| 一区二区三区午夜探花| www.日本久久| 自拍偷拍亚洲综合| 国产乱码精品一区二三区蜜臂| 色偷偷9999www| 天天综合91| 永久免费在线看片视频| 国产一区不卡在线| 高h视频免费观看| 欧美sm极限捆绑bd| 国产伦理精品| 蜜桃视频在线观看成人| 99av国产精品欲麻豆| 亚洲永久无码7777kkk| 欧美日韩久久久久| 每日更新在线观看av| 国产精品91免费在线| 日韩在线二区| 永久免费黄色片| 亚洲国产精品一区二区www| 日韩一级片免费在线观看| 日本国产欧美一区二区三区| 欧美极品在线观看| 亚洲欧美日韩三级| 一区二区三区在线高清| 黑人操亚洲女人| 日本午夜人人精品| 99久久99热这里只有精品| 天天操夜夜操很很操| 亚洲国产综合在线| 青青草免费在线视频| 国产精品视频男人的天堂| 91精品一区二区三区综合| 日本一区二区免费视频| 欧美日韩精品在线视频| 无遮挡的视频在线观看 | 亚洲av无码一区二区三区性色| 韩国精品美女www爽爽爽视频| 女厕嘘嘘一区二区在线播放 | 久久精品无码av| 久久天堂电影网| 亚洲精品推荐| 日韩av福利在线观看| 五月婷婷综合网| 欧美日韩欧美| 国产伦精品一区二区三区在线 | 图片区小说区区亚洲影院| 毛片免费在线观看| 999在线观看免费大全电视剧| 国产日韩欧美三区| 欧美精品久久久久久久久46p| 亚洲成人精品久久久| 日韩中文视频| 精品丰满人妻无套内射| 中文字幕一区二区日韩精品绯色| 日日躁夜夜躁白天躁晚上躁91| 国产欧美精品一区二区三区介绍| 狠狠入ady亚洲精品|