精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

等不來OpenAI的Q*,華為諾亞探索LLM推理的秘密武器MindStar先來了

人工智能 新聞
本文介紹了 MindStar(M*),一種新穎的基于搜索的推理框架,用于增強預訓練大型語言模型的推理能力。通過將推理任務視為搜索問題并利用過程監督的獎勵模型,M* 在推理樹空間中有效導航,識別近似最優路徑。

本論文作者來自華為蒙特利爾諾亞方舟實驗室的康計堃,李信擇,陳熙, Amirreza Kazemi,陳博興。

人工智能(AI)在過去十年里取得了長足進步,特別是在自然語言處理和計算機視覺領域。然而,如何提升 AI 的認知能力和推理能力,仍然是一個巨大的挑戰。

近期,一篇題為《MindStar: Enhancing Math Reasoning in Pre-trained LLMs at Inference Time》的論文提出了基于樹搜索的推理時間能力提升方法 MindStar [1],該方法在開源模型 Llama-13-B 與 Mistral-7B 上達到了近似閉源大模型 GPT-3.5 與 Grok-1 在數學問題上的推理能力。

圖片

  • 論文標題:MindStar: Enhancing Math Reasoning in Pre-trained LLMs at Inference Time
  • 論文地址:https://arxiv.org/abs/2405.16265v2

MindStar 在數學問題上的應用效果:

圖片

圖 1 :不同大型語言模型的數學準確率。LLaMA-2-13B 在數學性能上與 GPT-3.5 (4-shot) 類似,但節省了大約 200 倍的計算資源。

1. 引言

隨著模型規模的快速增長,基于 Transformer 的大型語言模型(LLMs)在指令遵循 [1,2]、編碼輔助 [3,4] 和創意寫作 [5] 等領域展示了令人印象深刻的成果。然而,解鎖 LLMs 解決復雜推理任務的能力仍然是一大挑戰。最近的一些研究 [6,7] 嘗試通過監督微調(Supervised Fine-Tuning, SFT)來解決,通過將新的推理數據樣本與原始數據集混合,使 LLMs 學習這些樣本的底層分布,并嘗試模仿所學邏輯來解決未見過的推理任務。盡管這種方法有性能提升,但它嚴重依賴于大量的訓練和額外的數據準備 [8,9]。

Llama-3 報告 [10] 強調了一個重要的觀察:當面對一個具有挑戰性的推理問題時,模型有時會生成正確的推理軌跡。這表明模型知道如何產生正確答案,但在選擇上存在困難。基于這一發現,我們提出了一個簡單的問題:我們能否通過幫助 LLMs 選擇正確的輸出來增強它們的推理能力?為探索這一點,我們進行了一項實驗,利用不同的獎勵模型進行 LLMs 輸出選擇。實驗結果表明,步驟級選擇顯著優于傳統的 CoT 方法。

2. MindStar 方法

圖片

圖 2 MindStar 的算法架構圖

我們引入了一種新的推理搜索框架 ——MindStar(M*),通過將推理任務視為搜索問題,并利用過程監督的獎勵模型(Process-supervised Reward Model, PRM),M * 在推理樹空間中有效導航,識別近似最優路徑。結合束搜索(Beam Search, BS)和 Levin 樹搜索(Levin Tree Search, LevinTS)的思想,進一步增強了搜索效率,并保證在有限計算復雜度內找到最佳推理路徑。

2.1 過程監督獎勵模型

過程監督獎勵模型 (PRM) 的設計目的是評估大語言模型 (LLM) 生成的中間步驟,以幫助選擇正確的推理路徑。這種方法借鑒了其他應用中 PRM 的成功經驗。具體而言,PRM 以當前推理路徑圖片和潛在的下一步圖片作為輸入,并返回獎勵值圖片

PRM 通過考慮整個當前推理軌跡來評估新步驟,鼓勵與整體路徑的一致性和忠實性。高獎勵值表明,新的步驟圖片)對于給定的推理路徑圖片可能是正確的,從而使擴展路徑值得進一步探索。相反,低獎勵值則表示新步驟可能不正確,這意味著遵循此路徑的解決方案也可能不正確。

M* 算法包含兩個主要步驟,迭代直到找到正確的解決方案:

1. 推理路徑擴展:在每次迭代中,基礎 LLM 生成當前推理路徑的下一步。

2. 評估和選擇:使用 PRM 評估生成的步驟,并根據這些評估選擇下一次迭代的推理路徑。

2.2 推理路徑擴展

圖片

在選擇要擴展的推理路徑圖片后,我們設計了一個提示模板(Example 3.1),以從 LLM 中收集下一步。正如示例所示,LLM 將原始問題作為 {question},將當前推理路徑作為 {answer}。注意,在算法的第一次迭代中,所選擇的節點是僅包含問題的根節點,因此 {answer} 為空。對于推理路徑圖片,LLM 生成 N 個中間步驟,并將它們作為當前節點的子節點附加。在算法的下一步中,將評估這些新生成的子節點,并選擇一個新的節點進行進一步擴展。我們還意識到,生成步驟的另一種方法是使用步驟標記對 LLM 進行微調。然而,這可能會降低 LLM 的推理能力,更重要的是,這與本文的重點 —— 在不修改權重的情況下增強 LLM 推理能力相悖。

2.3 推理路徑選擇

在擴展推理樹后,我們使用預訓練的過程監督獎勵模型(PRM)來評估每個新生成的步驟。正如前面提到的,PRM 采用路徑和步驟 ,并返回相應的獎勵值。在評估之后,我們需要一種樹搜索算法來選擇下一個要擴展的節點。我們的框架不依賴于特定的搜索算法,在這項工作中,我們實例化了兩種最佳優先搜索方法,即 Beam Search 和 Levin Tree Search。

3. 結果與討論

在 GSM8K 和 MATH 數據集上的廣泛評估顯示,M * 顯著提升了開源模型(如 LLaMA-2)的推理能力,其表現可與更大規模的閉源模型(如 GPT-3.5 和 Grok-1)媲美,同時大幅減少了模型規模和計算成本。這些發現突顯了將計算資源從微調轉移到推理時間搜索的潛力,為未來高效推理增強技術的研究開辟了新途徑。

圖片

表 1 展示了各種方案在 GSM8K 和 MATH 推理基準上的對比結果。每個條目的數字表示問題解決的百分比。符號 SC@32 表示在 32 個候選結果中的自一致性,而 n-shot 表示少樣本例子的結果。CoT-SC@16 指的是在 16 個思維鏈(CoT)候選結果中的自一致性。BS@16 代表束搜索方法,即在每個步驟級別涉及 16 個候選結果,而 LevinTS@16 詳細說明了使用相同數量候選結果的 Levin 樹搜索方法。值得注意的是,MATH 數據集上 GPT-4 的最新結果為 GPT-4-turbo-0409,我們特別強調這一點,因為它代表了 GPT-4 家族中的最佳性能。

圖片

圖 3 我們研究了 M * 性能如何隨著步驟級別候選數量的變化而變化。我們選擇 Llama-2-13B 作為基礎模型,并分別選擇束搜索(BS)作為搜索算法。

圖片

圖 4 Llama-2 和 Llama-3 模型家族在 MATH 數據集上的尺度定律。所有結果均來自它們的原始資源。我們使用 Scipy 工具和對數函數來計算擬合曲線。

圖片

表 2 不同方法在回答問題時的平均 token 生產數量

4. 結論

本文介紹了 MindStar(M*),一種新穎的基于搜索的推理框架,用于增強預訓練大型語言模型的推理能力。通過將推理任務視為搜索問題并利用過程監督的獎勵模型,M* 在推理樹空間中有效導航,識別近似最優路徑。結合束搜索和 Levin 樹搜索的思想,進一步增強了搜索效率,并保證在有限計算復雜度內找到最佳推理路徑。廣泛的實驗結果表明,M* 顯著提升了開源模型的推理能力,其表現可與更大規模的閉源模型媲美,同時大幅減少了模型規模和計算成本。

這些研究成果表明,將計算資源從微調轉移到推理時間搜索具有巨大的潛力,為未來高效推理增強技術的研究開辟了新途徑。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2013-10-16 09:28:14

亞馬遜AWSSDN

2024-04-08 08:03:00

ChatGPTOpenAI大語言模型

2013-10-16 09:33:36

亞馬遜AWSSDN

2015-03-30 16:58:05

秘密武器華為

2014-01-07 10:46:39

2011-08-11 17:05:26

2024-07-15 08:40:00

2022-02-11 10:47:17

CIOIT團隊企業

2019-11-27 10:38:37

數據分析數據準備工具

2025-05-14 00:01:10

RxJS異步編程響應式

2009-07-28 10:36:58

云計算Google秘密武器

2021-04-27 10:36:59

計算

2023-05-08 14:54:00

AI任務HuggingGPT

2019-11-27 10:40:34

數據工具CIO

2024-07-11 08:34:48

2025-05-27 10:00:00

Python數據類代碼

2019-02-27 09:44:01

CIO秘密武器顧問

2025-01-06 23:33:04

2025-07-14 09:03:00

2023-02-24 10:26:34

語音AI人工智能
點贊
收藏

51CTO技術棧公眾號

日韩三级免费| 欧美在线观看不卡| 欧美激情三级| 亚洲午夜精品网| 黄色国产精品一区二区三区| 日韩综合在线观看| 日韩一区二区中文| 亚洲第一精品福利| 污污动漫在线观看| 97天天综合网| 国产精品麻豆久久久| 国产精品一区二区三区免费观看| 日韩乱码一区二区三区| 国模一区二区三区| 综合网日日天干夜夜久久| 亚洲精品久久一区二区三区777| 日本电影欧美片| 亚洲一区二区在线免费观看视频| 丝袜足脚交91精品| 熟妇人妻一区二区三区四区| 精品一区二区三区免费| 欧美中文字幕视频在线观看| 破处女黄色一级片| 清纯唯美日韩| 国产丝袜一区二区| 折磨小男生性器羞耻的故事| 欧美在线se| 91电影在线观看| 鲁一鲁一鲁一鲁一色| h片在线观看网站| 国产精品无码永久免费888| 国产欧美一区二区视频| 国产成人精品一区二区无码呦| 视频一区二区三区在线| 性欧美视频videos6一9| 欧美黄色一级网站| 小处雏高清一区二区三区| 一区二区三区 在线观看视| 男男做爰猛烈叫床爽爽小说 | 成人写真视频| 亚洲精品在线91| 在线观看国产免费视频| 高潮按摩久久久久久av免费| 欧美一区二区私人影院日本| 黄大色黄女片18第一次| 久久xxx视频| 欧美网站大全在线观看| 无码内射中文字幕岛国片| 亚洲精品mv| 日韩欧美中文字幕在线观看 | 欧美a在线观看| 一级黄色性视频| 91视频免费版污| 男人久久精品| 99久久精品费精品国产一区二区| 91成人免费在线观看| 国产人妻精品一区二区三区| 久草在线在线精品观看| 成人黄色激情网| jizz国产视频| 成人黄色大片在线观看 | 隔壁人妻偷人bd中字| 丁香花在线电影小说观看| 亚洲国产va精品久久久不卡综合| 国产夫妻自拍一区| 涩涩视频在线| 色综合天天综合色综合av| 精品一卡二卡三卡| 嫩草伊人久久精品少妇av杨幂| 欧美亚洲日本一区| 欧美性受xxxxxx黑人xyx性爽| 欧美特级特黄aaaaaa在线看| 免费看欧美黑人毛片| 欧美videos大乳护士334| 先锋影音久久久| 国产成人天天5g影院在线观看| 四虎影院中文字幕| 一区二区不卡视频在线观看| 欧美三区在线| 高清欧美性猛交xxxx黑人猛交| 日本免费在线播放| 一道本一区二区| 国产精品69久久| 夜夜躁很很躁日日躁麻豆| 精彩视频一区二区三区| 高清日韩一区| 免费在线国产| 亚洲欧美日韩系列| 久久精品视频16| 韩国精品视频在线观看| 日韩三级视频在线看| 国产伦精品一区三区精东| 少妇精品久久久一区二区三区| 久久精品一区中文字幕| 日韩人妻无码一区二区三区99| 日日摸夜夜添夜夜添亚洲女人| 国产啪精品视频| 日韩在线观看视频一区| 亚洲国产精品成人综合| 99国产精品白浆在线观看免费| sis001欧美| 日韩欧美国产麻豆| 怡红院一区二区三区| 国产精品hd| 国产精品永久免费| 日本免费网站在线观看| 椎名由奈av一区二区三区| 乱妇乱女熟妇熟女网站| 麻豆精品国产| 国产一区二区三区欧美| 日本少妇在线观看| 国内外成人在线| 日本精品一区二区| 波多野结衣在线高清| 欧美精品v国产精品v日韩精品| 尤物网站在线观看| 亚洲一区二区三区无吗| 国产精品狠色婷| 色综合视频在线| 亚洲综合网站在线观看| 天天干天天玩天天操| 亚洲图片久久| 亚州国产精品久久久| a天堂中文在线观看| 国产欧美视频一区二区| 成年人观看网站| 成人自拍在线| 久久精品最新地址| 亚洲视频久久久| 欧美国产日韩在线观看| 日本一本二本在线观看| 哺乳一区二区三区中文视频 | 亚洲国产第一区| 狠狠爱成人网| 91视频网页| 视频在线观看入口黄最新永久免费国产| 欧美日韩一级视频| 色一情一交一乱一区二区三区| 一本久道久久久| 国产一级特黄a大片99| 国产探花在线观看| 日韩精品一区二区三区中文精品| 精品无码久久久久成人漫画| 精品中文字幕一区二区| 曰韩不卡视频| 国产精品一二三产区| 日本精品久久久久| 国产精品免费人成网站酒店| 欧美视频国产视频| 午夜在线视频| 色婷婷国产精品久久包臀| 免费不卡的av| 亚洲深夜av| 欧美福利精品| 欧美××××黑人××性爽| 亚洲免费av片| 中文字幕 国产精品| 国产日韩亚洲欧美综合| 一本久道综合色婷婷五月| 精品国产一区二区三区| 国产精选久久久久久| 欧美尤物美女在线| 日韩欧美的一区二区| 久久久精品国产sm调教| 99热这里都是精品| 国产男女无遮挡| 欧美色女视频| 444亚洲人体| 91福利区在线观看| 亚洲欧美日韩精品久久亚洲区| 亚洲av无码不卡| 国产精品久久毛片a| 亚洲综合123| 日韩五码在线| 亚洲国产精品一区在线观看不卡| 性欧美video另类hd尤物| 欧美日韩福利视频| 你懂的免费在线观看| 欧美日韩第一区日日骚| 久久精品波多野结衣| 久久久久久黄色| 在线看免费毛片| 亚洲经典视频在线观看| 日本亚洲导航| 最新国产精品精品视频| 国产精品777| 欧美videosex性极品hd| 亚洲人成电影网| 99国产精品欲| 色综合天天狠狠| 欧美 日韩 国产 一区二区三区| 成人久久久精品乱码一区二区三区| 少妇性饥渴无码a区免费| 午夜精品一区二区三区国产| 极品尤物一区二区三区| 深夜日韩欧美| 欧美一级电影久久| 26uuu亚洲电影在线观看| 精品伊人久久97| 精品久久久久成人码免费动漫| 精品国产鲁一鲁一区二区张丽| 国产精品视频在| 国产日韩一区二区三区在线播放 | 久久久久亚洲av成人无码电影| 亚洲精品在线播放| 欧美一区在线直播| 日本在线看片免费人成视1000| 精品国产凹凸成av人网站| 青青艹在线观看| 香蕉成人啪国产精品视频综合网| 99精品中文字幕| 26uuu色噜噜精品一区| 久久发布国产伦子伦精品| 久久久久久一区二区| 成人av在线不卡| 天天久久综合| 欧美重口乱码一区二区| 精品精品国产三级a∨在线| 91人成网站www| 99久久伊人| 日本精品中文字幕| 岛国av在线播放| 久久久久久12| 高清全集视频免费在线| 色噜噜狠狠色综合网图区| 欧美亚洲日本| 日韩av影院在线观看| 亚洲国产欧美另类| 欧美一区二区精品| 一级aaaa毛片| 欧美三级韩国三级日本一级| 婷婷激情五月综合| 欧美视频第一页| 国产一级精品视频| 亚洲超丰满肉感bbw| 久久久精品人妻一区二区三区四| 亚洲视频一二区| 国产精品丝袜一区二区| 亚洲欧美国产77777| 天天鲁一鲁摸一摸爽一爽| 国产女人水真多18毛片18精品视频 | 久久天天狠狠| 久本草在线中文字幕亚洲| 国产精品久久久久久久天堂第1集| 亚洲一区二区免费在线观看| 97netav| 77成人影视| 国产精品毛片va一区二区三区| 91蜜桃臀久久一区二区| 国产区一区二区三区| 久久超级碰碰| 麻豆一区区三区四区产品精品蜜桃| 美女网站色精品尤物极品姐弟| 精品国产乱码久久久久久久软件 | 国产丶欧美丶日本不卡视频| 91蝌蚪视频在线| 国产91在线看| 中文字幕在线永久| 91麻豆产精品久久久久久| 美女爆乳18禁www久久久久久| 久久久久久久性| 亚洲激情图片网| 一区二区三区欧美日韩| 欧美丰满熟妇bbbbbb| 亚洲午夜激情网页| 51国产偷自视频区视频| 欧美视频在线一区| 国产视频手机在线| 亚洲国产精品久久久久秋霞蜜臀 | 久久婷婷国产| 欧美日本韩国国产| 日韩在线综合| 久久99久久99精品| 久久香蕉精品| 中文字幕在线观看日| 高清国产一区二区| 伊人网在线视频观看| 中文字幕日韩一区二区| 精品亚洲永久免费| 在线一区二区观看| 国产色在线视频| 日韩精品在线免费| 老司机av在线免费看| 97在线视频观看| 高清亚洲高清| 久草精品电影| 国产精品成人av| 日韩精品 欧美| 麻豆成人久久精品二区三区红| 成人一区二区三区仙踪林| 国产性天天综合网| 国产a免费视频| 欧美在线啊v一区| 老牛影视av牛牛影视av| 一本久久综合亚洲鲁鲁| 丁香花视频在线观看| 国产精品视频自拍| 美女扒开腿让男人桶爽久久动漫| 伊人久久婷婷色综合98网| 亚洲一区图片| 亚洲av无码久久精品色欲| 久久精品这里都是精品| 免费中文字幕在线观看| 欧美日韩精品一区二区三区四区| 四季av日韩精品一区| 久久成人免费视频| 日本欧美一区| 九色综合婷婷综合| 欧美三级视频| 91小视频在线播放| 国产人成一区二区三区影院| 国产小视频在线看| 欧美一区永久视频免费观看| 理论视频在线| 69视频在线免费观看| 日韩欧美中文在线观看| 永久域名在线精品| 青娱乐精品在线视频| 久久精品老司机| 红桃视频成人在线观看| 超碰福利在线观看| 久久精品国产一区| 久久天堂影院| 色综合电影网| 视频一区二区三区入口| 动漫精品一区二区三区| 午夜日韩在线观看| 亚洲经典一区二区| 欧美激情第1页| 911亚洲精品| 日韩精品一区二区在线视频| 国产精品伊人色| 欧美黑人猛猛猛| 日韩欧美视频一区| www视频在线免费观看| 91色p视频在线| 亚洲精品一二三区区别| 九九久久久久久| 亚洲男人天堂av网| av网站免费播放| 色综合久久悠悠| 成人精品毛片| 男人日女人下面视频| 久久久综合精品| 亚洲大片免费观看| 中文字幕欧美日韩在线| 黄色日韩网站| 青青草免费在线视频观看| 国产综合色视频| 黄色小说在线观看视频| 亚洲成人精品视频在线观看| 97天天综合网| 欧美日韩另类丝袜其他| 日本成人在线视频网站| 潮喷失禁大喷水aⅴ无码| 欧美一区二区日韩一区二区| 羞羞视频在线观看不卡| 国产精品我不卡| 免费日韩av片| www亚洲色图| 7777精品伊人久久久大香线蕉最新版| 成人在线影视| 国产精品国色综合久久| 免费在线日韩av| 色www亚洲国产阿娇yao| 欧美一区二区三区视频在线| 日本欧美电影在线观看| 久久精品国产第一区二区三区最新章节| 亚洲欧美清纯在线制服| 亚洲精品成人av久久| 日韩小视频在线观看专区| 91老司机福利在线| 四虎影院一区二区三区 | 99国精产品一二二线| 一区二区福利| 丁香激情五月少妇| 91麻豆精品国产自产在线观看一区| 男人天堂亚洲天堂| 蜜桃传媒视频第一区入口在线看| 免费看黄色91| 久久午夜无码鲁丝片| 亚洲人成在线观看网站高清| 不卡一区视频| 波多野结衣之无限发射| 中文字幕一区二区三区不卡在线| 国产av无码专区亚洲a∨毛片| 911国产网站尤物在线观看| 日韩理论电影院| 中国xxxx性xxxx产国| 欧美综合亚洲图片综合区| 色呦呦呦在线观看| 亚洲国内在线| av一本久道久久综合久久鬼色| 中文字幕av片| 97精品国产97久久久久久免费 | 国产欧美精品aaaaaa片| 国产亚洲一二三区| 刘亦菲毛片一区二区三区| 国产精品网址在线| 国产日韩1区|