精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

圖靈獎得主加持,蒙特卡洛樹搜索×擴散模型殺回規劃賽道|ICML 2025 Spotlight

人工智能 新聞
這個方法將“上古時代”的蒙特卡洛樹搜索,和當下熱門的擴散模型結合在一起,突破了擴散模型在長程任務推理階段缺乏可擴展性的瓶頸,并成功入選ICML 2025的Spotlight。

一個不起眼的迷宮導航任務,卻能讓一眾模型“原形畢露”。

圖片

Diffuser和Diffusion Forcing雙雙翻車,通關率低得可憐。

唯獨有一個模型,通關率高達 100%。

而它就來自圖靈獎得主Yoshua Bengio與其團隊提出的全新方法:蒙特卡洛樹擴散(Monte Carlo Tree Diffusion, MCTD)

這個方法將“上古時代”的蒙特卡洛樹搜索,和當下熱門的擴散模型結合在一起,突破了擴散模型在長程任務推理階段缺乏可擴展性的瓶頸,并成功入選ICML 2025的Spotlight。

圖片

Make MCTS Great Again?

如何在探索(Explore)未知可能性以尋找更優解和利用(Exploit)當前已知最佳方案之間取得平衡,一直是復雜決策和長程規劃任務的核心挑戰之一。

一個過于強調探索的系統可能效率低下,在大量平庸選項中徘徊;而一個過于強調利用的系統則可能過早收斂到局部最優,錯過全局最佳解。

對于擴散模型來說,它雖然能夠通過去噪過程實現高質量、全局一致的序列生成(對數據分布的“利用”),但缺乏在不確定性下主動探索不同未來路徑的能力。

而MCTS恰恰具備通過樹形搜索結構進行高效探索和局部優化的能力,因而能夠系統地權衡探索與利用,并在多個決策點進行智能選擇。

由此,MCTD將擴散模型的全局一致性生成優勢與MCTS的局部探索決策能力相結合。通過將軌跡劃分為多個子規劃來作為MCTS節點,并對不同子規劃實施差異化的去噪調度,實現了在長程規劃中探索與利用的平衡,提高了規劃的效率和質量。

通過MCTS實現異步控制

在傳統的擴散模型中,尤其是在生成軌跡時,模型通常將整條軌跡視為一個整體進行去噪,并用N來表示n個時間步的狀態。

與之相反,MCTD并不把整個N個時間步的軌跡作為一個整體去噪,而是將它劃分為S個時間段。在論文中,MCTD則先將完整軌跡X劃分5個沒有重疊的子軌跡。

例如,如果 N=500,S=5,那么一個可能的劃分是:

圖片

這些子規劃在每個時間段(如1-100)是獨立的,它們之間沒有共享的時間步。

由此,每個子規劃的結束可以看作是完整軌跡的一個切片。當模型對一個特定的子規劃進行去噪時,這段子規劃內部的所有時間步都會同時參與到去噪過程中,遵循針對該子規劃設定的統一的去噪調度。

而在不同的子規劃之間,MCTS決定了不同子規劃的去噪進度和深度,并通過其四個階段表現出來。

圖片

  • Selection:從已有的MCTS中,使用UCB(Upper Confidence Bound,在樹中選擇最有前景的節點)策略選擇一個表示部分去噪軌跡片段(即子規劃)的節點。
  • Expansion:從選定的子規劃節點的末端狀態出發,根據不同的動作或決策,生成一個或多個新的子規劃節點。這些新節點代表了從當前狀態開始的下一段未探索的軌跡片段。同時,為了進行更智能的規劃,MCTS還通過元動作引導級別(Guidance Levels as Meta-Action)來確定子節點的引導級別。高引導級別意味著更精細地、明確地去噪(利用),而低引導級別則意味著去噪過程可以更加自由,允許嘗試新的路徑(探索)。
  • Simulation:從新擴展的子規劃節點開始,MCTD 會利用擴散模型進行“跳躍式去噪”(Jumpy Denoising),快速生成一個從該子規劃開始到軌跡末端的粗略但完整的未來軌跡序列。然后,通過一個獎勵函數評估這個粗略軌跡的價值。
  • Backpropagation:將“模擬”階段得到的整個軌跡的獎勵值,從模擬開始的子規劃節點,沿著樹向上,更新其所有祖先子規劃節點的訪問次數和累積獎勵。這些更新將指導未來的Selection階段,使得 MCTS 能夠更好地利用高回報路徑,探索未知的路徑。

由此,模型一方面將傳統的“狀態”和“動作”的粒度提升到了“子規劃”和“子規劃間連接”的粒度;另一方面,則通過MCTS過程,控制前后子規劃的降噪進度,實現異步控制,從而能夠更高效地處理長序列生成和規劃問題。

實驗結果

MCTD在包括迷宮導航、機械臂操作、視覺迷宮(部分可觀測環境)等任務上進行了測試。

在迷宮導航任務中,MCTD在所有地圖尺寸(medium/large/giant)上均接近100%成功率,顯著優于基線方法。

圖片

在機械臂立方體操作中,所有方法在單方塊任務上性能相當。而MCTD-Replanning在多方塊場景中表現出顯著的性能優勢,將雙方塊任務的成功率從22%提升至50%。

圖片

在視覺迷宮中,MCTD優于所有基線,表明其在高維感知空間中的魯棒性。

圖片

最后,隨著推理計算預算的增加(如增加最大去噪步數),MCTD成功率持續提升,而Diffuser/Diffuser-Random Search收益有限,驗證了MCTD的推理可擴展性。

圖片

總體而言,盡管MCTD通過將基于搜索的規劃與擴散模型結合,在推理階段的可擴展性上取得了提升,但由于其類似“系統二”的深度推理方式,計算成本仍然較高。

此外,由于MCTD在大規模搜索空間中效率較低——即使采用了低維的元動作(meta-actions),評估多個軌跡假設的計算開銷依然很高。

因此,如何提升整體效率成為了MCTD進一步改進的目標。

Fast-MCTD:加速100倍!

為了解決了MCTD計算開銷大,推理時間長的缺點,研究團隊又進一步推出了快速蒙特卡洛樹擴散框架(Fast Monte Carlo Tree Diffusion,Fast-MCTD,相比前作MCTD,在特定任務上的推理速度提升了100倍。

圖片

在原始的MCTD框架中,主要有兩個效率瓶頸:

首先,MCTS算法在設計上是順序的,每次迭代(一次完整的Selection、Expansion、Simulation、Backpropagation)完成后,才會更新搜索樹的統計信息(如節點訪問次數和價值估計)。這種串行更新機制限制了算法的并行執行能力

其次,擴散模型在生成軌跡時需要執行多次迭代去噪操作。當處理長軌跡時,每一次去噪都是一個計算密集型任務,導致整體計算開銷巨大。

因此,為了降低樹搜索和迭代去噪的計算開銷,同時保留 MCTD 強大的規劃能力,Fast-MCTD集成了兩種關鍵的優化技術:并行MCTD和稀疏MCTD。

并行MCTD:提升并行性

MCTD沿用了MCTS的順序性,即每次模擬完成后才更新樹。并行MCTD引入了并行處理,這是Fast-MCTD與前作最顯著的區別。

并行MCTD允許K個并發的rollouts。每個rollout在共享的、固定快照(fixed snapshot)的搜索樹上獨立進行。

樹的更新(價值估計和訪問計數)只有在整個批次的所有rollouts完成后才統一應用 。不過,當批處理量增大時,樹的統計信息會變得過時,降低選擇的準確性,從而影響規劃性能 。

為了解決上述問題,并行MCTD引入冗余感知選擇 (Redundancy-Aware Selection - RAS):它在每個并行搜索階段臨時引入一個輔助訪問計數變量,順序跟蹤當前批次中的選擇,并在延遲樹更新后重置。

這修改了標準UCT的選擇準則,通過一個超參數懲罰當前批次中已被選中的節點,鼓勵其他rollouts探索樹的不同部分 。

圖片

由于擴散模型去噪操作昂貴,并行MCTD提出了統一的批處理策略,在擴展和模擬階段同時處理多個由 RAS 選擇的子規劃。它通過調度噪聲級別和同步DDIM(Denoising Diffusion Implicit Models)更新來批處理去噪步驟。為了處理子規劃和不同引導級別,子規劃被填充并打包成統一形狀的張量,以實現GPU上的高吞吐量并行執行。

稀疏MCTD:減少Rollout長度

MCTD雖然將軌跡分段為子規劃,但每個子規劃內部仍然是相對密集的軌跡。Fast-MCTD引入了軌跡粗化,從根本上縮短了有效規劃時域。通過軌跡粗化 (trajectory coarsening) 在更高的抽象層次上進行rollouts,從而減少rollout的長度和總計算成本。

具體來說,在訓練擴散模型之前,通過每隔H步進行下采樣,構建粗粒度軌跡數據集.使用在這些壓縮表示上訓練的專用稀疏擴散規劃器來建模粗粒度軌跡。由此,涉及規劃的子軌跡數量大大減少,降低總體搜索復雜度及去噪成本。

在迷宮導航測試中,Fast-MCTD相對于標準MCTD實現了約80-110倍的顯著加速,而性能損失極小。

圖片

而在機械臂操作中,Fast-MCTD在保持MCTD性能的同時,顯著提升了效率。

圖片

在視覺迷宮中,Fast-MCTD表現出顯著的效率提升,比 MCTD 快 25-60 倍,而在更大的迷宮中甚至超越了MCTD。

圖片

可以說,Fast-MCTD 在保持或提升規劃性能的同時,實現了數量級的速度提升(最高100倍),成為了更實用和可擴展的解決方案 。

ONE MORE THING

這兩篇論文的一作均來自韓國科學技術院(KAIST)的博士生尹在植(Jaesik Yoon)。

圖片

本文的另一位作者則是尹在植的指導老師安成鎮(Sungjin Ahn),安成鎮教授是韓國科學技術院和紐約大學的聯聘教授。

他的研究方向包括:可擴展貝葉斯推理、深度學習以及人工智能與認知科學的交叉領域,并多次擔任NeurIPS、ICM、ICLR等頂會AC。

他于加州大學歐文分校獲得博士學位,在Max Welling教授指導下專注于近似貝葉斯推理研究。隨后在蒙特利爾大學的MILA實驗室進行博士后研究,師從深度學習先驅、圖靈獎得主Yoshua Bengio教授。

圖片


論文鏈接:

[1]https://arxiv.org/pdf/2502.07202

[2]https://arxiv.org/pdf/2506.09498

學術主頁:

[1]https://jaesikyoon.com/

[2]https://mlml.kaist.ac.kr/sungjinahn

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-02-24 10:15:00

2025-02-13 09:34:13

2025-04-26 09:25:00

模型推理AI

2025-01-10 11:42:40

2024-05-09 08:33:33

2024-08-19 08:45:00

開源模型

2021-08-20 10:12:35

Python蒙特卡洛股票

2023-10-27 13:05:23

模型訓練

2025-05-26 08:52:00

2021-07-21 16:56:33

人工智能機器學習技術

2024-07-10 09:37:57

2025-06-30 08:36:00

AI模型強化學習

2024-06-17 12:39:37

2021-09-02 16:10:21

人工智能機器學習技術

2021-09-23 09:35:00

編程技能開發

2022-10-17 15:04:40

量子計算

2024-10-14 13:45:00

AI模型

2025-07-02 09:21:30

2020-12-24 13:08:33

計算機互聯網 技術

2023-04-25 13:46:42

AI開源
點贊
收藏

51CTO技術棧公眾號

色狠狠桃花综合| 狠狠色狠狠色合久久伊人| 亚洲福利在线播放| 国产一区亚洲二区三区| 男人天堂手机在线| 国产福利一区二区三区| 91精品国产网站| 国产精品成人无码免费| 精品中文在线| 天天操天天色综合| 天天爽天天狠久久久| aaa一区二区三区| 久久久综合久久久| 一级毛片视频在线| 粉嫩在线一区二区三区视频| 日本电影亚洲天堂| 国产成人av免费在线观看| 精品伊人久久久| 欧美男人的天堂一二区| 黄网站欧美内射| 尤物在线视频| 久久精品夜夜夜夜久久| 成人羞羞视频免费| 青青国产在线视频| 亚洲国产一区二区精品专区| 在线视频欧美日韩精品| www国产视频| 99久久99九九99九九九| 日本道免费精品一区二区三区| 天天想你在线观看完整版电影免费| 图片区 小说区 区 亚洲五月| 精品一区二区在线视频| 国产91免费看片| 国产无遮挡裸体免费视频| 国产精品久久占久久| 亚洲男人的天堂在线播放| 午夜免费福利影院| 久久精品一级| 欧美精品第1页| 精品久久久久久久无码| 蜜桃精品久久久久久久免费影院| 玖玖爱这里只有精品| 欧美日韩色图| 亚洲天堂精品在线| 久久亚洲AV成人无码国产野外| 日韩在线亚洲| 9191精品国产综合久久久久久| 欧美精品一区二区三区免费播放| av在线理伦电影| 亚洲激情成人在线| 国产精品亚洲天堂| 幼a在线观看| 国产精品日日摸夜夜摸av| 欧美国产二区| 免费一级在线观看播放网址| k8久久久一区二区三区 | 超碰手机在线观看| 久久麻豆精品| 色偷偷88888欧美精品久久久| 国产精品无码一区二区三区免费 | 亚洲综合影视| 亚洲激情第一区| 久久久久久久免费视频| а√资源新版在线天堂| 18欧美亚洲精品| 天天综合五月天| 在线黄色网页| 亚洲高清视频在线| 日韩中字在线观看| 色戒汤唯在线| 在线观看国产91| 国产又大又黄又猛| 精品国产亚洲一区二区三区大结局| 欧美人妇做爰xxxⅹ性高电影| 日韩成人精品视频在线观看| 国产免费区一区二区三视频免费| 日韩欧美一级特黄在线播放| 日韩精品人妻中文字幕有码| 天美av一区二区三区久久| 亚洲欧美日韩成人| 最新黄色av网址| 中文字幕一区二区三区在线视频 | 女人高潮被爽到呻吟在线观看| 欧美日韩午夜视频在线观看| 狠狠操精品视频| 日韩毛片网站| 精品久久国产97色综合| 亚洲第一香蕉网| 日韩一级毛片| 久久久久久久91| 久久久黄色大片| 精品一区二区三区视频| 日韩精品色哟哟| 在线看日韩av| 青娱乐国产在线视频| 99在线精品免费视频九九视| 日韩av片电影专区| 亚洲天堂avav| 成人一区在线观看| 婷婷五月色综合| 手机在线免费看av| 一本大道久久a久久精二百 | 日韩影片中文字幕| 555www色欧美视频| 泷泽萝拉在线播放| 亚洲天天影视网| 欧美最猛黑人xxxx黑人猛叫黄 | 欧美一二三区在线| 日韩在线免费观看av| 91精品福利| 国产精品久久电影观看| 亚洲国产精品suv| 日本一区二区三区四区| 9色porny| 久久久加勒比| 国产午夜精品理论片a级探花| 天堂av免费在线| 亚洲伊人观看| www.久久爱.cn| 激情在线小视频| 日韩欧美成人免费视频| 中文字幕在线播放一区二区| 精品国产乱码久久久久久果冻传媒| 欧美国产日韩一区二区三区| 中文字幕欧美色图| 2021国产精品久久精品| 日本免费a视频| 伊人久久综合网另类网站| 亚洲欧美日韩另类| 日韩 欧美 亚洲| 国产成人综合网| 天天干天天操天天干天天操| 成人软件在线观看| 日韩大陆欧美高清视频区| 久草视频中文在线| 国产伦精一区二区三区| 在线成人av电影| 日韩经典一区| 国产一区二区三区丝袜| 91精品国产高清一区二区三密臀| 成人性视频免费网站| 日本天堂免费a| 中文字幕综合| 色一区av在线| 中文在线观看av| 欧美激情一区二区| 99视频在线免费| 国内精品久久久久久99蜜桃| 日本久久亚洲电影| 男人av在线| 日韩欧美在线免费观看| 黄色在线观看av| 亚洲欧美日本国产专区一区| 久精品国产欧美| 韩国成人二区| 亚洲女人初尝黑人巨大| 亚洲GV成人无码久久精品| 久久综合av免费| 黄色片久久久久| 九九热精品视频在线观看| 国产91亚洲精品| 国产在线观看高清视频| 欧美图区在线视频| 青青操在线播放| 国产一区中文字幕| 国产乱子伦精品视频| 亚洲视频国产精品| 18久久久久久| 国产福利在线观看| 欧美日韩成人综合在线一区二区| 国产在视频线精品视频| 国产精品资源在线看| 国产精品无码电影在线观看| 欧美顶级毛片在线播放| 日本精品久久久久影院| 91网在线播放| 日韩一区二区高清| 黄色小视频在线免费看| 久久综合网色—综合色88| 能在线观看的av网站| 99精品美女| 成人免费看片网站| 欧美国产大片| 久久精品精品电影网| 黄色福利在线观看| 一本色道久久加勒比精品| 山东少妇露脸刺激对白在线| 国内精品免费在线观看| 东北少妇不带套对白| 视频一区中文| 亚洲淫片在线视频| 中文在线资源| 久久精品国产成人| 外国精品视频在线观看 | 久久人人爽人人爽人人片亚洲| 成人av一区二区三区在线观看| 欧美色欧美亚洲高清在线视频| 色屁屁草草影院ccyy.com| 国产原创一区二区| 日本一本二本在线观看| 亚洲免费二区| 你懂的视频在线一区二区| 亚洲爽爆av| 欧美在线亚洲一区| 最近中文字幕免费mv2018在线| 亚洲乱码一区av黑人高潮| 国产农村妇女毛片精品| 日韩欧美在线免费观看| 麻豆一区二区三区精品视频| 久久精品一区二区三区不卡牛牛| 韩国三级丰满少妇高潮| 日韩经典中文字幕一区| 国产无限制自拍| 午夜久久免费观看| 日韩av电影免费观看| 99精品在免费线中文字幕网站一区| 国产精品第三页| 超碰在线97国产| yellow中文字幕久久| 你懂的视频在线| 亚洲第一精品夜夜躁人人躁| 国产一区二区三区三州| 色婷婷亚洲婷婷| 亚洲国产精一区二区三区性色| 自拍偷在线精品自拍偷无码专区 | 国产精品久久婷婷| 在线视频欧美精品| 天天操天天摸天天干| 尤物视频一区二区| 中文字幕求饶的少妇| 国产午夜精品福利| 右手影院亚洲欧美| 成人自拍视频在线| 性生活在线视频| 老司机午夜精品| 欧美性猛交久久久乱大交小说| 亚洲精品偷拍| 久久综合久久久久| 国产精品vip| 精品免费久久久久久久| 91成人国产| 国产一级黄色录像片| 91精品国产麻豆国产在线观看| 亚洲国产另类久久久精品极度| 国产91精品对白在线播放| 九九九热999| 色综合久久中文| 快播日韩欧美| 免费av一区二区三区四区| 美女被啪啪一区二区| 羞羞色国产精品网站| 久久一区免费| 久久av免费| 明星裸体视频一区二区| 久久91精品| 亚洲精蜜桃久在线| 日韩毛片视频| 自拍偷拍一区二区三区| 91精品亚洲| 免费看日b视频| 欧美日一区二区在线观看| 国产成人亚洲综合无码| 在线观看视频日韩| 久久精品视频16| 玖玖精品视频| 牛夜精品久久久久久久| 久久99国产精品久久99| 国产高清999| 成人免费va视频| 亚洲av无码一区二区二三区| 国产亚洲欧洲997久久综合 | 亚洲免费观看高清完整| 久久综合综合久久| 精品久久久久久久久久国产| 中文字幕国产在线观看| 欧美色视频一区| av手机免费看| 日韩精品视频免费在线观看| 精品成人一区二区三区免费视频| 中文字幕欧美日韩| 三级资源在线| 日韩av电影免费观看高清| 国产激情久久| 岛国视频一区| 你懂的一区二区三区| 一区二区三区四区五区视频| 欧美久久视频| 日本男人操女人| 国产精品资源网| 天天躁日日躁aaaa视频| 成人免费在线观看入口| 久久夜靖品2区| 欧美日韩精品一区二区天天拍小说 | 中文字幕永久免费| 久久久精品国产免大香伊| 免费在线观看a级片| 五月婷婷综合在线| 国产男女裸体做爰爽爽| 亚洲欧美国产精品久久久久久久| 久久bbxx| 欧美一级视频免费在线观看| 91麻豆精品| 欧美一区2区三区4区公司二百 | 久久精视频免费在线久久完整在线看| 成年网站在线视频网站| 国产精品永久免费视频| 日韩在线黄色| 亚洲色图都市激情| 日韩成人精品在线| 中文字幕乱码在线| 亚洲另类春色国产| 中文字幕 日韩有码| 精品sm在线观看| 在线观看h片| 欧美亚洲视频在线观看| 亚洲小说春色综合另类电影| 天堂精品一区二区三区| 国产一区白浆| 中文字幕人妻熟女在线| 亚洲天堂2014| 中文在线免费看视频| 亚洲精品久久久久久下一站 | 亚洲免费高清视频在线| 中文字幕 人妻熟女| 日韩av在线最新| 蜜臀av国内免费精品久久久夜夜| 国产精品一区二区久久久| 香蕉久久精品| 国产精品自拍片| 成人一级视频在线观看| 2021亚洲天堂| 欧美一区二区成人| 麻豆传媒在线免费| 国产欧美精品久久久| 精品视频亚洲| 欧美色图另类小说| av亚洲精华国产精华| 久久97人妻无码一区二区三区| 欧美老女人第四色| 成年人视频网站在线| 国产成人短视频| 九九在线精品| 国产一区二区三区精彩视频| 99久久综合色| 日韩 欧美 综合| 亚洲精美色品网站| 123区在线| 国产伦精品一区二区三区在线| 欧美三级小说| 黄色av电影网站| 婷婷国产v国产偷v亚洲高清| 视频一区 中文字幕| 性欧美长视频免费观看不卡| 都市激情久久| 国产视频九色蝌蚪| 26uuu久久天堂性欧美| 日本中文字幕第一页| 一区二区亚洲精品国产| 色婷婷成人网| 老司机午夜免费福利视频| 成人一区二区三区视频 | 二区在线播放| 91在线免费看片| 亚洲天堂偷拍| 国产精品一级黄片| 91官网在线免费观看| 啊v在线视频| 成人一区二区电影| 激情婷婷久久| 高潮毛片无遮挡| 欧美日本一区二区三区四区 | 亚洲女厕所小便bbb| 亚洲国产www| 人九九综合九九宗合| 北条麻妃国产九九九精品小说| 中国黄色片一级| 一区二区免费在线播放| 性感美女福利视频| 国产精品免费久久久| 欧美在线高清| 美女爆乳18禁www久久久久久 | 性生交免费视频| 中文字幕五月欧美| 日本高清视频网站| 国产精品久久久久999| 综合久久婷婷| 一卡二卡三卡四卡| 日韩午夜激情av| 老司机成人影院| 欧美大片免费播放| 久久综合久久99| 国产乱码精品一区二区| 91sa在线看| 91精品久久久久久久久久不卡| 精品无码人妻少妇久久久久久| 欧美日韩三级在线| 国内精彩免费自拍视频在线观看网址| 相泽南亚洲一区二区在线播放| 国产91富婆露脸刺激对白 | 日韩视频免费观看高清完整版 |