精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI版三個臭皮匠!ChatGPT/Gemini/DeepSeek合體拿下AGI測試最高分

人工智能 新聞
那個由Transformer作者之一Llion Jones創立的明星AI公司Sakana AI,提出了新方法AB-MCTS。

ChatGPT的對話流暢性、Gemini的多模態能力、DeepSeek的長上下文分析……

能不能讓它們強強聯合,共同解決問題呢?

那個由Transformer作者之一Llion Jones創立的明星AI公司Sakana AI,提出了新方法AB-MCTS,核心思想是:

最偉大的成就往往源于不同思想的協作,我們相信這一原則同樣適用于人工智能。

AB-MCTS,全稱為自適應分支蒙特卡洛樹搜索(Adaptive Branching Monte Carlo Tree Search),是一種使多個人工智能模型同時處理問題的算法。模型之間交換并完善建議,協同工作,就像人類團隊一樣。

圖片

在具有挑戰性的ARC-AGI-2基準測試中,多LLM AB-MCTS解決的問題比單獨工作的任何單個模型(Single-LLM AB-MCTS)都多。

有幾種情況下,只有不同模型的組合才能得出正確答案。

圖片

Sakana AI已將該算法以TreeQuest的名稱開源,鏈接可見文末。

兩種搜索策略

圖片

AB-MCTS結合了兩種不同的搜索策略:它可以完善現有解決方案(深度搜索),也可以嘗試全新的方法(廣度搜索)。

主要的技術挑戰是將無界分支引入MCTS

標準MCTS僅選擇并擴展葉節點(即每個節點最多被擴展一次),且擴展會添加固定數量的子節點。然而,由于在非零溫度下對LLM的每個查詢都可能從相同提示中產生不同的輸出,分支因子理論上無限。

為了充分利用MCTS的無界分支的潛在性能提升,AB-MCTS允許那些已經擴展過一次的節點再次被擴展并進一步分支,并引入GEN節點來明確表示生成新子節點的動作。

在AB-MCTS的搜索樹中,每個節點N均附帶一個GEN子節點。選中帶有GEN節點的父節點時,會從N生成一個新子節點。

圖片

與傳統的MCTS不同,AB-MCTS不會將寬度作為靜態超參數固定。

相反,在搜索樹的每個節點上,AB-MCTS會自適應地決定是探索(“變寬”)通過生成新的候選響應,還是利用(“變深”)通過改進現有的響應,利用外部反饋信號。

在底層,AB-MCTS通過貝葉斯后驗預測分布估計節點潛力,并用Thompson采樣選擇動作,以確保每次擴展都以原則性的方式平衡探索和利用。

這種設計自然地擴展了多次采樣,使AB-MCTS能夠在必要時利用LLMs多樣化且龐大的輸出空間。

在以上基礎上,Sakana AI還提出了兩個變體:AB-MCTS-M和AB-MCTS-A。

簡單地說:

  • AB-MCTS-M:更分層。使用混合效應模型共享子樹間的統計信息,通過分層貝葉斯推斷平衡全局與局部探索。
  • AB-MCTS-A:更輕量。通過CONT節點顯式分離“生成”與“優化”動作,并基于共軛先驗實現高效后驗更新,簡化計算。

圖片


其利斷金

圖片

對AB-MCTS進行基準測試,結果顯示,AB-MCTS在各種基準測試和LLMs中始終表現出色,獲得的平均排名最高并優于既定基線。

這種持續的成功源于AB-MCTS獨特的動態調整搜索策略的能力,它通過精確平衡探索和利用來適應每個問題的不同需求,而基線方法中幾乎缺乏這種適應性。

圖片

LiveCodeBench和CodeContest

上圖左側和中部報告了GPT-4o在LiveCodeBench和CodeContest上的成功率與生成預算的關系,可以看到,所有方法在計算預算增加時都表現出性能提升。在這兩個基準測試中,AB-MCTS算法通常優于基線方法。

在LiveCodeBench,即使預算很小,AB-MCTS也開始超越基線方法;在CodeContest,預算為32及以上時,AB-MCTS表現出優于基線的性能。

ARC-AGI

上圖右側展示了GPT-4o在ARC-AGI這一特別具有挑戰性的基準測試上的性能表現??梢钥吹?,重復采樣在該設置中證明是一種強大的基線,這表明對于這項任務,廣泛的探索非常重要

雖然標準MCTS在預算增加時只能帶來微小的改進,但AB-MCTS框架實現了與重復采樣相當的性能。這表明AB-MCTS能夠通過在有利時動態擴展其搜索范圍來有效地探索潛在解。

圖片

MLE-Bench

上表展示了使用GPT-4o在MLE-Bench三個競賽中的性能表現。由于MLE-Bench在訓練和評估機器學習模型時需要大量的GPU資源,研究團隊僅使用了GPT-4o,并專注于基線方法和AB-MCTS-M。

結果顯示,最佳性能的基線方法在不同競賽中有所不同,這再次強調了不同任務受益于不同的探索-利用權衡。

相比之下,AB-MCTS-M在這些任務中始終表現出色。

這種在不同競賽中的一致成功突顯了AB-MCTS-M在有效適應其搜索策略以應對不同問題結構方面的內在優勢。

圖片

為了定量分析AB-MCTS如何平衡探索與利用,論文的研究團隊還考察了生成的搜索樹在每個深度的平均深度和平均寬度。

如上圖顯示,與標準MCTS相比,AB-MCTS方法傾向于生成更寬的樹。這是因為AB-MCTS可以從任何現有節點自適應地決定探索更寬(選擇GEN節點),而標準MCTS則不能。這種機制使得在不同樹深度上能夠進行更靈活的探索。

除了探索寬度的靈活性之外,AB-MCTS在順序優化表現優異的基準測試中也取得了優異的性能,這表明AB-MCTS通過選擇現有子節點進行優化,能夠有效地識別并利用了有潛力的分支。這種自適應特性使其能夠結合探索與利用的優勢,在多種基準測試中表現出強大的性能。

圖片

為了研究AB-MCTS的擴展特性,使用DeepSeek-V3對ARC-AGI的實驗進行了擴展,將生成預算增加到512。如上圖所示,隨著預算從200增加到500,AB-MCTS的性能繼續顯著提高,而重復采樣的改進率開始趨于平穩。

標準MCTS在增加預算后也繼續改進,但與AB-MCTS方法相比,其成功率顯著較低。這種性能差距表明,AB-MCTS在大型計算規模下更有效地將搜索導向搜索樹中更有希望的分支。

圖片

上圖展示了由AB-MCTS-M和標準MCTS生成的搜索樹示例。這些可視化展示了AB-MCTS-M相比標準MCTS具有更強的自適應分支特性。

這種自適應性表明,AB-MCTS-M在整個搜索過程中靈活地平衡探索與利用,能夠動態分配預算以探索多樣化的新候選者(“拓展寬度”)和優化有潛力的候選者(“深入挖掘”)。

以上結果表明,即使考慮到重復采樣的固有優勢,AB-MCTS仍是一種有前景的方法,能夠高效利用生成預算在各種場景中取得更優結果。

圖片

在具有挑戰性的ARC-AGI-2基準測試中,AB-MCTS結合ChatGPT、Gemini和DeepSeek解決了30%的ARC-AGI-2謎題,而頂尖的獨立模型僅解決了23%。

結果顯示,有幾種情況下,只有不同模型的組合才能得出正確答案。

自然啟發與創新之路

圖片

上述關于AB-MCTS的研究并非憑空產生,它基于Sakana AI 2024年在進化模型融合方面的工作,該團隊將重點從“混合以創造”轉向“混合以使用”現有的強大AI。

他們是這樣說的:

在Sakana AI,我們始終致力于通過應用受自然啟發的原則(如進化和集體智能)來開創新型AI系統。

他們也確實這樣做了:

不僅僅是2024年的進化合并模型,就在今年5月,Sakana AI還和哥倫比亞大學的科研人員共同開發了達爾文-哥德爾機(DGM)——這是一個旨在自我進化的AI框架,并非針對固定目標進行優化,而是從生物進化與科學發現中汲取靈感,通過開放式搜索和持續的自我修改來生成新的解決方案。

圖片

而前段時間,有兩位物理學家以生物系統自我組裝的過程為參考,揭示了擴散模型“創造力”的本質……

這些發現和創造都是“自然式啟發”的體現。

責任編輯:張燕妮 來源: 量子位
相關推薦

2018-08-23 09:54:47

人工智能集成學習

2024-01-18 11:45:35

視覺模型蘋果

2023-01-26 14:13:57

2025-10-13 09:13:00

2023-06-25 13:37:09

GPT-4AI

2012-04-06 15:28:25

2023-08-18 13:18:25

2024-10-24 15:02:34

2021-10-19 15:11:44

API保護

2014-09-29 10:00:36

極進網絡Gartner

2025-02-10 11:14:31

2021-09-29 16:31:29

WAAP

2018-01-22 10:00:44

AICV小程序

2021-06-29 15:33:28

谷歌Transformer模型

2023-12-07 11:11:01

2023-08-14 10:57:00

ChatGPTOpenAI

2025-04-14 09:17:00

2022-08-24 10:47:37

Commvault
點贊
收藏

51CTO技術棧公眾號

国产精品久久久99| 欧美黄污视频| 欧美亚洲高清一区二区三区不卡| 天堂一区二区三区| 国产v在线观看| 影音先锋久久资源网| 亚洲欧美在线播放| 九色porny自拍| 黄页在线观看免费| 久久久久久久久伊人| 成人黄色免费片| 国产在线成人精品午夜| 国产麻豆精品久久| 精品日韩99亚洲| 国产视频在线视频| 久草在线资源站资源站| 国产精品视频免费看| 国产精品乱子乱xxxx| 97人妻精品视频一区| 国模大胆一区二区三区| 亚洲午夜精品久久久久久性色 | 久久久久在线| 欧美裸体男粗大视频在线观看| www.自拍偷拍| 超碰成人免费| 777欧美精品| 成人中文字幕av| √天堂8资源中文在线| 中文字幕人成不卡一区| 欧美精品123| 欧美一区,二区| 久久精品国产99| 国产成人av在线播放| 日本熟妇色xxxxx日本免费看| 91精品天堂福利在线观看| 亚洲欧美日韩精品| 北京富婆泄欲对白| 日韩在线观看一区二区三区| 精品视频在线视频| 国产成人精品无码播放| free性护士videos欧美| 亚洲一区二区av电影| 五月天av影院| 日本在线免费| 国产精品国产自产拍高清av| 欧美日韩精品一区| 欧美女v视频| 91蝌蚪porny九色| 国产一区自拍视频| 人妻视频一区二区三区| 福利一区二区在线| yellow视频在线观看一区二区 | 久久伊人成人网| 亚洲欧美色图| 麻豆国产va免费精品高清在线| 国产调教在线观看| 波多野结衣在线播放一区| 亚洲人成绝费网站色www| av男人的天堂av| 欧美精品第一区| 亚洲欧美成人精品| 免费看黄色的视频| 成人在线免费观看91| 中文字幕国产精品久久| 国精产品一区一区| 亚洲精品小说| 欧美 日韩 国产 激情| 久久久久久国产精品视频| 欧美大片aaaa| 久久影院资源网| 永久免费看黄网站| 亚洲性色视频| 欧美日韩高清丝袜| caoprom在线| 午夜精品久久久久久久蜜桃app| 91网站在线观看免费| 美洲精品一卡2卡三卡4卡四卡| 亚洲国产综合视频在线观看| 黄色一级视频在线播放| 国产乱码精品一区二三赶尸艳谈| 91精品999| 日韩福利在线观看| 欧美一区二区久久| 国产69视频在线观看| 久久视频在线观看| 亚洲一区二区黄| www日韩在线| 红桃视频亚洲| 国产91久久婷婷一区二区| 在线视频播放大全| 国产sm精品调教视频网站| 久久精品日产第一区二区三区| 久草在线网址| 亚洲色图在线视频| 久久综合九色综合88i| 欧美123区| 91精品国产乱| 欧美特级黄色录像| 欧美/亚洲一区| 欧美在线视频观看免费网站| 在线免费观看日韩视频| 成人免费毛片app| 日韩成人av电影在线| www.欧美日本韩国| 一本到不卡精品视频在线观看 | 少妇的滋味中文字幕bd| 欧美日韩国产成人精品| 国产成人亚洲综合| 亚洲精品一区二区三区蜜桃| 久久久www成人免费毛片麻豆 | 波多野结依一区| 欧美性感一类影片在线播放| 国产无套精品一区二区三区| 成人羞羞网站| 538国产精品一区二区免费视频| 又污又黄的网站| 91视视频在线直接观看在线看网页在线看| 五月天色婷婷综合| 午夜无码国产理论在线| 亚洲国产欧美一区二区三区同亚洲| 亚洲激情图片网| 首页国产欧美久久| 国产一区二区三区免费不卡| 黄色网在线免费看| 在线看国产日韩| 精品黑人一区二区三区观看时间| 自拍日韩欧美| 国产精品影院在线观看| 蜜桃视频在线观看视频| 亚洲一二三四久久| 下面一进一出好爽视频| 色综合狠狠操| 国产精品美女午夜av| 欧美人体大胆444www| 午夜久久久影院| 欧美图片自拍偷拍| 欧美va天堂在线| 亚洲自拍偷拍视频| 国产精品久久麻豆| 欧美日韩黄色影视| 国产91在线播放九色| 日本欧美一区二区三区| 日本一区网站| 激情亚洲影院在线观看| 国产亚洲精品综合一区91| 色老头在线视频| 国产亚洲欧洲一区高清在线观看| 欧美亚洲另类色图| 日本福利一区| 欧洲精品在线视频| 久草福利在线| 欧美剧情片在线观看| 二区三区四区视频| 国产乱子伦一区二区三区国色天香| 日本一级淫片演员| 国产一区二区av在线| 久久视频中文字幕| www.色视频| 亚洲成人精品在线观看| 中文字幕精品久久久| 国产亚洲午夜| 日本一区二区精品视频| 91大神在线观看线路一区| 亚洲欧美激情视频| 中文字幕 欧美激情| 亚洲欧洲99久久| 三大队在线观看| 亚洲美女啪啪| 欧美性bbwbbwbbwhd| 成人午夜毛片| 欧美国产日韩中文字幕在线| 欧美自拍偷拍第一页| 岛国av一区二区三区| a天堂中文字幕| 激情文学综合插| 国产天堂视频在线观看| 亚洲aaa级| 国产一区在线播放| a视频在线播放| 国产视频久久久久| 91麻豆成人精品国产| 一区二区高清在线| 人妻丰满熟妇aⅴ无码| 青青草国产精品亚洲专区无| 性生活免费观看视频| 欧美精品中文| 国产一区二区在线免费| 国产乱码在线| 这里只有精品视频| 欧美77777| 欧美无人高清视频在线观看| 婷婷色中文字幕| 国产午夜久久久久| 亚洲国产欧美日韩在线| 国产精品亚洲综合久久| 在线观看日韩片| 欧美激情99| 亚洲va国产va天堂va久久| 黄色18在线观看| 久久精品中文字幕电影| 天堂а√在线8种子蜜桃视频| 欧美日韩一级片在线观看| 黄色小视频在线免费看| 中文在线资源观看网站视频免费不卡| 九色91porny| 日本在线不卡视频| 欧美啪啪免费视频| 你懂的视频一区二区| 日本视频一区在线观看| 加勒比视频一区| 91影院在线免费观看视频| 中文字幕成在线观看| 久久综合久久八八| 国产在线视频网站| 亚洲电影免费观看高清完整版在线| 中文字幕 国产| 一道本成人在线| 国产精品成人久久| 亚洲视频免费看| 日本美女黄色一级片| 久久一留热品黄| 在线中文字日产幕| 国产美女在线观看一区| 中文字幕第100页| 久久福利一区| 自慰无码一区二区三区| 狠狠入ady亚洲精品经典电影| 少妇高潮流白浆| 日韩一区二区在线免费| 日本在线成人一区二区| 小说区图片区色综合区| 国产精品手机在线| 中文一区二区三区四区| 91久久精品国产91久久性色tv | 久久久久成人精品免费播放动漫| 视频欧美一区| 亚洲在线视频观看| 国产午夜精品一区在线观看| 国产日韩欧美夫妻视频在线观看| 欧美黑人粗大| 国产精品福利久久久| 欧美极品影院| 国产成人精品久久亚洲高清不卡| 国产美女高潮在线观看| 国内外成人免费激情在线视频网站 | 国产乱码精品一品二品| 亚洲色图欧美自拍| 国产精品一二三区在线| 久久发布国产伦子伦精品| 国产aaa一级片| 亚洲福利在线观看视频| 欧美蜜桃一区二区三区| 亚洲一区二区视频在线播放| 日本久久电影网| 精品黑人一区二区三区| 在线免费观看日本欧美| 中文字幕乱码一区二区| 欧美日韩中文字幕一区二区| 亚洲图片视频小说| 欧美高清视频不卡网| 国产三级三级在线观看| 日韩精品在线一区二区| 粉嫩av一区二区夜夜嗨| 亚洲精品456在线播放狼人| 无码国产精品高潮久久99| 日韩精品欧美激情| 国产高清在线观看| www.日韩.com| 污的网站在线观看| 97免费中文视频在线观看| 中文字幕高清在线播放| 国产精品入口免费视频一| 亚洲精品毛片| 99在线视频播放| 国产成人一区二区三区影院| 亚洲午夜精品一区二区| 综合国产精品| 久热免费在线观看| 激情欧美日韩一区二区| 一本色道久久hezyo无码| 久久午夜羞羞影院免费观看| 91无套直看片红桃在线观看| 亚洲男人天堂av网| 午夜毛片在线观看| 6080yy午夜一二三区久久| 日本精品一二区| 一区二区三区www| 手机av免费在线| 日本欧美一级片| 日韩欧美一级| 欧美13一14另类| 综合久久综合| 精品国产成人av在线免| 国产一区二区视频在线| 制服丝袜av在线| 国产精品国产三级国产aⅴ入口 | 国产欧美日韩最新| 91精品啪在线观看国产爱臀| 日韩精品资源| 亚洲小说欧美另类社区| 性生活免费在线观看| 9l国产精品久久久久麻豆| 手机在线免费看片| 色噜噜狠狠成人中文综合| www.天堂av.com| 在线视频欧美日韩精品| 啊啊啊久久久| 亚洲综合在线中文字幕| 国产91久久精品一区二区| 少妇久久久久久被弄到高潮| 日本成人中文字幕在线视频| 国产免费一区二区三区最新6| 国产精品二三区| 国产精品免费精品一区| 精品第一国产综合精品aⅴ| 黄色网页在线播放| 国产成人拍精品视频午夜网站| 国产suv精品一区二区四区视频| 一区二区免费电影| 久久人人超碰| 国产成人精品无码片区在线| 亚洲乱码日产精品bd| 最新国产中文字幕| 亚洲欧美中文另类| 2022成人影院| 精品高清视频| 亚洲国产国产亚洲一二三| 色偷偷中文字幕| 中文字幕亚洲电影| 中文字幕欧美人妻精品一区蜜臀| 亚洲毛片在线免费观看| 91九色porn在线资源| 97人人模人人爽视频一区二区| 久久精品av| jizz大全欧美jizzcom| 国产午夜精品久久| 神马久久久久久久| 亚洲欧美日韩成人| 午夜无码国产理论在线| 日韩欧美一区二区三区四区| 久久成人亚洲| 一区二区精品免费| 91豆麻精品91久久久久久| 日本高清中文字幕二区在线| 国内精品久久久久久影视8| swag国产精品一区二区| 日本久久久网站| 99这里只有精品| 欧美啪啪小视频| 亚洲欧美日本精品| 456成人影院在线观看| 婷婷四月色综合| 久久se精品一区二区| 中文乱码字幕高清一区二区| 91麻豆精品久久久久蜜臀| a级影片在线| 国产高清在线一区| 亚洲国产日韩欧美一区二区三区| 在线黄色免费网站| 精品久久久久久久久国产字幕| 婷婷国产在线| 国产精品久久久久av免费| 久久久综合色| 韩国三级在线播放| 五月综合激情日本mⅴ| 色哟哟在线观看| 国产精品免费小视频| 亚州av乱码久久精品蜜桃| 女人扒开腿免费视频app| 亚洲成人免费在线| 好男人免费精品视频| 国产日韩精品综合网站| 亚洲香蕉网站| 最近中文字幕免费视频| 欧美精品 日韩| 国产精品13p| 亚洲欧洲一区二区福利| 国产精品中文有码| 五月婷婷中文字幕| 日韩中文有码在线视频| 亚洲日本一区二区三区在线| 国产免费黄色av| 国产精品萝li| 日日躁夜夜躁白天躁晚上躁91| 日本久久精品视频| 欧美va天堂在线| 国产一区二区三区四区五区六区| 欧美精品日韩一本| 久久男人av资源站| 在线精品日韩| 99re这里只有精品首页| 波多野结衣一区二区三区在线 | 香蕉成人影院| 久久手机在线视频| 中文字幕av一区二区三区免费看 | 视频免费一区二区| 日本xxxxxxx免费视频| 玉米视频成人免费看| 国产系列在线观看| 国产精品成人一区二区三区|