精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

補齊Transformer規劃短板,田淵棟團隊的Searchformer火了

人工智能 新聞
為了提升 Transformer 的推理和規劃性能,近些年研究社區也提出了一些方法。一種最常見且有效的方法是模擬人類的思考過程:先生成中間「思維」,然后再輸出響應。

最近幾年,基于 Transformer 的架構在多種任務上都表現卓越,吸引了世界的矚目。使用這類架構搭配大量數據,得到的大型語言模型(LLM)等模型可以很好地泛化用于真實世界用例。

盡管有如此成功,但基于 Transformer 的架構和 LLM 依然難以處理規劃和推理任務。之前已有研究證明 LLM 難以應對多步規劃任務或高階推理任務。

為了提升 Transformer 的推理和規劃性能,近些年研究社區也提出了一些方法。一種最常見且有效的方法是模擬人類的思考過程:先生成中間「思維」,然后再輸出響應。比如思維鏈(CoT)提示法就是鼓勵模型預測中間步驟,進行按步驟的「思考」。思維樹(ToT)則使用了分支策略和評判方法,讓模型生成多個不同的思維路徑,然后從中選出最佳路徑。盡管這些技術通常是有效的,但也有研究表明,在很多案例中,這些方法會讓模型的性能下降,原因包括自我強制(self-enforcing)。

另一方面,在一個數據集上有效的技術可能無法很好地處理其它數據集,原因可能包括所涉及的推理類型發生了變化,比如從空間推理變成了數學推理或常識推理。

相較之下,傳統的符號式規劃和搜索技術卻能表現出很好的推理能力。此外,這些傳統方法計算得到的解決方案通常有形式上的保證,因為符號規劃算法通常遵循明確定義的基于規則的搜索過程。

為了讓 Transformer 具備復雜推理能力,Meta FAIR 田淵棟團隊近日提出了 Searchformer。


  • 論文標題:Beyond A?: Better Planning with Transformers via Search Dynamics Bootstrapping
  • 論文地址:https://arxiv.org/pdf/2402.14083.pdf

Searchformer 是一種 Transformer 模型,但針對迷宮導航和推箱子等多步規劃任務,它卻能計算出最優規劃并且所用搜索步驟數也能遠少于 A? 搜索等符號規劃算法。

為了做到這一點,該團隊提出了一種新方法:搜索動態引導(search dynamics bootstrapping)。該方法首先是訓練一個 Transformer 模型來模仿 A? 的搜索過程(如圖 1 所示,然后對其進行微調,使其能用更少的搜索步數找到最優規劃。

更詳細地說,第一步,訓練一個模仿 A? 搜索的 Transformer 模型。這里,該團隊的做法是針對隨機生成的規劃任務實例運行 A* 搜索。在執行 A? 時,該團隊會記錄執行的計算和最優規劃并將其整理成詞序列,即 token。這樣一來,所得到的訓練數據集就包含了 A? 的執行軌跡并編碼了有關 A? 本身的搜索動態的信息。然后,訓練一個 Transformer 模型,讓其能針對任意規劃任務沿最優規劃生成這些 token 序列。

第二步,使用專家迭代(expert iteration)方法進一步提升使用上述經過搜索增強的序列(包含 A? 的執行軌跡)訓練的 Searchformer。專家迭代方法可讓 Transformer 憑借更少的搜索步驟生成最優解。這個過程會得到一種神經規劃算法,其隱式地編碼在該 Transformer 的網絡權重之中,并且它有很高的概率以少于 A? 搜索的搜索步數找到最優規劃。比如說,在執行推箱子任務時,新模型能解答 93.7% 的測試任務,同時搜索步數比 A? 搜索平均少 26.8%。

該團隊表示:這為 Transformer 超越傳統符號規劃算法鋪平了道路。

實驗

為了更好地理解訓練數據和模型參數量對所得模型性能的影響,他們進行了一些消融研究。

他們使用了兩類數據集訓練模型:一種的 token 序列中只包含解(solution-only,其中只有任務描述和最終規劃);另一種則是搜索增強型序列(search-augmented,其中包含任務描述、搜索樹動態和最終規劃)。

實驗中,該團隊使用了 A? 搜索的一種確定性和非確定性變體來生成每個序列數據集。

迷宮導航

在第一個實驗中,該團隊訓練了一組編碼器 - 解碼器 Transformer 模型來預測 30×30 迷宮中的最優路徑。

圖 4 表明,通過預測中間計算步驟,可在數據量少時獲得更穩健的性能表現。

圖片

圖 5 給出了僅使用解訓練的模型的性能。

圖 6 展示了任務難度對每個模型的性能的影響。

整體而言,盡管當使用的訓練數據集足夠大和足夠多樣化時,僅使用解訓練的模型也能預測得到最優規劃,但當數據量少時,經過搜索增強的模型的表現明顯好得多,并且也能更好地擴展用于更困難的任務。

推箱子

圖片

為了測試能否在不同且更復雜的任務(具有不同的 token 化模式)上得到類似的結果,該團隊還生成了一個推箱子的規劃數據集進行測試。

圖 7 展示了每種模型針對每個測試任務生成正確規劃的概率。

可以看到,和上一個實驗一樣,通過使用執行軌跡進行訓練,搜索增強型模型的表現優于僅使用解訓練的模型。

Searchformer:通過引導方法提升搜索動態

最后一個實驗,該團隊研究了搜索增強型模型可以如何迭代提升,從而憑借更少的搜索步數計算出最優規劃。這里的目標是在縮短搜索軌跡長度的同時依然得到最優解。

圖 8 表明,新提出的搜索動態引導方法能夠迭代式地縮短 Searchformer 模型生成的序列的長度。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-10-16 13:50:00

模型AI

2025-10-08 10:19:29

2024-12-12 09:00:00

2024-12-19 09:48:07

2023-06-12 09:57:22

AIChatGPT

2023-03-17 08:28:17

GPT-4AI

2024-10-28 08:50:00

2025-02-17 09:30:00

AI訓練模型

2022-05-06 07:31:01

useEventReactHook

2023-12-07 06:51:18

AI模型

2024-10-17 14:10:00

模型訓練

2023-06-30 09:49:23

模型Meta

2023-08-04 13:42:41

2023-06-28 18:10:27

羊駝家族大模型集體進化

2025-06-20 08:47:00

量子計算AI模型

2020-09-22 09:54:19

谷歌Android開發者

2021-10-28 15:41:07

計算機AI 技術

2025-10-23 12:28:40

2019-04-25 10:20:24

Transformer神經網絡模型

2022-12-25 13:46:37

生成器
點贊
收藏

51CTO技術棧公眾號

久久天天躁狠狠躁夜夜av| 日韩欧美在线网址| 高清不卡日本v二区在线| aaa人片在线| 99久久综合狠狠综合久久aⅴ| 日韩欧美综合一区| 缅甸午夜性猛交xxxx| 91官网在线| kk眼镜猥琐国模调教系列一区二区| 国产xxx69麻豆国语对白| 男女性高潮免费网站| 亚洲精品国产精品粉嫩| 欧美一级搡bbbb搡bbbb| 青青草精品视频在线观看| 欧美伦理免费在线| 国产精品第五页| 久久精品日韩精品| 精品久久久中文字幕人妻| 日韩电影在线一区二区三区| 欧美日本精品在线| jizz日本在线播放| 网曝91综合精品门事件在线| 911久久香蕉国产线看观看| 在线亚洲一区二区| 精品少妇人妻av免费久久洗澡| 色综合久久久久综合一本到桃花网| 99久久精品国产精品久久| 成人免费网视频| 成人免费毛片视频| 国产深夜精品| 国内精品小视频| caoporn91| 91久久夜色精品国产按摩| 国产丝袜精品视频| 国产二级一片内射视频播放| 奇米一区二区| 欧美日韩第一区日日骚| 手机看片福利日韩| 欧美一级大片| 色婷婷久久一区二区三区麻豆| 国产精品久久..4399| 欧美黑人xx片| 亚洲一区av在线| 国产一区二区四区| 日本高清成人vr专区| 亚洲欧美电影一区二区| 伊人情人网综合| 久操视频在线| 亚洲视频在线观看一区| 一区二区三区日韩视频| 久久bbxx| 亚洲一区欧美一区| 妞干网视频在线观看| 欧美日韩经典丝袜| 亚洲成人综合网站| 99热在线这里只有精品| 免费看av不卡| 欧美日韩你懂得| 日韩av片免费观看| 亚洲啊v在线免费视频| 日韩写真欧美这视频| 色哟哟免费视频| 动漫av一区| 日韩精品久久久久久久玫瑰园| 97人妻天天摸天天爽天天| 男人的天堂久久| 亚洲自拍电影| 日韩亚洲欧美一区| 中文字幕一区三区久久女搜查官| 婷婷精品在线观看| 伊人久久精品视频| 三上悠亚作品在线观看| 欧美黄污视频| 欧美亚洲视频一区二区| 波多野结衣绝顶大高潮| 六月丁香婷婷久久| 91情侣在线视频| 天堂a中文在线| 国产精品成人免费| 国产精品久久国产| 成人福利av| 欧美高清激情brazzers| 蜜臀aⅴ国产精品久久久国产老师| 美女av一区| 中文字幕日韩av综合精品| √天堂中文官网8在线| 99热免费精品| 国产日韩换脸av一区在线观看| 国产夫妻性生活视频| 99久久精品国产麻豆演员表| 亚洲国产精品综合| 波多野结衣久久| 欧美揉bbbbb揉bbbbb| 麻豆短视频在线观看| 精品日韩欧美一区| 国产69精品久久久久99| 亚洲婷婷久久综合| 国产91丝袜在线播放九色| 日本一区高清不卡| 乱插在线www| 精品视频一区二区不卡| 日本不卡视频一区| 久久综合成人| 日韩av电影手机在线观看| 国产老女人乱淫免费| www久久精品| 超碰10000| 成人综合网站| 亚洲精品福利免费在线观看| 老熟妻内射精品一区| 亚洲欧美久久久| 99在线观看视频网站| 六月婷婷久久| 久久99久久| 亚洲成年人网站在线观看| 无尽裸体动漫2d在线观看| 欧美美女啪啪| 欧美激情在线观看视频| 国产精品久久久久久久免费看| 91在线观看下载| 91免费国产精品| 粉嫩一区二区三区在线观看| 一本大道亚洲视频| 成人毛片18女人毛片| 国产69精品一区二区亚洲孕妇| 亚洲国产精品一区在线观看不卡 | 国产精品国产三级国产aⅴ原创| 无码粉嫩虎白一线天在线观看| 国产精品美女久久久久| 在线观看国产精品淫| 特级西西444www大精品视频免费看| 国产成人aaa| 蜜臀av.com| 人人九九精品视频| 欧美成人免费在线观看| 一级片aaaa| 中文字幕一区二区在线播放| 手机在线看福利| av伊人久久| 国产精品久久久久久影视| 国产在线小视频| 日本道在线观看一区二区| 欧美特黄一区二区三区| 老鸭窝亚洲一区二区三区| 麻豆亚洲一区| av在线日韩| 在线视频中文亚洲| 91一区二区视频| 国产嫩草影院久久久久| 日韩欧美国产片| 婷婷综合伊人| 91精品国产综合久久久久久丝袜| а√资源新版在线天堂| 日韩精品一区二区三区中文不卡| 精品97人妻无码中文永久在线| 国产福利一区二区三区| 成人午夜精品久久久久久久蜜臀| 美女福利一区| 国产精品一区高清| 欧美精品手机在线| 日本高清视频免费看| 欧美日韩中文在线观看| 精品无码国产污污污免费网站 | 亚洲网色网站| 99久久精品无码一区二区毛片| 成人福利影视| 亚洲色图欧美制服丝袜另类第一页| 国产黄网在线观看| 1024国产精品| 国产高潮失禁喷水爽到抽搐| 中文一区二区| 一区二区视频在线播放| 日韩精品一级| 97在线视频国产| 户外极限露出调教在线视频| 欧美日韩的一区二区| 国产亚洲精品码| 久久久久免费观看| 91香蕉视频免费看| 性xx色xx综合久久久xx| 国产精品夜夜夜爽张柏芝| 久久亚洲道色| 国产精品视频网| 日本片在线看| 中文字幕成人在线| 殴美一级特黄aaaaaa| 91九色02白丝porn| 欧美极品aaaaabbbbb| 久久久久一区二区三区四区| 欧美体内she精高潮| 久久午夜精品| 久久久久久久久久久综合| 久久99国内| 粉嫩高清一区二区三区精品视频| 精品免费av一区二区三区| 欧美猛少妇色xxxxx| 国产乱视频在线观看| 欧美成人精品福利| 在线观看国产一区二区三区| 性久久久久久久| 婷婷激情四射网| 国产亚洲制服色| 第一页在线视频| 久久国产精品99久久久久久老狼 | 天堂网在线最新版www中文网| 日韩亚洲第一页| 日夜干在线视频| 91原创在线视频| 久久九九视频| 一区中文字幕电影| 国产欧美久久久久久| 二区三区不卡| 久久免费在线观看| √天堂8在线网| 最新中文字幕亚洲| 黄色在线小视频| 日韩av在线网| 欧性猛交ⅹxxx乱大交| 欧美一区二区免费视频| 亚洲无码精品在线播放| 色av一区二区| 亚洲 欧美 成人| 五月婷婷激情综合| 久久久精品国产sm调教网站| 最好看的中文字幕久久| 午夜影院黄色片| 久久久精品国产免费观看同学| 欧类av怡春院| 99久久er热在这里只有精品15| 午夜影院免费版| 国产资源精品在线观看| 不卡的在线视频| 毛片av一区二区三区| 国产一级做a爰片久久| 肉丝袜脚交视频一区二区| 国产精品97在线| 久久久蜜桃一区二区人| 成人在线免费观看av| 先锋亚洲精品| 精品久久一二三| 亚洲影院在线| 91看片就是不一样| 青青草伊人久久| 国产成人黄色网址| 精品一区二区精品| www.日本久久| 岛国一区二区三区| 中文字幕第3页| 在线视频观看一区二区| 国产精品资源在线观看| 亚洲av无码久久精品色欲| 国产精品一区一区| 人妻 日韩 欧美 综合 制服| 成人黄色av电影| 老熟妇精品一区二区三区| 91热门视频在线观看| av女人的天堂| 国产精品国产三级国产普通话蜜臀 | 91麻豆国产福利精品| 国产精久久一区二区三区| 国产精品免费视频观看| 日韩欧美国产成人精品免费| 亚洲卡通欧美制服中文| 欧美剧在线观看| 第一视频专区在线| 久久综合久中文字幕青草| 在线播放免费av| 91sa在线看| 国产韩日精品| dy888夜精品国产专区| 久久超级碰碰| 五码日韩精品一区二区三区视频| 日韩一区自拍| 国产一区二区三区小说| 久久久久国产精品一区二区 | 国产在视频一区二区三区吞精| 国产欧美精品一区二区| www.爱久久| 视频在线精品一区| 欧美日韩影院| 免费看a级黄色片| 国模少妇一区二区三区| 中文字幕无码人妻少妇免费| 国产精品丝袜黑色高跟| 黄页网站免费观看| 欧美伊人久久久久久久久影院 | 亚洲欧美在线人成swag| 官网99热精品| 色呦哟—国产精品| 国产素人在线观看| 精品一区二区三区欧美| 日韩av手机在线播放| 国产精品久线观看视频| wwwxxx亚洲| 日韩一区二区免费高清| 国产人成在线观看| 97国产精品免费视频| 天堂久久一区| 欧美下载看逼逼| 欧美三级特黄| 亚洲天堂网2018| 久久精品一区二区| 国产一级免费av| 欧美精品视频www在线观看 | 四虎影视精品| 欧美 日韩 国产精品| 蜜桃视频一区二区三区在线观看| 亚洲熟女一区二区| 亚洲精品视频一区| 少妇又紧又色又爽又刺激视频 | 精品视频一区三区九区| 日韩大片b站免费观看直播| 九九精品视频在线| 日韩第二十一页| 日本一区免费| 亚洲欧美日韩一区在线观看| 人妻av一区二区三区| 亚洲欧洲99久久| 在线观看毛片网站| 911久久香蕉国产线看观看| 国严精品久久久久久亚洲影视 | 久久蜜臀精品av| 日本一级一片免费视频| 欧美sm极限捆绑bd| av片在线观看| 亚洲一区二区三区毛片| 999精品色在线播放| 999精品视频在线| 久久久亚洲精品一区二区三区| 欧美成人aaaaⅴ片在线看| 欧美草草影院在线视频| 日本高清成人vr专区| 999在线观看免费大全电视剧| 午夜精品久久久久久久四虎美女版| 免费一级特黄录像| 欧美激情一区二区三区蜜桃视频| 国产精品久久久久久久久夜色| 亚洲理论在线a中文字幕| 在线男人天堂| 欧美成人免费在线| 性感少妇一区| 人妻少妇无码精品视频区| 欧美伊人久久久久久久久影院| 国产九色在线| 国产精品久久久av久久久| 精品日韩毛片| 爱爱爱爱免费视频| 樱桃国产成人精品视频| 亚洲欧美另类日韩| 2018日韩中文字幕| 国产一卡不卡| www.久久91| 一区二区三区四区精品在线视频| 性一交一乱一精一晶| 国模精品视频一区二区| 日韩a级大片| 亚洲乱码国产一区三区| 国产精品久久久久久久第一福利 | 99久久精品免费精品国产| 国产奶水涨喷在线播放| 日韩黄色在线免费观看| 欧美不卡高清一区二区三区| 亚洲资源视频| 成人精品小蝌蚪| 亚洲欧美日韩激情| 久久精品美女视频网站| 999在线精品| 凹凸日日摸日日碰夜夜爽1| 中文字幕制服丝袜成人av| 亚洲国产精品国自产拍久久| 777777777亚洲妇女| 成人3d动漫在线观看| 69久久精品无码一区二区 | 欧美高跟鞋交xxxxxhd| 日韩美女毛片| 国产成年人视频网站| 亚洲第一福利视频在线| 国产三级视频在线播放线观看| 91久久精品日日躁夜夜躁国产| 亚洲黄页一区| 日本美女黄色一级片| 精品久久久久久久久久久久包黑料| 99riav国产精品视频| 久久久综合精品| 国产色视频在线| 欧美一区二区三区免费观看| 久久电影院7| 久久性爱视频网站| 欧美日韩在线观看一区二区| 激情av在线| 中文字幕在线亚洲精品| av中文字幕一区| 国产男女无套免费网站| 欧美亚洲一级片| 欧美女激情福利| 在线免费看视频| 亚洲九九九在线观看| 日韩黄色av| 久久99爱视频| 欧美午夜片在线免费观看|