精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

激發(fā)大語言模型空間推理能力:思維可視化提示 原創(chuàng)

發(fā)布于 2024-4-11 11:31
瀏覽
0收藏

大語言模型(LLMs)在語言理解和各種推理任務(wù)中展現(xiàn)出令人印象深刻的性能。然而,它們?cè)谌祟愓J(rèn)知的關(guān)鍵一面——空間推理上,仍然未被充分研究。人類具有通過一種被稱為 心靈之眼 的過程創(chuàng)造看不見的物體和行為的心智圖像的能力,從而使得對(duì)未見世界的想象成為可能。受到這種認(rèn)知能力的啟發(fā),研究人員提出了 “思維可視化”(Visualization of Thought,VoT)。VoT旨在通過可視化其推理跡象來引導(dǎo)LLMs的空間推理,從而引導(dǎo)后續(xù)的推理步驟。研究人員將VoT應(yīng)用于多跳空間推理任務(wù),包括自然語言導(dǎo)航、視覺導(dǎo)航以及二維網(wǎng)格世界中的視覺鋪設(shè)。實(shí)驗(yàn)結(jié)果表明,VoT顯著增強(qiáng)了LLMs的空間推理能力。值得注意的是,VoT在這些任務(wù)中表現(xiàn)優(yōu)于現(xiàn)有的多模態(tài)大型語言模型(MLLMs)

引言

最近,大語言模型(LLMs)在各種與語言相關(guān)的任務(wù)上取得了顯著的表現(xiàn)。然而,盡管它們?cè)跀?shù)學(xué)推理、常識(shí)推理以及其他推理任務(wù),如符號(hào)推理或邏輯推理等方面取得了成功,但它們?cè)诳臻g推理方面的能力仍然未被充分探索。

空間推理是人類認(rèn)知的基本功能,使我們能夠與環(huán)境互動(dòng)。它促進(jìn)了需要理解和推理物體及其運(yùn)動(dòng)之間空間關(guān)系的任務(wù)。語言模型的空間推理在很大程度上依賴于語言來推理空間信息,而人類的認(rèn)知能力遠(yuǎn)遠(yuǎn)超出了語言推理。人類不僅可以從視覺感知中創(chuàng)建與任務(wù)相關(guān)的抽象表示,還可以通過心靈之眼想象看不見的場(chǎng)景。這在神經(jīng)科學(xué)、心靈哲學(xué)和認(rèn)知科學(xué)領(lǐng)域被稱為心智圖像的研究課題。建立在這一認(rèn)知功能之上,人類通過心智圖像的操作來促進(jìn)空間推理,比如導(dǎo)航、心理旋轉(zhuǎn)、心理紙張折疊和心理模擬。圖1說明了在導(dǎo)航任務(wù)中涉及的人類過程。人類通過創(chuàng)建路徑的心智圖像來增強(qiáng)其空間意識(shí)并指導(dǎo)其決策,利用各種感官輸入,如導(dǎo)航指令或地圖圖像。隨后,他們通過心靈之眼模擬路徑規(guī)劃。

激發(fā)大語言模型空間推理能力:思維可視化提示-AI.x社區(qū)

圖1:人類可以通過在空間推理過程中創(chuàng)建心智圖像來增強(qiáng)他們的空間意識(shí)并指導(dǎo)決策。同樣地,大語言模型(LLMs)可以創(chuàng)建內(nèi)部心智圖像。研究人員提出了VoT,通過可視化它們?cè)诿總€(gè)中間步驟的思維,來引發(fā)LLMs的“心靈之眼”,從而促進(jìn)空間推理。

受到這一認(rèn)知機(jī)制的啟發(fā),研究人員推測(cè)LLMs具有在心靈之眼中創(chuàng)建和操作心智圖像的能力來進(jìn)行空間推理。正如圖1所示,LLMs可能潛在地處理和理解各種格式的空間信息。它們可能能夠可視化內(nèi)部狀態(tài),并通過心靈之眼操作這些心智圖像,從而引導(dǎo)后續(xù)推理步驟以增強(qiáng)空間推理。因此,研究人員提出了 “思維可視化”(VoT) 提示來引發(fā)這種能力。該方法通過為L(zhǎng)LMs增加一個(gè)視覺空間素描板來可視化其推理步驟并指導(dǎo)后續(xù)步驟。VoT采用零示范提示,而不是依賴于少量示范或使用CLIP進(jìn)行文本到圖像的可視化。這個(gè)選擇源自LLMs從基于文本的視覺藝術(shù)中獲得各種心智圖像的能力。

為了評(píng)估VoT在空間推理中的有效性,研究人員選擇了三個(gè)需要LLMs空間意識(shí)的任務(wù),包括自然語言導(dǎo)航、視覺導(dǎo)航和視覺鋪設(shè)。這些任務(wù)需要理解空間、方向和幾何形狀推理。為了模擬人類般的多感官感知,研究人員設(shè)計(jì)了使用特殊字符作為L(zhǎng)LMs視覺導(dǎo)航和視覺鋪設(shè)任務(wù)中豐富輸入格式的2D網(wǎng)格世界。在這三個(gè)任務(wù)中比較了不同的模型(GPT-4、GPT-4V)和提示技術(shù)。研究結(jié)果顯示,VoT提示始終促使LLMs可視化其推理步驟并指導(dǎo)后續(xù)步驟。因此,這種方法在相應(yīng)任務(wù)上取得了顯著的性能提升。

激發(fā)大語言模型空間推理能力:思維可視化提示-AI.x社區(qū)

圖2:不同設(shè)置下的導(dǎo)航地圖示例,房子的表情符號(hào)表示起點(diǎn),辦公室的表情符號(hào)表示目的地。

空間推理

空間推理指的是理解和推理物體之間的空間關(guān)系、它們的移動(dòng)和互動(dòng)的能力。這種技能對(duì)于廣泛的現(xiàn)實(shí)世界應(yīng)用非常重要,如導(dǎo)航、機(jī)器人技術(shù)和自動(dòng)駕駛。這些領(lǐng)域需要基于視覺感知和對(duì)空間維度的具體理解進(jìn)行行動(dòng)規(guī)劃。盡管已經(jīng)開發(fā)了幾項(xiàng)任務(wù)和數(shù)據(jù)集來探究嵌入在文本中的空間語義,研究工作通常集中在空間術(shù)語如何在語言上結(jié)構(gòu)化上。最近,通過將空間術(shù)語轉(zhuǎn)換為邏輯形式并采用邏輯編程,在這些基準(zhǔn)測(cè)試中取得了顯著的成就和令人印象深刻的結(jié)果。這意味著在這些任務(wù)中取得優(yōu)異成績(jī)并不一定意味著大型語言模型(LLMs)真正理解了空間信息,也不提供它們空間意識(shí)的準(zhǔn)確衡量標(biāo)準(zhǔn)。空間意識(shí)涉及理解空間關(guān)系、方向、距離和幾何形狀,這些都對(duì)于在物理世界中進(jìn)行行動(dòng)規(guī)劃至關(guān)重要。為了評(píng)估LLMs的空間意識(shí)和空間推理能力,研究人員選擇了一些測(cè)試導(dǎo)航和幾何推理技能的任務(wù),包括自然語言導(dǎo)航、視覺導(dǎo)航和視覺鋪設(shè)。

自然語言導(dǎo)航

自然語言導(dǎo)航涉及通過隨機(jī)漫步瀏覽底層空間結(jié)構(gòu),旨在識(shí)別先前訪問過的位置。這個(gè)概念受到先前關(guān)于人類認(rèn)知的研究的啟發(fā),其采用了類似于沿著圖結(jié)構(gòu)進(jìn)行隨機(jī)漫步的方法。這個(gè)過程需要理解循環(huán)閉合,這對(duì)于空間導(dǎo)航至關(guān)重要。

激發(fā)大語言模型空間推理能力:思維可視化提示-AI.x社區(qū)

視覺導(dǎo)航

視覺導(dǎo)航任務(wù)向LLMs展示了一個(gè)合成的二維網(wǎng)格世界,挑戰(zhàn)其利用視覺線索進(jìn)行導(dǎo)航。模型必須生成導(dǎo)航指令,以四個(gè)方向(左、右、上、下)移動(dòng),從起點(diǎn)到達(dá)目的地,同時(shí)避開障礙物。這涉及到兩個(gè)子任務(wù):路線規(guī)劃和下一步預(yù)測(cè),需要進(jìn)行多跳空間推理,其中前者更為復(fù)雜。

激發(fā)大語言模型空間推理能力:思維可視化提示-AI.x社區(qū)

視覺鋪設(shè)

視覺鋪設(shè)是一個(gè)經(jīng)典的空間推理挑戰(zhàn)。將這個(gè)概念擴(kuò)展到測(cè)試LLMs在有限區(qū)域內(nèi)理解、組織和推理形狀的能力,從而增強(qiáng)了空間推理技能的評(píng)估。任務(wù)涉及一個(gè)帶有未填充單元格和各種多米諾塊的矩形,比如由四個(gè)對(duì)齊的方塊組成的I-多米諾塊。模型必須選擇適當(dāng)?shù)亩嗝字Z塊變體,例如選擇I-多米諾塊的方向,以解決問答謎題。

激發(fā)大語言模型空間推理能力:思維可視化提示-AI.x社區(qū)

激發(fā)大語言模型空間推理能力:思維可視化提示-AI.x社區(qū)

圖3:帶有掩碼多米諾塊的視覺鋪設(shè)示例。該圖未顯示多米諾塊的旋轉(zhuǎn)和鏡像變體。

思維可視化提示

考慮到人類在導(dǎo)航等任務(wù)中處理空間信息的方式,常常會(huì)創(chuàng)建心智圖像,如地圖,以增強(qiáng)空間意識(shí)或模擬移動(dòng)以指導(dǎo)決策。研究目標(biāo)是喚起LLMs的空間意識(shí),并通過可視化它們的中間推理步驟來基于實(shí)際情況進(jìn)行推理。

研究人員引入了“思維可視化”(VoT)提示: "在每個(gè)推理步驟之后可視化狀態(tài)"。這種新的空間推理范式旨在以交錯(cuò)的方式生成推理跡象和可視化結(jié)果。

激發(fā)大語言模型空間推理能力:思維可視化提示-AI.x社區(qū)

激發(fā)大語言模型空間推理能力:思維可視化提示-AI.x社區(qū)

圖4:三個(gè)任務(wù)中VoT提示的示例,LLM以交錯(cuò)方式生成推理跡象和可視化來跟蹤隨時(shí)間變化的狀態(tài)。

激發(fā)大語言模型空間推理能力:思維可視化提示-AI.x社區(qū)

論文:https://arxiv.org/pdf/2404.03622.pdf


本文轉(zhuǎn)載自公眾號(hào)AIGC最前線 

原文鏈接:??https://mp.weixin.qq.com/s/d38VknDQtM-UEFsf--fxQQ??

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請(qǐng)注明出處,否則將追究法律責(zé)任
標(biāo)簽
已于2024-4-16 10:15:48修改
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
久久精品日韩精品| 奇米四色中文综合久久| 中文字幕一区二区三区乱码不卡| 2022成人影院| 亚洲色图19p| 国产一级精品aaaaa看| 性色av一区二区三区四区| 中文不卡在线| 亚洲社区在线观看| 国产a级片视频| 日本午夜免费一区二区| 五月天婷婷综合| 天天综合中文字幕| 可以在线观看的av网站| 丁香婷婷综合色啪| 国产精品视频一区二区三区四 | 人九九综合九九宗合| 999久久久国产| 欧美自拍一区| 欧美大黄免费观看| 岛国毛片在线播放| 欧美一区国产| 香蕉成人啪国产精品视频综合网| 在线看成人av电影| 国产福利在线视频| 91视频国产观看| 国产高清一区视频| 99热这里只有精品在线| 麻豆国产精品视频| 国产精品白嫩初高中害羞小美女| 日本一级淫片免费放| 欧美1区免费| 久久久91精品国产一区不卡| 岛国片在线免费观看| 国产精品一区二区av交换| 日韩成人中文字幕| 第四色在线视频| 国产精品sss在线观看av| 欧美一区二区三区四区久久| 一区二区三区欧美精品| 51一区二区三区| 在线观看三级视频欧美| 男人的天堂99| sese综合| 一本大道久久a久久精品综合 | 国产在线视频一区二区三区| 国产精品日日做人人爱| 一级片在线观看视频| 乱一区二区av| 91精品一区二区| 国产精品无码专区av免费播放| 久久国产夜色精品鲁鲁99| 国产欧美日韩中文| 国产精品久久欧美久久一区| 国产在线播放一区| 97视频热人人精品| 好吊视频一二三区| 91色在线porny| 日本午夜精品一区二区| www.在线视频.com| 日韩码欧中文字| 97超碰在线视| 草草在线观看| 日本韩国欧美一区| 亚洲va在线va天堂va偷拍| 久久国产精品免费一区二区三区| 日韩欧美成人一区二区| 黄色av网址在线观看| 欧美久久精品一级c片| 精品国产一区二区三区四区在线观看 | 国产精品探花在线播放| 欧美经典一区| 亚洲精品久久久久久久久| 四虎国产精品成人免费入口| 久久国产精品亚洲人一区二区三区 | 日韩av一卡二卡| 欧美做受高潮6| 91久久电影| 海角国产乱辈乱精品视频| 国产精品久久久久久久妇| 日韩不卡在线观看日韩不卡视频| 成人妇女免费播放久久久| 午夜美女福利视频| 久久影院电视剧免费观看| 一级特黄录像免费播放全99| 人交獸av完整版在线观看| 懂色av一区二区三区| 日韩一级理论片| 日韩一区二区三区高清在线观看| 日韩精品在线视频观看| 五月综合色婷婷| 国产精品尤物| 亚洲一区二区三区视频播放| 亚洲欧美日韩免费| 亚洲欧美日韩国产手机在线| 欧美亚洲国产成人| 亚洲三级电影| 亚洲欧洲偷拍精品| 伊人365影院| 久久精品国产第一区二区三区| 国产高清精品一区二区| 欧美日本一道| 日本高清免费不卡视频| 亚洲 自拍 另类 欧美 丝袜| 国产精品一区二区av交换| 欧美肥婆姓交大片| 中文字幕a级片| 99久免费精品视频在线观看| 精品日韩在线播放| 日本美女久久| 国产丝袜精品第一页| 青青草手机在线观看| 免费久久99精品国产| 久久国产精品99久久久久久丝袜| 三级网站视频在在线播放| 欧美日韩一区精品| 一卡二卡三卡四卡| 亚洲日产国产精品| 99中文字幕| 黄色av免费在线| 在线欧美一区二区| 深爱五月激情网| 日韩午夜一区| 国产精品二区二区三区| 18加网站在线| 91麻豆精品国产91久久久久久久久 | 欧美h版在线| 国产成人av在线播放| 五月婷婷激情在线| 午夜天堂影视香蕉久久| 亚洲一级Av无码毛片久久精品| 午夜av一区| 国产欧美一区二区三区四区| caoporn国产精品免费视频| 欧美午夜精品久久久久久浪潮 | 亚洲成熟女性毛茸茸| 亚洲视频你懂的| 亚洲第一区第二区第三区| 四虎国产精品免费观看| 国产精品稀缺呦系列在线| 搞黄视频在线观看| 欧美性做爰猛烈叫床潮| 一级特黄曰皮片视频| 男人的天堂久久精品| 视频一区视频二区视频| 久久av影院| 日韩视频精品在线| av综合在线观看| 亚洲综合视频在线| 中文字幕天堂网| 国产日韩欧美一区| 久久精品美女| 在线观看精品| 最新国产精品亚洲| 99热这里只有精| 亚洲综合清纯丝袜自拍| 国产精品麻豆入口| 丝袜美腿成人在线| 亚洲一区二区三区色| 久久综合偷偷噜噜噜色| 久久久久久久久久久免费| 神马午夜一区二区| 欧洲精品视频在线观看| 国产人与禽zoz0性伦| 国产精品一区二区在线观看网站| 国产欧美精品aaaaaa片| 久久男人av| 国产精品爽黄69天堂a| 美女隐私在线观看| 精品国产一区二区三区av性色| 日本午夜精品理论片a级app发布| 久久久亚洲综合| 日本一二区免费| 激情欧美国产欧美| 神马影院一区二区| 视频一区日韩| 国产成人精品一区| 最新av在线播放| 日韩成人在线视频观看| 在线亚洲欧美日韩| 亚洲成人一区二区在线观看| 亚洲国产天堂av| 激情成人午夜视频| 国产极品尤物在线| 日韩情爱电影在线观看| 国产九色精品| 欧美v亚洲v综合v国产v仙踪林| 欧美激情精品在线| 国产鲁鲁视频在线观看免费| 日韩午夜在线播放| 中文字幕黄色片| 亚洲狠狠丁香婷婷综合久久久| 9.1成人看片| 国产精品1区2区3区| 成年人视频在线免费| 欧美大片专区| 色综合久久av| 国内精品麻豆美女在线播放视频| 国产精品天天狠天天看| 国产美女高潮在线| 久久中国妇女中文字幕| 国产小视频免费在线观看| 日韩精品中文字幕一区| 姑娘第5集在线观看免费好剧| 亚洲高清中文字幕| 强制高潮抽搐sm调教高h| 91在线观看高清| 91视频免费入口| 蜜臀av一区二区在线观看| 欧美亚洲日本一区二区三区| 91tv官网精品成人亚洲| 日本中文不卡| 欧美精品中文字幕亚洲专区| 97se亚洲综合在线| 四虎成人精品一区二区免费网站| 国产成人午夜视频网址| 多野结衣av一区| 欧美激情一区二区三区在线视频观看| 日本视频在线免费观看| 伊人久久久久久久久久久久久| 无码国产精品一区二区色情男同| 欧美一区二区人人喊爽| 在线观看国产小视频| 日本高清不卡视频| 欧美亚洲精品天堂| 欧美日韩国产精品一区二区不卡中文 | 精品欧美国产一区二区三区| 麻豆疯狂做受xxxx高潮视频| 亚洲欧美中日韩| 婷婷激情四射网| ...xxx性欧美| 一区二区三区影视| 中文字幕亚洲不卡| 看黄色录像一级片| 亚洲人成电影网站色mp4| 狂野欧美性猛交| 国产精品嫩草影院av蜜臀| 亚洲无人区码一码二码三码的含义| 久久久影视传媒| 微拍福利一区二区| 国产亚洲精久久久久久| 91激情视频在线观看| 国产日韩欧美不卡在线| 免费黄在线观看| 中文字幕制服丝袜成人av| 色婷婷粉嫩av| 亚洲精品日韩综合观看成人91| 日本黄色片免费观看| 亚洲欧美一区二区三区久本道91| 男女性高潮免费网站| 亚洲精品五月天| 国产一级做a爰片在线看免费| 午夜精品一区二区三区电影天堂| 国产精品suv一区二区69| 天天影视色香欲综合网老头| 日本中文在线播放| 在线精品视频免费播放| 在线视频你懂得| 日韩免费看网站| 天天操天天爱天天干| 亚洲另类欧美自拍| 日韩在线观看www| 欧美大片在线影院| 天堂资源在线| 国产欧美一区二区三区久久人妖| 精品国产三级| 国产一区再线| re久久精品视频| 一级黄色录像免费看| 在线电影一区| 亚洲不卡视频在线| 国产精品一二一区| 欧美成人午夜精品免费| 国产精品久久久久国产精品日日| 日日骚一区二区三区| 高潮白浆女日韩av免费看| 中文字幕福利视频| 精品国产精品一区二区夜夜嗨| 日本成人一区二区三区| 久久精品国产成人| 美女搞黄视频在线观看| 成人激情在线观看| 日本在线中文字幕一区| 最近看过的日韩成人| 一本一道久久综合狠狠老精东影业| 15—17女人毛片| 97精品国产露脸对白| 国产免费嫩草影院| 图片区小说区区亚洲影院| 在线视频欧美亚洲| 日韩h在线观看| а√天堂8资源在线官网| 日本高清视频一区| 国产欧美三级电影| 在线观看精品视频| 麻豆久久婷婷| 丰满熟女人妻一区二区三区| 国产精品伦一区| 日本午夜视频在线观看| 日韩一区二区三区视频在线| 国产高清视频在线播放| 国产综合在线看| 99精品美女视频在线观看热舞| 美女黄毛**国产精品啪啪| 欧美日韩影院| 日韩欧美国产片| 国产欧美日韩视频在线观看| 国产成人亚洲精品自产在线 | 四虎精品在永久在线观看| 久久综合伊人77777| 日本欧美韩国| 久久亚裔精品欧美| 国产一区观看| 北条麻妃亚洲一区| 国产精品理伦片| 伊人成年综合网| 亚洲女成人图区| 久草免费在线视频| 国产精品久久波多野结衣| 91精品99| 国产黑丝在线视频| 亚洲日本成人在线观看| 中文字幕在线2019| 国产亚洲美女久久| 综合在线影院| 欧美激情第六页| 久久九九电影| 毛片网站免费观看| 日韩欧美中文字幕在线观看| 天天干视频在线| 97国产精品人人爽人人做| 哺乳一区二区三区中文视频 | 国精产品久拍自产在线网站| 91福利资源站| 国产精品麻豆一区二区三区| 国产精品aaaa| 国产精品一区二区av交换| www.国产区| 欧美高清在线视频| 成人免费一区二区三区| 最近更新的2019中文字幕| 国产精品天堂蜜av在线播放 | 欧美一激情一区二区三区| 国产在线高潮| 97免费资源站| 99精品国产99久久久久久福利| 97人妻天天摸天天爽天天| 欧美性xxxx极品hd满灌| 国产裸舞福利在线视频合集| 国产精品视频网址| 亚洲天堂免费| 日本少妇一级片| 精品高清一区二区三区| 美女毛片在线看| 国产精品一二三在线| 性欧美欧美巨大69| 五月天六月丁香| 午夜影院久久久| 黄色视屏网站在线免费观看| 国产精品久久久久久久久免费看| 99成人超碰| 中文字幕无人区二| 日韩欧美在线中文字幕| caoporn国产精品免费视频| 亚洲free性xxxx护士白浆| 影院欧美亚洲| 国产综合精品久久久久成人av| 91精品国产综合久久久久久久| 天堂av中文在线| 久久久久成人精品免费播放动漫| 日韩电影免费在线观看网站| 一级片一级片一级片| 亚洲精品乱码久久久久久金桔影视 | 亚洲成av人片| 超碰在线影院| 国产精品区一区| 奇米影视一区二区三区小说| 免费在线黄色网| 精品亚洲一区二区| 成人在线啊v| 国内外成人激情视频| 亚洲免费观看视频| 久久视频www| 91久久大香伊蕉在人线| 日韩中文字幕一区二区三区| 青娱乐av在线| 中文字幕亚洲无线码a| 亚洲精品午夜| 精品少妇无遮挡毛片| 一级做a爱片久久| seseavlu视频在线| 国产精品日韩一区二区| 老司机精品视频在线| 久久高清免费视频| 久久亚洲精品国产亚洲老地址| 日韩三级视频| 亚洲成人福利视频| 欧美美女一区二区| 日韩免费福利视频| 免费人成自慰网站|