精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

「一只手有幾根手指」,你的GPT-5答對了嗎?

人工智能 新聞
今天,CMU 博士生、英偉達 GEAR(通用具身智能體研究)團隊成員 Tairan He(何泰然)向 GPT-5 詢問了這個問題,結果模型回答錯了。

「一只手有幾根手指?」

這個看似簡單的問題,強如 GPT-5 卻并不能總是答對。

今天,CMU 博士生、英偉達 GEAR(通用具身智能體研究)團隊成員 Tairan He(何泰然)向 GPT-5 詢問了這個問題,結果模型回答錯了。

image.png

他接著延伸出一個論點:語言雖然是強大的工具,但卻很難完全滿足視覺與機器人領域的需求。

我們更需要以視覺為中心的視覺語言模型(VLM)以及以視覺-動作為中心的 VLA 模型。

看起來,這里 Tairan He 對 Fingers 的定義應該是「包括拇指在內所有的手指」。

在英文語境中(包括柯林斯詞典、詞源詞典等的解釋),Fingers 既可以指代除拇指以外的其余四指,也可以指代包括拇指在內的全部五指。

image.png

圖源:柯林斯詞典

image.png

圖源:詞源詞典

不只是 GPT-5,推理版本 GPT-5-Thinking 也犯錯了,「包括拇指在內 5 根手指,不包括拇指則 4 根手指」。

image.png

此前,在 Grok 4 推出之后,同樣有人用數手指問題來測試它,結果同樣翻車

實測:

時對時錯,Gemini 2.5 Pro 也未能幸免

有趣的是,在認定手指(finger)包含拇指的前提下,編輯部也去測試了一下,結果發現 GPT-5 居然答對了,而且多次測試均回答正確。

image.png

image.png

image.png

不過,六指圖的中文語境中 GPT-5 卻總是回答錯誤。

image.png

image.png

我們又在 Gemini 2.5 Pro 上繼續測試,它貼心的單獨統計了 finger 和 thumb,但最終答案是錯的。

image.png

image.png

可以看到,在面對一些基礎常識性問題尤其存在語言先驗干擾(這里的 finger 本身就有歧義)時,即便是頂尖大模型也頻頻「翻車」。

這說明,模型雖然在語言推理方面很強,但對圖像的基礎視覺理解,包括目標檢測和語義分類等,仍然不夠穩健。模型中的視覺模塊可能并不是真正地「看」懂,而只是利用語言模式去猜。

為何回答不對?如何應對?

Tairan He 在后續評論中提到了謝賽寧團隊去年的一篇論文,這篇論文提出并實踐了一套系統、深入且以視覺為中心的研究與評估方法,展示了如何對多模態大語言模型(MLLM)的視覺基礎能力進行科學、嚴謹的評估。

Tairan He 認為,應該將這種嚴謹的評估思想和方法論應用到 VLA 模型研究中去。

image.png

  • 論文標題:Cambrian-1: A Fully Open, Vision-Centric Exploration of Multimodal LLMs 
  • 論文地址:https://arxiv.org/pdf/2406.16860

論文指出,當前許多基準測試并不足以真實評估模型核心的視覺能力,部分測試甚至在沒有視覺輸入的情況下也能被解答。

團隊創建了一個名為 CV-Bench 的全新、更專注的基準測試集,專門用于檢驗模型在物體計數、空間關系判斷及深度感知等關鍵且基礎的 2D 和 3D 視覺理解能力,從而建立了一套更嚴格的評估標準。

論文系統性地評估了超過 20 種不同的視覺編碼器,并對訓練策略和數據配比進行了詳盡的研究,其成果如同一本可供參考的「公開食譜」,為領域內的后續工作提供了嚴謹的參照。

謝賽寧也參與了討論,表示多模態大型語言模型中的虛假相關性是一個棘手的基準測試問題。他認為,模型對語言先驗的依賴既是優勢也是陷阱,因為它可能導致模型忽視其他模態,成為一種「捷徑」。

從經濟角度看,這讓公司能在不進行大量實際多模態研究的情況下,宣稱在「多模態推理」上取得成功。然而,當這些系統被應用于機器人等現實世界時,這種捷徑的缺陷就會暴露,并付出巨大代價。

image.png

另一項研究也印證這種觀點。實驗顯示,最先進的 VLM 在識別常見物體圖像(例如,知道阿迪達斯標志有 3 條條紋,狗有 4 條腿)的數量時,準確率能達到 100%;但在計算反事實圖像(例如,計算一個有 4 條條紋的類阿迪達斯標志中的條紋數量,或一只 5 條腿的狗的腿數)時,準確率僅有約 17%。

  • 項目主頁:https://vlmsarebiased.github.io/

該研究指出,VLM 實際上并不能真的「看到」,它們依賴于記憶的知識而不是視覺分析。

image.png

針對這一問題,密歇根大學的博士生 Martin Ziqiao Ma(馬子喬)也詳細闡述了自己的觀點。

他認為關鍵問題在于:用大語言模型來初始化視覺-語言(-動作)模型(VLA),是一個誘人的陷阱,看似取得了進展,但實際上并沒有真正實現突破。大多數基準測試都過于集中在推理和數字領域,而沒有從根本上解決感知問題,尤其是中、低層次的視覺能力。

image.png

人類在直覺物理和心理理解上,顯然有著前語言階段的認知根基,例如固體性、連續性、重力等基本原則。

2024 年,他及團隊在構建了 GroundHog 之后,花了一些時間反思 VLM 的核心問題。他再也無法說服自己,僅僅把 CLIP 和 DINO 疊加上幾層投影層就是「將視覺符號化」的終極方案。視覺-語言模型需要更強大的視覺基礎,或許必須從以視覺為中心的視角重新開始。

此后,他暫停 VLM 開發一年并探索了其他方向。并且真正從零開始,他開始研究 3D 基礎模型和視頻擴散模型,并暫時擱置了聯合視覺-語言擴散模型的可能性。他開發了 4D-LRM,目標是在完全沒有語言先驗的情況下,大規模學習 4D 先驗。

這只是第一步。未來某個時候,他會回到 VLM 工程領域。但下一次,他希望自己能先從世界模型入手,再在其之上解鎖語言模塊。

大語言模型什么時候能夠真正理解圖像等視覺信息,而不僅僅把視覺當作語言的附屬輸入?對此你怎么看呢?

責任編輯:張燕妮 來源: 機器之心
相關推薦

2018-10-11 16:46:00

商用軟件

2017-09-13 11:49:11

有孚網絡上云專有云

2022-10-20 07:43:46

2025-08-12 09:18:00

2022-03-02 09:40:26

微軟Windows 8ASCII 貓

2025-06-19 09:06:00

2021-03-16 06:47:47

Python

2017-09-12 12:13:57

夢想 咸魚

2017-11-09 13:56:46

數據庫MongoDB水平擴展

2024-12-17 15:00:00

字符串Java

2025-08-14 09:31:24

GPT-5AI

2020-09-18 06:39:18

hashMap循環數據

2024-01-22 13:57:00

模型訓練

2019-10-30 15:27:28

Google谷歌Alphabet

2025-10-17 17:49:11

GPT-5AI模型

2024-04-01 00:50:00

吳恩達智能體

2019-12-26 14:07:19

隨機數偽隨機多線程

2025-02-13 10:52:56

點贊
收藏

51CTO技術棧公眾號

免费在线观看不卡| 亚洲精品亚洲人成在线| 亚洲一区av在线| 久久99精品久久久水蜜桃| 日本中文字幕在线观看视频| 成人在线亚洲| 精品国产一二三| 日韩av片在线看| 欧洲日本在线| 91在线一区二区| 成人a免费视频| 日韩久久久久久久久| 成人羞羞动漫| 亚洲精品电影久久久| 孩娇小videos精品| 老司机深夜福利在线观看| 中文一区二区在线观看| 国产精品10p综合二区| 怡红院成永久免费人全部视频| 999色成人| 第一福利永久视频精品| 这里只有精品66| 日韩av地址| 成人午夜av在线| 国产综合久久久久| 无码人妻av免费一区二区三区 | 超碰免费在线| 国产凹凸在线观看一区二区| 热99在线视频| 国产一级一片免费播放| 欧美黄色大片在线观看| 国产视频精品在线| 蜜臀视频在线观看| 久久av网站| 欧美日本视频在线| 日韩精品免费播放| 亚洲国产福利| 亚洲成人激情自拍| 国产一区二区三区播放| 东凛在线观看| 久久午夜老司机| 久久青青草原| 免费a级片在线观看| 国内精品久久久久影院薰衣草| 欧美日本黄视频| 夫妻性生活毛片| 人人狠狠综合久久亚洲婷| 亚洲高清色综合| 午夜影院福利社| 一区二区三区视频播放| 欧美一级生活片| 老司机午夜性大片| 久久69成人| 欧美日韩亚洲不卡| 久久精品影视大全| 日韩高清不卡| 欧美午夜电影在线播放| 亚洲国产精品三区| 国产极品一区| 欧美日韩激情一区二区三区| 国产三级三级看三级| 日本免费一区二区三区等视频| 亚洲男同1069视频| 欧美性受xxxx黑人猛交88| 黄色成人在线| 一区二区三区中文字幕在线观看| 狠狠爱一区二区三区| 亚洲精品久久久久avwww潮水| 亚洲一卡久久| 国产91av在线| 波多野结衣影片| 蜜桃久久久久久| 91在线无精精品一区二区| 国产毛片久久久久| 成人午夜免费电影| 蜜桃视频在线观看成人| 粉嫩av一区| 亚洲色图.com| ww国产内射精品后入国产| 午夜精品成人av| 欧美午夜电影网| 亚洲天堂伊人网| 999在线精品| 精品视频在线播放免| 四虎国产成人精品免费一女五男| 韩国精品福利一区二区三区| 日韩精品中文字幕视频在线| 国产精品20p| 欧美一区网站| 68精品久久久久久欧美| 亚洲av综合一区| 国产真实精品久久二三区| 国产麻豆一区二区三区在线观看| 免费黄色片视频| 精品制服美女丁香| 韩国成人一区| 免费人成在线观看播放视频| 亚洲国产日日夜夜| 九一精品在线观看| 91成人福利| 国产午夜精品全部视频在线播放| 中出视频在线观看| 欧美gvvideo网站| 久久久视频精品| 最近中文在线观看| 成人污视频在线观看| 欧美精品二区三区四区免费看视频| 欧美一级淫片aaaaaa| 久久精品夜色噜噜亚洲aⅴ| 在线成人性视频| 成人一区福利| 欧美xingq一区二区| youjizz亚洲女人| 亚洲婷婷在线| 成人激情在线播放| 国产女主播在线直播| 午夜视频一区二区| 欧美xxxxxbbbbb| 日韩夫妻性生活xx| 人体精品一二三区| 黄色一级a毛片| 日韩码欧中文字| 看欧美ab黄色大片视频免费| 久久99精品久久久久久欧洲站| 亚洲精品大尺度| 黄色片子在线观看| 蜜桃精品视频在线| 日韩亚洲视频在线| 久久野战av| 精品亚洲va在线va天堂资源站| 中文字字幕码一二三区| 国产一区日韩一区| 91久久国产综合久久91精品网站 | 日韩精品最新网址| 性欧美一区二区| 亚洲国内精品| 成人情视频高清免费观看电影| 蜜桃视频在线观看www| 日韩一区有码在线| 亚洲综合av在线播放| 精品一区欧美| 日本电影亚洲天堂| 视频国产一区二区三区| 亚洲国产成人av| 99久热re在线精品996热视频 | 中文字幕99页| 国产精品一国产精品| 91精品国产免费久久综合| 亚洲精品中文字幕乱码无线| 欧美色网址大全| 亚洲国产精品大全| 欧美亚洲色综久久精品国产| 日本伊人久久| 中文字幕9999| 亚洲怡红院av| 亚洲免费观看高清完整版在线| 91系列在线观看| 亚洲乱码在线观看| 免费在线观看成人| 国产99在线播放| 91破解版在线观看| 日韩免费在线观看| 亚洲欧美日本一区二区三区| 久久精品福利| 国产视频精品免费播放| 激情高潮到大叫狂喷水| 模特精品在线| 91精品国产精品| 91在线公开视频| 久久av在线| 欧美精品激情在线| 99产精品成人啪免费网站| 小早川怜子影音先锋在线观看| 成人av电影免费在线播放| 日韩精品在线播放| 男女男精品视频站| av手机天堂网| 麻豆蜜桃在线| 国产激情一区二区三区桃花岛亚洲| 一片黄亚洲嫩模| 欧美日本韩国一区二区三区视频| 91精品久久久久久久久中文字幕 | segui88久久综合9999| 亚洲а∨天堂久久精品喷水 | 亚洲国产一区二区a毛片| youjizz.com国产| 日韩精品视频网站| 欧美少妇一级片| 国产精品毛片视频| 国产精品一区电影| 欧美高清另类hdvideosexjaⅴ | 亚洲一区二区三区四区精品| 国产精品九九| 亚洲精品国产精品久久| 97久久亚洲| 国产精品美女久久| av网站免费在线观看| 亚洲精品日韩欧美| 国产麻豆免费观看| 日本久久一区二区| 精品无码免费视频| 国产精品沙发午睡系列990531| 日av中文字幕| 国内揄拍国内精品久久| 日韩av电影免费在线| 精品一区二区三区在线观看视频| 不卡伊人av在线播放| 色视频精品视频在线观看| 欧美人妇做爰xxxⅹ性高电影| 亚洲av毛片基地| 成人手机在线视频| 色91精品久久久久久久久| 香蕉久久久久久久av网站| 日本一级黄视频| 欧美日韩老妇| 久久久久网址| 成人看片黄a免费看视频| 成人午夜小视频| 日韩三区免费| 日本久久久久久久久久久| 欧美aaaaaaa| 久久资源免费视频| 亚洲乱亚洲乱妇| 国产一区二区三区视频免费| 人妻无码中文字幕| 日韩免费一区二区三区在线播放| 日本污视频在线观看| 亚洲少妇中出一区| 四虎成人免费影院| 久久久美女毛片| 免费成人蒂法网站| 成人免费电影视频| 黄页网站在线看| 国产在线乱码一区二区三区| 五月婷婷之综合激情| 久久婷婷av| www.超碰com| 视频在线观看91| 欧美日韩一道本| 夜夜嗨网站十八久久| 日韩精品综合在线| 韩国在线视频一区| 国产一区二区四区| 亚洲无线一线二线三线区别av| 欧美日韩视频在线一区二区观看视频| 国精产品一区一区三区四川| 欧美一级在线亚洲天堂| 美女av在线免费看| 69av在线播放| 欧美一区久久久| 国产精品69久久| 88xx成人网| 国产一区香蕉久久| 成人国产精品久久| 91精品网站| 97一区二区国产好的精华液| 国产欧美在线一区二区| 欧美三级电影在线| 蜜桃麻豆www久久国产精品| 在线成人动漫av| 日韩在线国产| 91成人免费| 免费网站永久免费观看| 国产日韩精品视频一区二区三区 | 国产xxxxxxxxx| 成人高清av在线| 女同毛片一区二区三区| 国产亚洲午夜高清国产拍精品| 在线看黄色的网站| 99re视频这里只有精品| 国精品无码人妻一区二区三区| 国产精品911| 国产精品亚洲一区二区无码| 26uuu色噜噜精品一区| 中文字幕第24页| 亚洲精品高清视频在线观看| 国产真实乱偷精品视频| 色噜噜狠狠色综合中国| 国产麻豆91视频| 亚洲精品999| 在线观看免费高清完整| 欧美贵妇videos办公室| 美女日韩欧美| 成人在线国产精品| 日韩成人av在线资源| 亚洲在线播放电影| 亚洲欧洲日本mm| 国产精品视频黄色| 懂色中文一区二区在线播放| 国产黄片一区二区三区| 一区二区三区美女| 国产精品午夜一区二区| 精品sm在线观看| 91激情在线| 韩国v欧美v日本v亚洲| 欧美123区| 国产传媒一区二区三区| 成人一区而且| www.日本在线播放| 开心九九激情九九欧美日韩精美视频电影| 丁香啪啪综合成人亚洲| 国产自产高清不卡| 真人bbbbbbbbb毛片| 综合久久国产九一剧情麻豆| 欧美日韩综合在线观看| 7777精品伊人久久久大香线蕉的| 在线观看国产黄| 亚洲精品在线免费观看视频| 中文字幕在线观看日本| 78m国产成人精品视频| 国产aa精品| 日韩欧美在线一区二区| 亚洲激精日韩激精欧美精品| 在线一区二区不卡| 欧美激情一区二区三区四区| 日本少妇裸体做爰| 91精品国产高清一区二区三区蜜臀 | аⅴ资源新版在线天堂| 97激碰免费视频| 免费一区二区三区在线视频| 无遮挡亚洲一区| 亚洲一区二区成人| 又黄又爽的网站| 亚洲美女在线一区| 在线观看免费黄色小视频| 亚洲欧美一区二区三区久久| 超碰在线资源| 超碰97在线资源| 中文字幕免费一区二区三区| www.com操| 国产精品免费网站在线观看| 中文字幕黄色片| 国产丝袜视频一区| 亚洲美女久久精品| 久久久久久亚洲精品不卡4k岛国 | 2022亚洲天堂| 成人精品视频一区| 久久久全国免费视频| 91精品黄色片免费大全| 日本电影在线观看网站| 国产精品视频免费在线观看| 国产成人调教视频在线观看| 国产在线观看福利| 26uuu国产一区二区三区| 日韩黄色精品视频| 日韩成人xxxx| 婷婷电影在线观看| 欧美三日本三级少妇三99| 久久久噜噜噜久久狠狠50岁| 精品人妻少妇嫩草av无码| 精品福利视频导航| 黄网站在线观看| 国产精品老女人视频| 欧美hentaied在线观看| 色呦色呦色精品| 亚洲精品国产a久久久久久 | 亚洲丝袜精品| 99爱精品视频| 99视频精品| 久久精品成人av| 欧美日韩中文一区| 国产高清一区二区三区视频| 亚洲a在线观看| 影音先锋久久精品| 波多野结衣先锋影音| 欧美三级免费观看| fc2在线中文字幕| 成人亲热视频网站| 亚洲人成久久| 无码人妻丰满熟妇啪啪欧美| 欧美日韩精品一区二区三区四区| 亚洲aaa在线观看| 热草久综合在线| 国产精品91一区二区三区| 少妇欧美激情一区二区三区| 亚洲成a天堂v人片| 国产私人尤物无码不卡| 91欧美精品午夜性色福利在线 | 色多多国产成人永久免费网站 | 精品美女永久免费视频| 色视频精品视频在线观看| 国产精选久久久久久| 韩国在线视频一区| av女人的天堂| 欧美精品一级二级| 久草在线中文最新视频| 亚洲午夜在线观看| 大胆亚洲人体视频| 日本三级一区二区三区| 欧美肥臀大乳一区二区免费视频| 国产精品18| 亚洲自偷自拍熟女另类| 国产精品卡一卡二卡三| 亚洲欧美高清视频| 国产精品9999| 亚洲午夜在线| 亚洲人与黑人屁股眼交| 亚洲精品一区二区精华| 精品三级在线| 免费黄色日本网站|