精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI為何讀不懂鐘表?模擬時鐘暴露的認知短板與AI進化隱憂?

譯文 精選
人工智能
中國與西班牙的聯合研究質疑當前AI通過數據擴容實現類人泛化能力的可行性,強調需突破架構限制以構建抽象推理機制,并呼吁重新審視“智能”的本質定義。

譯者 | 朱先忠

審校 | 重樓

中國和西班牙研究人員發表的一篇新論文發現,即使是像GPT-4.1這樣的先進多模態人工智能模型,也難以從模擬時鐘圖像中識別時間。時鐘中細微的視覺變化都可能導致嚴重的解讀錯誤,而微調也只對熟悉的示例有效。這一結果引發了人們對這些模型在現實世界任務中處理不熟悉圖像時的可靠性的擔憂。

當人類對某個領域(例如重力或其他基本物理原理)有了足夠深入的理解時,我們就能超越具體的例子,掌握其背后的抽象概念。這使我們能夠創造性地跨情境運用這些知識,并通過識別實際應用中的原理來識別新的實例,即使是那些我們從未見過的實例。

當一個領域足夠重要時,我們甚至可能在它并不存在的地方感知到它,就像空想性錯視一樣,其驅動力在于無法識別真實實例的高昂代價。這種模式識別的生存機制如此強大,以至于它甚至促使我們在沒有模式的地方尋找更廣泛的模式

一個領域在我們心中灌輸得越早、越反復,它的基礎就越,并且會持續一生;我們在兒童時期接觸到的最早的視覺數據集之一就是教學時鐘,其中印刷材料或交互式模擬時鐘被用來教我們如何看時間:

幫助孩子學習認識時間的教具

盡管手表設計時尚的變化有時會給我們帶來挑戰,但這種早期領域掌握的彈性令人印象深刻,即使面對復雜或“古怪”的設計選擇,我們也能辨別模擬鐘面:

高級定制腕表中的一些挑戰性面孔

人類不需要成千上萬的例子來了解時鐘的工作原理;一旦掌握了基本概念,我們幾乎可以識別任何形式,即使是扭曲或抽象的形式。

相比之下,人工智能模型在完成這項任務時面臨的困難凸顯了一個更深層次的問題:它們的表面實力可能更多地取決于大量的曝光,而不是理解。

超越模仿游戲?

在近期對大型模型的研究中,表面表現與真正“理解”之間的矛盾反復浮現。上個月,浙江大學和西湖大學在一篇題為《博士級LLM真正掌握初等加法嗎?》(非本文重點)的論文中重新闡述了這個問題,并得出結論:

“盡管基準令人印象深刻,但模型顯示出對模式匹配而非真正理解的嚴重依賴,這由符號表示的失敗和基本屬性的違反所證明。

明確的規則規定會損害性能,這表明存在固有的架構限制。這些見解揭示了評估方面的差距,并強調了對能夠進行超越模式識別的真正數學推理的架構的需求。”

本周,這個問題再次被提出,由南京航空航天大學和西班牙馬德里理工大學合作完成。這篇題為《多模態大型語言模型(MLLM)真的學會了在模擬時鐘上報時嗎?》的新論文探討了多模態模型對報時理解的程度。

盡管論文中僅詳細介紹了研究進展,但研究人員的初步測試表明,OpenAI的GPT-4.1多模態語言模型難以從多種時鐘圖像中正確讀取時間,即使在簡單的情況下也經常給出錯誤的答案。

這表明模型的訓練數據可能存在缺口,因此需要一個更均衡的數據集,以測試模型是否能夠真正學習其背后的概念。因此,作者整理了一個模擬時鐘的合成數據集,均勻地覆蓋了所有可能的時間,并避免了互聯網圖像中常見的偏差:

AI為何讀不懂鐘表?模擬時鐘暴露的認知短板與AI進化隱憂-AI.x社區AI為何讀不懂鐘表?模擬時鐘暴露的認知短板與AI進化隱憂-AI.x社區

研究人員合成模擬時鐘數據集中的一個示例,用于在新研究中微調GPT模型

在對新數據集進行微調之前,GPT-4.1一直無法讀取這些時鐘。然而,在接觸了新數據集一段時間后,它的表現有所改善——但前提是新圖像與它之前見過的圖像相似。

當時鐘的形狀或指針的樣式發生變化時,準確度會急劇下降;即使是很小的調整,例如更細的指針或箭頭(下圖最右邊),也足以使其偏離目標;此外,GPT-4.1還難以解讀達利風格的“融化時鐘”:

AI為何讀不懂鐘表?模擬時鐘暴露的認知短板與AI進化隱憂-AI.x社區AI為何讀不懂鐘表?模擬時鐘暴露的認知短板與AI進化隱憂-AI.x社區

標準設計的時鐘圖像(左)、變形的時鐘圖像(中)和修改后的指針圖像(右),以及GPT-4.1微調前后返回的時間

作者推斷,當前的模型(例如GPT-4.1)可能主要通過視覺模式匹配來學習讀鐘,而不是通過任何更深層次的時間概念,并斷言:

“當時鐘變形或指針變細并帶有箭頭時,GPT-4.1就會失效。在150個隨機時間上進行的時間估計中,初始時鐘的平均絕對誤差(MAE)為232.48秒,形狀變形時為1380.69秒,指針改變時為3726.93秒。

這些結果表明,MLLM并沒有學會看時間,而是記住了模式。”

足夠的時間

大多數訓練數據集依賴于抓取的網絡圖像,這些圖像往往會重復特定的時間——尤其是10:10,這是手表廣告中流行的設置

從新論文中,我們可以看到模擬時鐘圖像中“十點十分”時間的流行情況

由于所描繪的時間范圍有限,模型可能只能看到狹窄范圍的時鐘配置,從而限制了其超越這些重復模式進行概括的能力。

關于模型為何無法正確解釋時鐘扭曲的問題,論文指出:

“盡管GPT-4.1在標準時鐘圖像上表現非常出色,但令人驚訝的是,通過使時鐘指針變細并添加箭頭來修改時鐘指針會導致其準確性顯著下降。

直觀地看,人們可能會認為視覺上更復雜的變化——扭曲的表盤——會對性能產生更大的影響,但這種修改似乎影響相對較小。

這就引出了一個問題:MLLM如何解讀時鐘,以及它們為什么會失敗?一種可能性是,較細的指針會削弱模型感知方向的能力,從而削弱其對空間方向的理解。

或者,當模型嘗試將時針、分針和秒針組合成準確的時間讀數時,可能會有其他因素造成混淆。”

作者認為,找出這些失敗的根本原因是推進多模態模型的關鍵:如果問題在于模型如何感知空間方向,微調可能會提供一個簡單的解決方案;但如果問題源于整合多種視覺線索的更大困難,那么這表明這些系統在處理信息的方式上存在更根本的弱點。

微調測試

為了測試模型的缺陷能否通過實踐克服,GPT-4.1在上述綜合合成數據集上進行了微調。在進行微調之前,它的預測結果非常分散,所有類型的鐘面都存在顯著的誤差。在對數據集進行微調之后,其在標準鐘面上的準確率顯著提高,而在變形鐘面上的準確率則有所提升(但幅度較小)。

然而,指針經過修改的時鐘,例如指針變得更細或變成箭頭狀,仍然會產生很大的誤差。

出現了兩種截然不同的故障模式:在正常和變形的時鐘上,模型通常會錯誤判斷指針的方向;但在指針樣式改變的時鐘上,它經常混淆每根指針的功能,將小時誤認為分鐘,或將分鐘誤認為秒。

這張對比圖展示了模型最初的弱點以及通過微調實現的部分改進,圖中顯示了150個隨機選擇的時鐘的預測時間與實際時間(以秒為單位)。左側是微調之前,GPT-4.1的預測結果比較分散,并且通常與正確值相差甚遠,紅色對角線表示正確值。右側是在平衡合成數據集上進行微調之后,預測結果與真實值更加接近,盡管仍然存在一些誤差。

這表明該模型已經學會將指針的厚度等視覺特征與特定角色聯系起來,并且在這些線索發生變化時會遇到困難。

對不熟悉的設計的有限改進進一步引發了人們的懷疑:這種模型是否學習了報時的抽象概念,或者僅僅是改進了其模式匹配。

指針類型

因此,盡管微調提高了GPT-4.1在傳統模擬時鐘上的性能,但它對指針較細或箭頭形狀的時鐘的影響要小得多,這增加了一種可能性,即該模型的失敗不是源于抽象推理,而是源于對哪根指針是哪根指針的混淆。

為了測試消除這種混淆后準確率是否會提高,研究人員對模型對“修改后的指針”數據集的預測進行了新的分析。輸出結果分為兩組:GPT-4.1正確識別時針、分針和秒針的情況;以及未能正確識別的情況。

在微調之前和之后,對預測的平均絕對誤差(MAE)進行評估,并將結果與標準時鐘的結果進行比較;還使用表盤位置作為基線測量了每個指針的角度誤差

修改后的指針數據集中,微調前后有和沒有指針類型混淆的時鐘的誤差比較

混淆時鐘指針的角色會導致最大的誤差。當GPT-4.1將時針誤認為分針或將分針誤認為時針時,最終的時間估算結果往往相差甚遠。相比之下,錯誤判斷正確識別的指針方向所導致的誤差較小。在三個指針中,時針在微調前的角度誤差最大,而秒針的角度誤差最小。

在修改后的指針數據集中,經過微調之前和之后,對于有和沒有指針角色混淆的預測,指針類型的角度誤差。

為了僅關注方向性誤差,分析僅限于模型正確識別每個指針功能的案例。如果該模型已經內化了一般的報時概念,那么它在這些示例上的表現應該與在標準時鐘上的準確度相當。然而,它并沒有,準確度仍然明顯下降。

為了檢驗指針形狀是否會影響模型的方向感,研究人員進行了第二項實驗:創建了兩個新的數據集,每個數據集包含60個只有時針的合成時鐘,指向不同的分鐘刻度。一組數據集使用原始指針設計,另一組數據集使用修改后的版本。要求模型說出指針指向的刻度標記的名稱。

結果表明,修改后的指針識別準確率略有下降,但不足以解釋模型的整體缺陷。即使在之前表現良好的任務中,一個不熟悉的視覺特征似乎也足以擾亂模型的整體解讀。

GPT-4.1在標準、扭曲和修改后的時鐘上進行微調前后的性能,突出了不均衡的收益和持續存在的弱點。

結論

雖然這篇論文的重點乍一看似乎無關緊要,但視覺語言模型能否學會以100%的準確率讀取模擬時鐘,這一點其實也并不重要。這篇文章的真正意義在于它聚焦于一個更深層次的反復出現的問題:用更多(也更多樣化)的數據來填充模型,是否能夠獲得人類通過抽象和泛化獲得的那種領域理解;或者,唯一可行的途徑是否是向該領域注入足夠多的樣本,以便在推理過程中預測所有可能的變化。

這兩種方式都會引發人們對當前架構真正學習能力的懷疑。

譯者介紹

朱先忠,51CTO社區編輯,51CTO專家博客、講師,濰坊一所高校計算機教師,自由編程界老兵一枚。

原文標題:AI’s Struggle to Read Analogue Clocks May Have Deeper Significance,作者:Martin Anderson

責任編輯:姜華 來源: 51CTO內容精選
相關推薦

2021-03-22 17:16:04

AI 數據人工智能

2025-06-10 09:10:00

2021-08-02 19:37:27

AI人工智能新冠檢測

2018-05-07 10:23:27

AI 云計算

2025-09-08 18:08:28

AIClockBenchAGI

2024-03-25 11:37:40

機器學習人工智能進化算法

2025-06-03 08:51:00

2024-04-15 12:43:26

人工智能LLM

2021-12-24 16:53:31

AI人工智能

2025-01-21 08:00:00

2025-08-13 11:40:30

2020-10-14 10:29:58

人工智能

2024-06-25 10:07:14

AI產品

2025-09-29 02:00:00

RAGAgentAI

2023-12-14 11:19:52

開源AI

2021-09-06 09:56:10

人工智能AIAI 芯片

2025-08-14 08:20:38

2025-07-14 08:40:00

模型AI推理

2025-10-11 01:25:00

AI 編程ClaudeCursor
點贊
收藏

51CTO技術棧公眾號

不卡在线一区二区| 国产日本在线| 亚洲一区观看| 国产亚洲精品久久久久动| 成年网站在线播放| 永久免费网站在线| 91麻豆免费在线观看| 国产日韩在线观看av| 久久久香蕉视频| 精品免费在线| 亚洲成人a**站| 国产一级做a爰片久久| 欧美一卡二卡| 国产精品私人影院| 精品一区二区国产| 国产乱淫a∨片免费观看| 国产免费成人| 色综合色综合久久综合频道88| 在哪里可以看毛片| 一区二区视频| 欧美日本乱大交xxxxx| 无码人妻丰满熟妇区96| 在线欧美三级| 中文字幕一区在线观看| 国产亚洲污的网站| 色成年激情久久综合| 亚洲精品偷拍视频| 成人在线免费看| av毛片久久久久**hd| 亚洲综合在线小说| 中文字幕一区二区久久人妻| 野花国产精品入口| 欧美激情免费在线| 极品久久久久久| 日韩在线理论| 伊人精品在线观看| 丰满少妇一区二区三区| 成人免费直播在线| 日韩一卡二卡三卡| www.成人黄色| 97视频在线观看网址| 久久激情免费视频| 欧美另类综合| 久久成人亚洲精品| 老司机成人免费视频| 99热在线成人| 美女精品视频一区| 2018天天弄| 最新欧美人z0oozo0| www.99久久热国产日韩欧美.com| 亚洲ⅴ国产v天堂a无码二区| 久久不卡国产精品一区二区| 亚洲精品视频网上网址在线观看| 国产伦精品一区二区三区妓女| 国产三级精品三级在线观看国产| 精品对白一区国产伦| jjzz黄色片| 国内精品免费| 亚洲精品久久7777777| 亚洲专区区免费| 九九综合九九| 在线视频欧美日韩精品| www成人啪啪18软件| 四虎国产精品免费观看| 日韩视频中文字幕| 丰满少妇高潮久久三区| 欧美日韩网站| 久久久久久久一| 五月婷婷开心网| 米奇777在线欧美播放| 国产精品嫩草视频| 国产一区二区三区四区视频 | 欧美不卡视频一区| 一级一片免费播放| 超碰在线免费公开| 一区二区欧美国产| 姬川优奈av一区二区在线电影| 欧美高清另类hdvideosexjaⅴ | 免费观看在线色综合| 精品99久久久久久| 国产又黄又粗又猛又爽的视频| 久久综合五月婷婷| 亚洲欧美制服综合另类| 国产又色又爽又高潮免费| 亚洲乱码精品| 午夜精品久久久久久久久久久久| 99超碰在线观看| 精品无人码麻豆乱码1区2区| 亚洲xxxxx电影| 污视频网站在线播放| 日本一区免费视频| 青青草综合视频| jizz内谢中国亚洲jizz| 欧美日韩亚洲另类| 性欧美18—19sex性高清| 国产99久久精品一区二区300| 色偷偷888欧美精品久久久| 免费中文字幕在线观看| 美女精品在线| 亚洲伊人久久综合| 久久久久国产精品嫩草影院| 中文字幕一区视频| 国产亚洲天堂网| 亚洲精品一区二区三区中文字幕 | 国产韩日影视精品| 91高清视频在线免费观看| 在线观看毛片av| 99久久精品免费精品国产| 一本久久a久久精品vr综合| av2020不卡| 欧美久久免费观看| 伊人网伊人影院| 国模 一区 二区 三区| 国产精品久久久久久超碰| 免费观看黄色一级视频| 国产精品久久久久久av公交车 | √资源天堂中文在线| 国产av一区二区三区精品| 精品一区中文字幕| 欧美日韩一区二区三| 污片在线免费观看| 欧美日韩国产综合草草| 欧美bbbbb性bbbbb视频| 欧美精品国产一区二区| 国产日产久久高清欧美一区| 四虎影视精品成人| 亚洲一区二区3| 亚洲自拍第三页| 久久精品国产www456c0m| 欧美做爰性生交视频| 三级网站在线看| 亚洲精品成a人| 天堂av2020| 久久人人爽av| 久久99精品久久| 色视频一区二区| 亚洲av成人片色在线观看高潮| 久久久久久久久久久9不雅视频| 国产精品高潮在线| 久久视频www| 色播五月激情综合网| 香蕉网在线播放| 最新日韩欧美| 国产精品sss| 国产精品探花在线| 欧美不卡视频一区| 国产亚洲精品成人| 成人av在线电影| 国产女主播自拍| 久久男人av| 97超级碰在线看视频免费在线看| 热久久精品免费视频| 成人精品动漫| 国产亚洲在线播放| 国模私拍一区二区| 亚洲国产精品99久久久久久久久| 日韩中文字幕二区| 亚洲专区视频| 国产精品视频26uuu| 国产精品一区二区人人爽| 国产一级做a爱片久久毛片a| 黄页网站一区| 国产伦精品一区二区三区免 | 五月综合久久| 日av在线不卡| 国产高清精品一区| 99色在线观看| 日韩精品在线影院| 中文在线第一页| 国产精品久久久久影视| 免费成人黄色大片| 伊人成人在线视频| 美女主播视频一区| 国产成人亚洲一区二区三区| 久久精品国产欧美激情| 亚洲免费国产视频| 色综合中文字幕| 成年人在线免费看片| 黄页网站大全一区二区| www.好吊操| 欧美三级午夜理伦三级小说| 亚洲一区中文日韩| 国产成人手机视频| 综合久久亚洲| 婷婷久久一区| 国产91精品青草社区| 成年人在线观看| 日韩一区二区中文字幕| 日产精品久久久| 国产精品国产精品国产专区不蜜| 亚洲av无一区二区三区久久| 国产美女一区| 国产91porn| 国产精品一区二区99| 亚洲最大av网| 久久久成人av毛片免费观看| 欧美老少做受xxxx高潮| 欧美成人免费| 欧美成人综合网站| 最近中文字幕在线观看视频| 一区二区三区小说| 五月婷婷欧美激情| 成人app下载| 在线能看的av网站| 欧美一级网站| 嫩草影院中文字幕| 日韩欧美午夜| 久久亚洲国产精品日日av夜夜| 日韩综合久久| 日本中文字幕久久看| 羞羞视频在线观看免费| 在线视频欧美日韩精品| 婷婷久久久久久| 日韩欧美国产三级| 一区二区 亚洲| 国产精品99一区二区三| 日韩69视频在线观看| 青春草视频在线| 国产亚洲一区字幕| 性欧美暴力猛交69hd| eeuss影院在线观看| 亚洲精品xxx| www.日日夜夜| 8x8x8国产精品| 一级黄色av片| 日韩欧美精品在线观看| 国产小视频在线观看免费| 中文字幕综合网| 免费成人深夜天涯网站| 91啪九色porn原创视频在线观看| 丰满人妻一区二区三区53视频| 免费欧美在线视频| 杨幂毛片午夜性生毛片| 国产欧美大片| 三上悠亚久久精品| 黑丝一区二区三区| 日韩视频一二三| 91精品啪在线观看国产81旧版| 日韩欧美一区二区三区四区五区 | 欧美人与动牲性行为| 精品国产欧美一区二区三区成人| 国产大片在线免费观看| 欧美.日韩.国产.一区.二区| 97久久超碰国产精品| 亚洲男女性事视频| 精品伦精品一区二区三区视频| 无码人妻精品一区二区蜜桃色欲| 亚洲成人一区二区在线观看| 免费无码毛片一区二区app| 亚洲丝袜精品丝袜在线| 美女网站视频色| 国产精品高潮呻吟久久| 欧美色图17p| 国产精品色一区二区三区| 天天操天天爽天天射| 不卡的av影片| 欧美美最猛性xxxxxx| 手机在线免费av| 亚洲国产一区二区久久| 国内精品久久久久久| 丰满的护士2在线观看高清| 久久免费成人精品视频| 女人让男人操自己视频在线观看| 97人人爽人人喊人人模波多| 麻豆免费版在线观看| 国产91久久婷婷一区二区| abab456成人免费网址| 国产欧美日韩中文| 秋霞一区二区| 九9re精品视频在线观看re6 | 国产三级精品在线不卡| 日韩a级大片| 日本高清视频一区二区三区| 日韩欧美一区二区三区在线视频| 国产美女视频免费| 国产中文一区| 久久久免费视频网站| 麻豆久久久久久| 下面一进一出好爽视频| 99热在这里有精品免费| 亚洲精品一区二区三区影院忠贞| 中文字幕一区三区| 久久成人国产精品入口| 欧美日韩国产精品一区二区三区四区 | 一区二区三区在线视频播放| 日韩成人免费观看| 欧美午夜宅男影院| 精品人妻aV中文字幕乱码色欲| 亚洲国产天堂久久综合网| 99视频在线观看地址| 欧美高清videos高潮hd| 亚洲www啪成人一区二区| 亚洲综合第一页| 要久久爱电视剧全集完整观看 | 欧美天堂一区二区三区| 久久精品成人一区二区三区蜜臀| 污视频免费在线观看| 日本欧美中文字幕| 日韩精品中文字幕一区二区| 免费av在线一区二区| 外国成人激情视频| 日本三级免费网站| 国产一区二区不卡| 黄色工厂在线观看| 一区二区三区精密机械公司| 91黑人精品一区二区三区| 欧美不卡在线视频| 日本视频不卡| 秋霞午夜一区二区| 都市激情亚洲| 亚洲一区 在线播放| 免费看欧美美女黄的网站| 国产a级黄色片| 成人欧美一区二区三区白人| 国产农村妇女aaaaa视频| 日韩欧美www| 日本韩国在线视频爽| 国产成人+综合亚洲+天堂| 国产伦精品一区二区三区在线播放 | 日本少妇xxx| 国产精品护士白丝一区av| 免费黄色网址在线| 亚洲国产精品人久久电影| 超碰在线免费播放| 成人黄色大片在线免费观看| 极品美女一区二区三区| 国产黄视频在线| 国产成a人亚洲| 欧美性x x x| 欧美精品电影在线播放| 成人性生交大片免费看午夜 | 久久久9色精品国产一区二区三区| 8v天堂国产在线一区二区| 国产黄a三级三级三级| 精品久久国产精品| 日本一区免费网站| 日韩欧美电影一区二区| 另类亚洲自拍| av在线网站观看| 天天做天天摸天天爽国产一区| 亚洲女同志亚洲女同女播放| 欧美精品在线播放| 美国十次综合久久| 女人床在线观看| 国产成人精品网址| 玖玖爱免费视频| 精品伦理精品一区| 国产网红女主播精品视频| 国产成人精品福利一区二区三区| 欧美日韩国产亚洲一区| 丰满少妇中文字幕| 一区二区三区精品| 黄色www视频| 7m第一福利500精品视频| 清纯唯美亚洲经典中文字幕| 欧美 国产 综合| 久久嫩草精品久久久久| 69视频免费看| 中文字幕在线日韩| 99精品视频在线免费播放 | 日本美女在线中文版| 成人久久久久久| 综合视频在线| 女同性αv亚洲女同志| 亚洲第一成年网| 手机福利小视频在线播放| 日韩av观看网址| 日韩欧美三级| 欧美一级片在线免费观看| 午夜久久久久久久久久一区二区| 欧美熟妇另类久久久久久不卡 | 波多野结衣一区二区三区四区| 国产亚洲精品久久久久动| 久久精品超碰| 日本aa在线观看| 久久久影视传媒| 91麻豆国产视频| 久久久久女教师免费一区| 色橹橹欧美在线观看视频高清| 天天操,天天操| 一区二区三区欧美在线观看| 久热在线视频观看| 亚瑟一区二区三区四区| 91av俱乐部| 亚洲欧美激情插 | 国产一级做a爰片久久毛片男| av资源网一区| 91成人国产综合久久精品| 91精品国产91久久久久| 日韩系列欧美系列| 男人网站在线观看| 欧美日韩精品一区二区三区蜜桃| 免费污视频在线| 日韩欧美激情一区二区| 成人免费看视频| 依依成人在线视频| 91 com成人网| 一区二区三区国产免费| 国产精品自在欧美一区| 久草手机在线观看|