精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI為何讀不懂鐘表?模擬時鐘暴露的認知短板與AI進化隱憂? 原創

發布于 2025-5-28 10:27
瀏覽
0收藏

中國與西班牙的聯合研究質疑當前AI通過數據擴容實現類人泛化能力的可行性,強調需突破架構限制以構建抽象推理機制,并呼吁重新審視“智能”的本質定義。

引言

中國和西班牙研究人員發表的一篇新論文發現,即使是像GPT-4.1這樣的先進多模態人工智能模型,也難以從模擬時鐘圖像中識別時間。時鐘中細微的視覺變化都可能導致嚴重的解讀錯誤,而微調也只對熟悉的示例有效。這一結果引發了人們對這些模型在現實世界任務中處理不熟悉圖像時的可靠性的擔憂。

當人類對某個領域(例如重力或其他基本物理原理)有了足夠深入的理解時,我們就能超越具體的例子,掌握其背后的抽象概念。這使我們能夠創造性地跨情境運用這些知識,并通過識別實際應用中的原理來識別新的實例,即使是那些我們從未見過的實例。

當一個領域足夠重要時,我們甚至可能在它并不存在的地方感知到它,就像??空想性錯視??一樣,其驅動力在于無法識別真實實例的高昂代價。這種模式識別的生存機制如此強大,以至于它甚至促使我們在沒有模式的地方??尋找更廣泛的模式??。?

一個領域在我們心中灌輸得越早、越反復,它的基礎就越????,并且會持續一生;我們在兒童時期接觸到的最早的視覺數據集之一就是教學時鐘,其中印刷材料或交互式模擬時鐘被用來教我們如何看時間:?

AI為何讀不懂鐘表?模擬時鐘暴露的認知短板與AI進化隱憂?-AI.x社區

??幫助孩子學習認識時間的教具???

盡管??手表設計時尚的變化??有時會給我們帶來挑戰,但這種早期領域掌握的彈性令人印象深刻,即使面對復雜或“古怪”的設計選擇,我們也能辨別模擬鐘面:?

AI為何讀不懂鐘表?模擬時鐘暴露的認知短板與AI進化隱憂?-AI.x社區

??高級定制腕表??中的一些挑戰性面孔?

人類??不需要成千上萬的例子??來了解時鐘的工作原理;一旦掌握了基本概念,我們幾乎可以識別任何形式,即使是扭曲或抽象的形式。?

相比之下,人工智能模型在完成這項任務時面臨的困難凸顯了一個更深層次的問題:它們的表面實力可能更多地取決于大量的曝光,而不是理解。

超越模仿游戲?

在近期對大型模型的研究中,表面表現與真正“理解”之間的矛盾反復浮現。上個月,浙江大學和西湖大學在一篇題為《博士級LLM真正掌握初等加法嗎?》(非本文重點)的?論文??中重新闡述了這個問題,并得出結論:?

“盡管基準令人印象深刻,但模型顯示出對模式匹配而非真正理解的嚴重依賴,這由符號表示的失敗和基本屬性的違反所證明。

明確的規則規定會損害性能,這表明存在固有的架構限制。這些見解揭示了評估方面的差距,并強調了對能夠進行超越模式識別的真正數學推理的架構的需求。”

本周,這個問題再次被提出,由南京航空航天大學和西班牙馬德里理工大學合作完成。這篇題為《多模態大型語言模型(MLLM)真的學會了在模擬時鐘上報時嗎?》的??新論文?探討了多模態模型對報時理解的程度。?

盡管論文中僅詳細介紹了研究進展,但研究人員的初步測試表明,OpenAI的?GPT-4.1??多模態語言模型難以從多種時鐘圖像中正確讀取時間,即使在簡單的情況下也經常給出錯誤的答案。?

這表明模型的訓練數據可能存在缺口,因此需要一個更均衡的數據集,以測試模型是否能夠真正學習其背后的概念。因此,作者整理了一個模擬時鐘的合成數據集,均勻地覆蓋了所有可能的時間,并避免了互聯網圖像中常見的偏差:

AI為何讀不懂鐘表?模擬時鐘暴露的認知短板與AI進化隱憂?-AI.x社區

研究人員合成模擬時鐘數據集中的一個??示例?,用于在新研究中微調GPT模型?

??在對新數據集進行微調?之前,GPT-4.1一直無法讀取這些時鐘。然而,在接觸了新數據集一段時間后,它的表現有所改善——但前提是新圖像與它之前見過的圖像相似。?

當時鐘的形狀或指針的樣式發生變化時,準確度會急劇下降;即使是很小的調整,例如更細的指針或箭頭(下圖最右邊),也足以使其偏離目標;此外,GPT-4.1還難以解讀達利風格的“?融化時鐘??”:?

AI為何讀不懂鐘表?模擬時鐘暴露的認知短板與AI進化隱憂?-AI.x社區

??標準設計的時鐘圖像(左)、變形的時鐘圖像(中)和修改后的指針圖像(右),以及GPT-4.1微調前后返回的時間??

作者推斷,當前的模型(例如GPT-4.1)可能主要通過視覺模式匹配來學習讀鐘,而不是通過任何更深層次的時間概念,并斷言:

“當時鐘變形或指針變細并帶有箭頭時,GPT-4.1就會失效。在150個隨機時間上進行的時間估計中,初始時鐘的平均絕對誤差(MAE)為232.48秒,形狀變形時為1380.69秒,指針改變時為3726.93秒。

這些結果表明,MLLM并沒有學會看時間,而是記住了模式。”

足夠的時間

大多數訓練數據集依賴于抓取的網絡圖像,這些圖像往往會重復特定的時間——尤其是10:10,這是??手表廣告中流行的設置??:?

AI為何讀不懂鐘表?模擬時鐘暴露的認知短板與AI進化隱憂?-AI.x社區

從新論文中,我們可以看到模擬時鐘圖像中“十點十分”時間的流行情況

由于所描繪的時間范圍有限,模型可能只能看到狹窄范圍的時鐘配置,從而限制了其超越這些重復模式進行概括的能力。

關于模型為何無法正確解釋時鐘扭曲的問題,論文指出:

“盡管GPT-4.1在標準時鐘圖像上表現非常出色,但令人驚訝的是,通過使時鐘指針變細并添加箭頭來修改時鐘指針會導致其準確性顯著下降。

直觀地看,人們可能會認為視覺上更復雜的變化——扭曲的表盤——會對性能產生更大的影響,但這種修改似乎影響相對較小。

這就引出了一個問題:MLLM如何解讀時鐘,以及它們為什么會失敗?一種可能性是,較細的指針會削弱模型感知方向的能力,從而削弱其對空間方向的理解。

或者,當模型嘗試將時針、分針和秒針組合成準確的時間讀數時,可能會有其他因素造成混淆。”

作者認為,找出這些失敗的根本原因是推進多模態模型的關鍵:如果問題在于模型如何感知空間方向,微調可能會提供一個簡單的解決方案;但如果問題源于整合多種視覺線索的更大困難,那么這表明這些系統在處理信息的方式上存在更根本的弱點。

微調測試

為了測試模型的缺陷能否通過實踐克服,GPT-4.1在上述綜合合成數據集上進行了微調。在進行微調之前,它的預測結果非常分散,所有類型的鐘面都存在顯著的誤差。在對數據集進行微調之后,其在標準鐘面上的準確率顯著提高,而在變形鐘面上的準確率則有所提升(但幅度較小)。

然而,指針經過修改的時鐘,例如指針變得更細或變成箭頭狀,仍然會產生很大的誤差。

出現了兩種截然不同的故障模式:在正常和變形的時鐘上,模型通常會錯誤判斷指針的方向;但在指針樣式改變的時鐘上,它經常混淆每根指針的功能,將小時誤認為分鐘,或將分鐘誤認為秒。

AI為何讀不懂鐘表?模擬時鐘暴露的認知短板與AI進化隱憂?-AI.x社區

這張對比圖展示了模型最初的弱點以及通過微調實現的部分改進,圖中顯示了150個隨機選擇的時鐘的預測時間與實際時間(以秒為單位)。左側是微調之前,GPT-4.1的預測結果比較分散,并且通常與正確值相差甚遠,紅色對角線表示正確值。右側是在平衡合成數據集上進行微調之后,預測結果與真實值更加接近,盡管仍然存在一些誤差。

這表明該模型已經學會將指針的厚度等視覺特征與特定角色聯系起來,并且在這些線索發生變化時會遇到困難。

對不熟悉的設計的有限改進進一步引發了人們的懷疑:這種模型是否學習了報時的抽象概念,或者僅僅是改進了其模式匹配。

指針類型

因此,盡管微調提高了GPT-4.1在傳統模擬時鐘上的性能,但它對指針較細或箭頭形狀的時鐘的影響要小得多,這增加了一種可能性,即該模型的失敗不是源于抽象推理,而是源于對哪根指針是哪根指針的混淆。

為了測試消除這種混淆后準確率是否會提高,研究人員對模型對“修改后的指針”數據集的預測進行了新的分析。輸出結果分為兩組:GPT-4.1正確識別時針、分針和秒針的情況;以及未能正確識別的情況。

在微調之前和之后,對預測的平均絕對誤差(MAE)進行評估,并將結果與標準時鐘的結果進行比較;還使用表盤位置作為基線測量了每個指針的角度誤差

AI為何讀不懂鐘表?模擬時鐘暴露的認知短板與AI進化隱憂?-AI.x社區

修改后的指針數據集中,微調前后有和沒有指針類型混淆的時鐘的誤差比較

混淆時鐘指針的角色會導致最大的誤差。當GPT-4.1將時針誤認為分針或將分針誤認為時針時,最終的時間估算結果往往相差甚遠。相比之下,錯誤判斷正確識別的指針方向所導致的誤差較小。在三個指針中,時針在微調前的角度誤差最大,而秒針的角度誤差最小。

AI為何讀不懂鐘表?模擬時鐘暴露的認知短板與AI進化隱憂?-AI.x社區

在修改后的指針數據集中,經過微調之前和之后,對于有和沒有指針角色混淆的預測,指針類型的角度誤差。

為了僅關注方向性誤差,分析僅限于模型正確識別每個指針功能的案例。如果該模型已經內化了一般的報時概念,那么它在這些示例上的表現應該與在標準時鐘上的準確度相當。然而,它并沒有,準確度仍然明顯下降。

為了檢驗指針形狀是否會影響模型的方向感,研究人員進行了第二項實驗:創建了兩個新的數據集,每個數據集包含60個只有時針的合成時鐘,指向不同的分鐘刻度。一組數據集使用原始指針設計,另一組數據集使用修改后的版本。要求模型說出指針指向的刻度標記的名稱。

結果表明,修改后的指針識別準確率略有下降,但不足以解釋模型的整體缺陷。即使在之前表現良好的任務中,一個不熟悉的視覺特征似乎也足以擾亂模型的整體解讀。

AI為何讀不懂鐘表?模擬時鐘暴露的認知短板與AI進化隱憂?-AI.x社區

GPT-4.1在標準、扭曲和修改后的時鐘上進行微調前后的性能,突出了不均衡的收益和持續存在的弱點。

結論

雖然這篇論文的重點乍一看似乎無關緊要,但視覺語言模型能否學會以100%的準確率讀取模擬時鐘,這一點其實也并不重要。這篇文章的真正意義在于它聚焦于一個更深層次的反復出現的問題:用更多(也更多樣化)的數據來填充模型,是否能夠獲得人類通過抽象和泛化獲得的那種領域理解;或者,唯一可行的途徑是否是向該領域注入足夠多的樣本,以便在推理過程中預測所有可能的變化。

這兩種方式都會引發人們對當前架構真正學習能力的懷疑。

譯者介紹

朱先忠,51CTO社區編輯,51CTO專家博客、講師,濰坊一所高校計算機教師,自由編程界老兵一枚。

原文標題:??AI’s Struggle to Read Analogue Clocks May Have Deeper Significance??,作者:Martin Anderson

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏
回復
舉報
1條回復
按時間正序
/
按時間倒序
開源情報研究
開源情報研究

只是缺少訓練,這個應該不是很難的問題

回復
2025-5-28 16:45:51
回復
相關推薦
亚洲午夜黄色| 欧美性生活一级片| 亚洲午夜精品在线| 久久久久天天天天| 中文字幕乱码一区二区| 欧美区日韩区| 亚洲欧美国产视频| 6080国产精品| 涩涩涩在线视频| 国产精品成人网| 好吊妞www.84com只有这里才有精品 | 中文字幕亚洲情99在线| 亚洲一二三四五| 欧美精品高清| 亚洲第一久久影院| 一区二区免费在线视频| 色窝窝无码一区二区三区| 卡一卡二国产精品| 欧美在线www| 欧美日韩国产精品综合| 日韩免费av| 亚洲精品一区二区在线| 波多野吉衣在线视频| 福利一区和二区| 韩曰欧美视频免费观看| 嫩草影院中文字幕| 免费高清在线观看| 久久久久久久免费视频了| 国产精品成人一区二区三区| 一级片视频网站| 日韩精品乱码免费| 97在线精品国自产拍中文| 欧美国产日韩在线观看成人| 欧美亚洲在线日韩| 亚洲欧美中文日韩v在线观看| 国产av一区二区三区传媒| 国产精一区二区| 欧美日韩综合在线免费观看| www一区二区www免费| 污的网站在线观看| 亚洲色图欧洲色图婷婷| 中文字幕精品一区日韩| yw视频在线观看| 久久老女人爱爱| 精品欧美一区二区在线观看视频 | 国产91露脸合集magnet| 91在线精品播放| 国产一区二区在线视频聊天| 卡一卡二国产精品| 国产一区红桃视频| 亚洲视频在线免费播放| 美女任你摸久久 | 日韩在线观看中文字幕| 在线不卡欧美精品一区二区三区| 天天干天天玩天天操| 欧洲成人一区| 欧美日韩精品福利| 亚洲欧美手机在线| 国产精品亚洲四区在线观看| 欧美一区二区女人| 在线观看欧美一区二区| 1769国产精品视频| 亚洲第一区在线观看| 中文字幕在线视频播放| 色爱av综合网| 一区国产精品视频| 女人18毛片毛片毛片毛片区二 | 久久视频免费观看| 欧美成人三级视频| 亚洲三级视频| 国产aaa精品| 糖心vlog精品一区二区| 久久精品99国产精品日本| 亚洲一区二区三区777| 国产成人无码www免费视频播放| 成人中文字幕电影| 另类欧美小说| 91女主播在线观看| 一区二区高清免费观看影视大全| 97碰在线视频| 在线天堂中文资源最新版| 在线免费av一区| 一区二区三区四区毛片| 草草视频在线一区二区| 亚洲欧美中文另类| 男女做暖暖视频| 在线亚洲欧美| 成人欧美在线视频| 西西人体44www大胆无码| 亚洲国产精品av| 欧美在线观看视频免费| 在线天堂资源www在线污| 欧美卡1卡2卡| 久久人人爽人人人人片| 久久精品高清| 97超碰色婷婷| 国产精品久久久久久无人区| 97久久精品人人做人人爽| 日韩av免费电影| 影音先锋在线播放| 色欧美乱欧美15图片| 超碰人人cao| 国产一区二区区别| 欧美激情一级欧美精品| 中文字幕免费播放| 99这里只有精品| 一本二本三本亚洲码| 国产一二三在线| 欧美一三区三区四区免费在线看| 捆绑凌虐一区二区三区| 婷婷激情综合| 日本一区二区三区四区视频| 精品人妻无码一区二区三区蜜桃一| 久久一夜天堂av一区二区三区| 性生活免费观看视频| 另类中文字幕国产精品| 亚洲护士老师的毛茸茸最新章节| 九九这里只有精品视频| 久久国产福利| 国产精品中出一区二区三区| 色综合久久久久综合一本到桃花网| 精品二区三区线观看| 午夜福利123| 日韩精品一区二区三区免费观影| 欧美有码在线观看| 你懂的网站在线| 亚洲精品中文在线观看| 色哟哟精品视频| 日韩精品福利一区二区三区| 欧美激情亚洲激情| wwwxxxx国产| 亚洲精品成人精品456| 五月婷婷六月丁香激情| 欧美理论在线播放| 日韩av片电影专区| 青青草娱乐在线| 精品久久久国产| 熟妇人妻久久中文字幕| 影音先锋亚洲精品| 99影视tv| 男插女视频久久久| 日韩欧美国产不卡| 久久精品www| 顶级嫩模精品视频在线看| 成人短视频在线观看免费| 国产电影一区| 久热精品视频在线观看一区| 国产免费黄色大片| 1区2区3区国产精品| 国产乱码一区二区三区四区| 99久久亚洲精品蜜臀| 国产日产欧美a一级在线| 中文字幕在线免费| 在线播放/欧美激情| 在线观看亚洲网站| 国产大陆a不卡| 91成人综合网| 男人的天堂久久| 欧美又大又粗又长| 国产福利电影在线| 欧美日韩国产精选| 可以直接看的黄色网址| 国产成人在线观看| 免费看一级大黄情大片| 欧美女王vk| 国产欧美中文字幕| 性欧美高清come| 亚洲精品美女在线| 成人免费一级片| 成人免费在线观看入口| 成年人小视频在线观看| 国产精品综合| 亚洲视频导航| 高清精品xnxxcom| 人人澡人人澡人人看欧美| 国产日产精品久久久久久婷婷| 欧美日韩精品一区二区三区 | 成人动漫在线免费观看| 91.麻豆视频| 国产无精乱码一区二区三区| 久久久精品黄色| av免费一区二区| 狠久久av成人天堂| 欧美精品久久久| 国产免费av国片精品草莓男男 | 嫩草伊人久久精品少妇av杨幂| 日日噜噜噜夜夜爽亚洲精品| 亚洲国产中文字幕在线| 欧美午夜影院在线视频| 免费在线观看黄色小视频| 大桥未久av一区二区三区中文| 任你操这里只有精品| 永久91嫩草亚洲精品人人| 麻豆成人av| 欧洲精品99毛片免费高清观看| 欧美在线观看一区二区三区| 日本中文字幕在线播放| 亚洲激情视频在线| 国产精品国产av| 色哟哟一区二区在线观看| 青青青在线免费观看| 国产亚洲视频系列| 秘密基地免费观看完整版中文| 日韩成人免费电影| 精品久久一二三| 亚洲精品a级片| 欧洲精品国产| 国产精品超碰| 亚洲qvod图片区电影| 日韩av免费| 69视频在线免费观看| 国产素人视频在线观看| 亚洲香蕉伊综合在人在线视看| 男人天堂网在线视频| 欧美一区三区二区| 亚洲av无码乱码国产精品fc2| 亚洲第一av色| 欧美被狂躁喷白浆精品| 亚洲欧洲国产专区| 黄色片在线观看免费| 99久久er热在这里只有精品15| 在线观看视频在线观看| 久久国产综合精品| 黄色aaa级片| 丝袜亚洲另类欧美| 久久久久久久中文| 亚洲欧洲一区| 91午夜在线观看| 欧美精品九九| mm131午夜| 天天综合亚洲| 亚洲一区二区在线免费观看| 不卡在线一区二区| 日本成人三级| 国产在线观看91一区二区三区| 久久66热这里只有精品| 鲁大师精品99久久久| 国产欧美综合精品一区二区| 一区三区自拍| 成人资源av| 97se亚洲| 国产亚洲自拍偷拍| 久久中文字幕导航| 精品无人区一区二区三区 | 亚洲欧美国产精品桃花| 欧美精品尤物在线观看| 亚洲精品久久久久久一区二区| 欧美综合另类| 在线免费一区| 中文无码久久精品| 国产精品自拍合集| 亚洲小说区图片区| 精品国产一二三四区| 久久福利影视| 五月婷婷狠狠操| 久久福利资源站| 午夜免费视频网站| 国产成人日日夜夜| 中文字幕天堂网| 91在线观看地址| 日韩中文字幕电影| 国产精品乱码一区二三区小蝌蚪| 欧美福利在线视频| √…a在线天堂一区| 久草国产在线视频| 欧美日韩一区二区在线播放| 波多野结衣绝顶大高潮| 欧美久久久久久蜜桃| www.日韩在线观看| 亚洲精品网址在线观看| av片在线看| 欧美夫妻性生活xx| 亚洲精品**中文毛片| 国产日韩欧美中文在线播放| 欧美区一区二区| 久久精品aaaaaa毛片| 教室别恋欧美无删减版| 欧美日韩一级在线| 日韩午夜在线| 日韩肉感妇bbwbbwbbw| 国产美女在线观看一区| 中文字幕 亚洲一区| 日本一区二区三级电影在线观看| 国产一二三区精品| 香蕉乱码成人久久天堂爱免费| 欧美brazzers| 欧美一级二级三级蜜桃| 日本中文字幕一区二区有码在线| 日韩视频第一页| 日韩激情电影| 亚洲一区亚洲二区亚洲三区| 琪琪久久久久日韩精品| 青青草原国产免费| 国产日本精品| 特级西西444www| 久久久精品国产99久久精品芒果| 欧美成人精品欧美一级私黄| 91黄色小视频| 人妻一区二区三区| 日韩在线观看免费高清| 在线观看福利电影| 成人av片网址| 久久亚洲专区| 亚洲成熟丰满熟妇高潮xxxxx| 国产精品自拍一区| 日本xxxxxxxxx18| 午夜精品福利久久久| 99久久一区二区| 在线午夜精品自拍| 亚洲天堂手机| 国产精品一 二 三| 中文精品久久| 国产福利精品一区二区三区| 久久女同精品一区二区| 久久精品这里有| 91精品一区二区三区在线观看| 精品久久av| 91高清视频在线免费观看| 亚洲日本va午夜在线电影| 一本色道久久综合亚洲精品婷婷 | 成a人片在线观看www视频| 韩国精品久久久999| 69精品国产久热在线观看| 曰韩不卡视频| 免费在线观看一区二区三区| 男生草女生视频| 色婷婷一区二区三区四区| 国产1区在线观看| 久久久久久香蕉网| 日韩视频在线直播| 欧美日韩午夜爽爽| 国产精品资源在线| 亚洲女人久久久| 欧美另类videos死尸| 77777影视视频在线观看| 国产精品av在线| 久久超碰99| 丁香啪啪综合成人亚洲| 久久综合网色—综合色88| 黄网在线观看视频| 日韩av中文字幕在线| 欧美gv在线| 鲁片一区二区三区| 老司机精品福利视频| 99久久久久久久久久| 欧美性猛交xxxx黑人猛交| 天堂在线中文字幕| 国产精品h片在线播放| 国产尤物久久久| 国产日韩欧美久久| 亚洲视频免费观看| 性做久久久久久久久久| 久久久久久久影院| 老司机成人在线| 情侣黄网站免费看| 国产丝袜在线精品| 在线观看国产小视频| 精品国产欧美成人夜夜嗨| 精品午夜视频| 久久av综合网| 久久综合中文字幕| 一区二区视频网站| 免费91在线视频| 精品按摩偷拍| 91福利国产成人精品播放| 亚洲欧美成aⅴ人在线观看| 亚洲国产精品一| 青青草99啪国产免费| 日韩国产一区| 国产亚洲精品成人a| 欧美视频在线观看免费| а√天堂中文在线资源bt在线| 91久久久久久久久久久| 欧美三级视频| 欧美图片第一页| 欧美一区三区四区| 一区一区三区| 中文字幕中文字幕在线中心一区 | 国产麻豆一区二区三区在线观看| 国产一级久久| 在线日韩国产网站| 亚洲精品国产美女| 国产欧美自拍| 国产主播自拍av| 国产精品美日韩| 日韩一级中文字幕| 国产免费久久av| 国产欧美精品| 精品人妻伦九区久久aaa片| 亚洲第一精品夜夜躁人人爽| jizz欧美| 91视频最新入口| 亚洲人成网站色在线观看| 日本黄在线观看| 97神马电影| 美腿丝袜亚洲色图| 国产小视频在线免费观看| 久久久国产精品亚洲一区| 亚洲婷婷伊人| 国产性猛交96|