精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

GPT-4o們其實都是眼盲!OpenAI奧特曼自曝自家模型:推理比人弱。研究證明:多模態能力還差得遠,楊立昆上大 原創

發布于 2024-7-15 09:34
瀏覽
0收藏

奧特曼大手一揮規劃了AI最新的分級系統!

就像自動駕駛領域的L5一樣,OpenAI提出的AI L5是“完美打工人”——OpenAI稱之為組織者,即能夠完成組織工作的人工智能。

其他1-4的等級分別是:

1:聊天機器人,具有會話語言能力的人工智能

2:推理者,人類水平的問題解決能力

3:代理,能夠采取行動的系統

4:創新者,能夠幫助發明的人工智能

GPT-4o們其實都是眼盲!OpenAI奧特曼自曝自家模型:推理比人弱。研究證明:多模態能力還差得遠,楊立昆上大-AI.x社區圖片

從OpenAI 內部測試的前沿模型出發,奧特曼認為OpenAI已經非常接近第二階段了,模型將達到類似人類的推理能力。

也就是說——雖然GPT在解決很多問題上秒殺人類,但OpenAI目前發布的產品都是弱于人類推理的。

就像AI大佬楊立昆那句反直覺的斷言:再前沿的AI并不比你的貓或者狗智能!

GPT-4o們其實都是眼盲!OpenAI奧特曼自曝自家模型:推理比人弱。研究證明:多模態能力還差得遠,楊立昆上大-AI.x社區圖片

從視覺這點也是如此,大模型甚至在簡單的數數問題上全軍覆沒。

由于訓練素材帶來的偏見,任何像五環的圖案,都會被模型認為有五個圈圈。

GPT-4o們其實都是眼盲!OpenAI奧特曼自曝自家模型:推理比人弱。研究證明:多模態能力還差得遠,楊立昆上大-AI.x社區圖片

雖然GPT-4o and Gemini 1.5 Pro等前沿模型都使用過“視覺理解”、“視覺能力”來宣傳自己的產品。

但奧本大學和阿爾伯塔大學的研究人員進行的研究,但揭示了當前人工智能模型的視覺理解能力還很初級。

LLM并不是真的憑借“看”來解決問題,而是像它們組織文字那樣:將輸入數據中的模式與其訓練數據中的模式一一匹配。

因此,GPT-4o們實際對自己“看到”的東西一無所知,對環、重疊、交叉等概念的沒有任何實際的視覺理解!

1.重疊形狀測試:兩圓距離接近時,GPT勝率掉至18%

一個經典的的視覺推理任務就是重疊形狀測試。

題目是,給定兩個圓,它們之間略有重疊、剛好接觸或有一定距離時,由模型判斷兩圓是否有交疊的部分。

大模型的表現極其不穩定。

當它們相距較遠時,GPT-4o在95%以上的情況下能夠正確回答,但在零或小距離下,僅有18%的正確率。Gemini Pro 1.5表現最佳,但在接近距離時便只有7成的正確率。

GPT-4o們其實都是眼盲!OpenAI奧特曼自曝自家模型:推理比人弱。研究證明:多模態能力還差得遠,楊立昆上大-AI.x社區圖片

2.環形圖案測試:僅在五環圖案時,LLM有100%爭取率

在第二個視覺推理測試中,大模型被要求識別環形圖案由多少個圓圈組成。

當圖片中出現五個環時,大模型得到百分之百的正確率。但接下來增加一個環則完全毀掉了結果!

Gemini迷失了,在接近距離時一次也沒能正確回答。Sonnet-3.5在六次中……三分之一的時間內得到了正確答案,而GPT-4o則略低于半數的正確率。

GPT-4o們其實都是眼盲!OpenAI奧特曼自曝自家模型:推理比人弱。研究證明:多模態能力還差得遠,楊立昆上大-AI.x社區圖片

這個實驗的目的很簡單,即展示這些模型無論做什么,都不是我們認為的“看”。

畢竟,即使它們視覺能力差,我們也不會期望它們在六、七、八、九個環的圖片上表現差異如此之大。

測試的其他任務顯示了類似的模式;問題并不在于它們的視覺理解或推理能力好壞,而似乎是它們在某些情況下能夠計數的另一種原因。

當然,其中一個潛在的答案正擺在我們面前:為什么它們在得到一個五環圖片的問題上表現得如此出色,但在其它情況下,或是在五個五邊形的情況下卻如此糟糕?(公正地說,Sonnet-3.5在這方面表現還不錯。)

因為它們所有在訓練數據中都有一個五環的圖片:奧林匹克五環。

GPT-4o們其實都是眼盲!OpenAI奧特曼自曝自家模型:推理比人弱。研究證明:多模態能力還差得遠,楊立昆上大-AI.x社區圖片

這個標志不僅在訓練數據中反復出現,而且很可能在其替代文本、使用指南和關于它的文章中詳細描述。

但在它們的訓練數據中,你在哪里找到六個交錯環?或七個?如果它們的回應有任何指示:完全找不到!它們對自己“看到”的東西一無所知,對環、重疊或任何這些概念的沒有任何實際的視覺理解。

3.黑箱:沒有技術知道GPT-4o究竟看見了什么

研究人員被問到他們對視覺模型的“盲目性”有何看法。

研究者Nguyen寫道:“‘盲目’對于人類來說有多種定義,而對于AI這種類型的盲目——對我們展示的圖像的不敏感性來說,目前還沒有一個詞語”。

“目前沒有技術能夠準確可視化模型到底看到了什么。它們的行為是輸入文本提示、輸入圖像和數十億個權重的復雜函數。”

他推測,這些模型并不完全盲目,而是從圖像中提取的視覺信息是近似和抽象的,類似于用語言描述“左側有一個圓”。

但這些模型沒有辦法進行視覺判斷,使它們的回應就像某人對圖像有所了解但實際上并不能看見一樣。

最后,Nguyen發送了這個例子,支持了以上假設:

研究人員給模型提供了藍色圓圈和綠色圓圈,但圖中交叉部分并沒有混色。然而,在一般情況下,一個藍色圓圈和一個綠色圓圈重疊時,通常會出現一個青色陰影區域。

所以模型們就紛紛說自己看到了疊色的青色區域——實際上沒有存在。

GPT-4o們其實都是眼盲!OpenAI奧特曼自曝自家模型:推理比人弱。研究證明:多模態能力還差得遠,楊立昆上大-AI.x社區圖片

因此,盡管這些前沿的AI公司,在發表“閃亮的產品”時,將聲明表達得非常巧妙。

我們還能回憶起GPT-4o在發布會上是多么的令人驚喜。

雖然OpenAI想讓我們認為模型在某種意義上具備了“看”的能力——我們也是這樣做的。

但實際情況是,模型的工作方式與它們進行數學運算或撰寫故事的方式類似:將輸入數據中的模式與其訓練數據中的模式進行匹配。

這導致這些模型在某些看似微不足道的任務上也表現出失敗,比如隨機挑選一個數字,他們總是偏好37、47、57這樣的數字,因為人類給定的數據就是如此。

參考鏈接:https://techcrunch.com/2024/07/11/are-visual-ai-models-actually-blind/

本文轉載自??51CTO技術棧??

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2024-7-15 09:35:07修改
1
收藏
回復
舉報
1條回復
按時間正序
/
按時間倒序
Elina孫
Elina孫

666,姐不白看,姐給你點贊

回復
2024-7-16 23:13:18
回復
相關推薦
免费影院在线观看一区| 中文字幕亚洲欧美在线| 大陆av在线播放| 秋霞欧美在线观看| 天堂在线亚洲视频| 久久精品在线视频| 99re久久精品国产| 日日夜夜精品| 黄色成人在线播放| 亚洲自拍的二区三区| 国产综合视频在线| 免费精品视频最新在线| 色综合天天综合网国产成人网| 最近日本中文字幕| vam成人资源在线观看| 亚洲第一在线综合网站| 亚洲一区在线免费| 日本在线视频1区| 国内精品不卡在线| 国产精品69av| 国产一级特黄a高潮片| 区一区二视频| 日韩精品在线免费| 九色91porny| av免费在线一区| 亚洲大片在线观看| 可以免费看的黄色网址| 国产有码在线| 91在线视频播放地址| 国产在线高清精品| 日韩黄色一级视频| 国产欧美91| 欧美精品xxx| 在线观看亚洲网站| 久久在线视频免费观看| 国产偷国产偷亚洲清高网站| 国产大学生av| 天堂久久av| 91精品国产日韩91久久久久久| 成人一区二区三| 日本午夜大片a在线观看| 亚洲一区免费视频| 黄色www在线观看| 亚洲搞黄视频| 国产日韩亚洲欧美综合| 久久久亚洲综合网站| 黄色美女一级片| 国产成人av福利| 97影院在线午夜| 国产免费黄色录像| 国产一本一道久久香蕉| 91社区国产高清| 国产剧情久久久| 国产在线精品不卡| 亚洲va码欧洲m码| 99热这里只有精品在线观看| 精品一区二区三区在线视频| 国产欧美日韩精品专区| 夜夜爽8888| 久久99精品久久久久久动态图 | 美国十次了思思久久精品导航| 欧美在线免费视频| 日韩黄色片网站| 日本伊人午夜精品| 国产专区精品视频| 国产成a人亚洲精v品无码| 国产黄色成人av| 国产乱码精品一区二区三区卡| 国产91绿帽单男绿奴| 成人99免费视频| 麻豆精品传媒视频| 高清在线观看av| 国产精品九色蝌蚪自拍| 日韩中文字幕亚洲精品欧美| 三级福利片在线观看| 午夜精品一区二区三区三上悠亚| 99999精品视频| 蜜桃视频成人m3u8| 欧美一级高清片在线观看| 亚洲成人激情小说| 午夜a一级毛片亚洲欧洲| 亚洲三级黄色在线观看| 国产精品麻豆一区| 极品日韩av| 国产精品aaa| 99视频国产精品免费观看a| bt欧美亚洲午夜电影天堂| 日韩电影大全在线观看| av在线免费网址| 午夜精品福利一区二区三区av| 国产精品无码一本二本三本色| **国产精品| 精品亚洲一区二区| 999精品在线视频| 99亚洲一区二区| 国产精品久久久久久亚洲影视| 99视频在线观看免费| 91小视频在线免费看| 午夜精品区一区二区三| 美女网站视频在线| 欧美在线一二三四区| 国产黄色一区二区三区 | 日韩精品在线播放| 99久久久免费精品| 国产一区二区三区久久| 91在线免费视频| 久久精品a一级国产免视看成人| 亚洲六月丁香色婷婷综合久久| 欧美网站免费观看| 日韩视频一区二区三区四区| 国产一区二区三区网站| 国语对白一区二区| 国内精品免费**视频| 日本不卡一区| av有码在线观看| 在线播放欧美女士性生活| 国产精品三级在线观看无码| 欧美黄色免费| 成人疯狂猛交xxx| 九色视频在线观看免费播放| 亚洲18女电影在线观看| 国产裸体视频网站| 久久久久久久久丰满| 国产精品久久久久久久久影视| 手机在线不卡av| 一区二区三区不卡在线观看| 国产超碰在线播放| 精品国产国产综合精品| 精品72久久久久中文字幕| 久久久久久亚洲精品中文字幕| 国产伦理一区二区| 国产精品免费久久| 久久久久免费精品| 亚洲人成精品久久久| 久久久视频在线| 亚洲精品久久久蜜桃动漫| 亚洲天堂精品在线观看| www.99r| 岳的好大精品一区二区三区| 91成人精品网站| 特级丰满少妇一级aaaa爱毛片| 亚洲精品成a人| aaaaaaaa毛片| 欧美喷水视频| 97夜夜澡人人双人人人喊| 伊人手机在线| 欧美一区二区免费观在线| 黑人操日本美女| 国产一区二区三区综合| 亚洲第一精品区| 国产高清日韩| 欧美裸体xxxx极品少妇| va视频在线观看| 一区二区三区高清| 欧美一级片黄色| 久久久久久久波多野高潮日日| 久久精品99| 芒果视频成人app| 一本一本久久a久久精品综合小说 一本一本久久a久久精品牛牛影视 | 日本亚洲导航| 欧美性aaa| 久久在线免费视频| 亚洲毛片在线播放| 天天综合网天天综合色| 3d动漫精品啪啪一区二区下载| 媚黑女一区二区| 四虎一区二区| 激情五月综合婷婷| 2019亚洲男人天堂| 成人性爱视频在线观看| 欧美日韩二区三区| 久久午夜无码鲁丝片午夜精品| 成a人片亚洲日本久久| 青青草原成人网| 欧美日韩精品一区二区视频| 91老司机精品视频| 高清视频在线观看三级| 亚洲视频在线观看免费| 91久久久久国产一区二区| 亚洲尤物在线视频观看| 欧美老熟妇乱大交xxxxx| 久久国产剧场电影| 青娱乐自拍偷拍| av一区二区高清| 91视频最新| 欧美片第一页| 久久99久久99精品免观看粉嫩| 免费国产黄色片| 欧美丝袜丝交足nylons| 久草成人在线视频| 国产欧美精品日韩区二区麻豆天美| xxxx在线免费观看| 一区二区日韩免费看| 日韩电影天堂视频一区二区| 韩国一区二区三区视频| 国产精品99久久久久久久久久久久| 在线看三级电影| 国产一区二区免费| 乱色精品无码一区二区国产盗| 色婷婷av一区二区三区gif| 国产探花在线播放| 国产欧美一区二区在线观看| 亚洲午夜久久久久久久久| 日韩成人一区二区三区在线观看| 蜜臀精品一区二区| 天天射成人网| 秋霞毛片久久久久久久久| 在线日韩成人| 91精品综合视频| 欧美特黄aaaaaaaa大片| 久久琪琪电影院| 91精品国产91久久久久久青草| 中文字幕国产精品| 亚洲欧美自偷自拍| 欧美zozozo| 国产美女精品视频国产| 欧美无人高清视频在线观看| 日产亚洲一区二区三区| 一区二区视频在线看| 懂色av蜜臀av粉嫩av永久| 国产午夜精品理论片a级大结局| 久久免费精品国产| 国产寡妇亲子伦一区二区| 精品久久久99| 日韩福利电影在线| 日韩有码免费视频| 先锋影音久久久| heyzo国产| 99综合在线| 成人免费毛片在线观看| 狠狠爱成人网| 17c丨国产丨精品视频| 91精品综合| 熟女熟妇伦久久影院毛片一区二区| 日韩av二区| 亚洲免费久久| 国产精品福利在线观看播放| 日韩一区二区三区资源| 北条麻妃国产九九九精品小说| 欧美精品中文字幕一区二区| 欧美男同视频网| 日韩精品久久久| 欧美精品色图| 亚洲一卡二卡三卡四卡无卡网站在线看| 国产精品午夜一区二区三区| 欧美一区二区综合| 日韩精品2区| 亚洲欧美日韩另类精品一区二区三区 | 日韩视频在线视频| 亚洲国产精品第一区二区| 97干在线视频| 亚洲免费精品| 精品一卡二卡三卡| 喷水一区二区三区| 手机免费av片| 国产高清精品网站| chinese麻豆新拍video| 91美女福利视频| 国产精品20p| 亚洲人成亚洲人成在线观看图片| 亚洲最大的黄色网址| 亚洲午夜久久久| 欧美一区二区激情视频| 在线一区二区观看| 91精品国自产| 欧美成人vr18sexvr| 亚洲人成色777777老人头| 国产亚洲欧美aaaa| 黄网站免费在线播放| 欧美精品videos性欧美| 成人免费看黄| 国产在线一区二区三区| 风间由美一区二区av101| 欧美精品中文字幕一区二区| 91嫩草亚洲精品| av无码久久久久久不卡网站| 久久只有精品| 肉色超薄丝袜脚交| 97精品国产露脸对白| 永久免费毛片在线观看| 亚洲精品视频在线| 日韩在线 中文字幕| 91精品婷婷国产综合久久竹菊| 欧美一级在线免费观看| 尤物九九久久国产精品的特点| 在线观看wwwxxxx| 日本成人激情视频| 久久国际精品| 日韩成人av电影在线| 国产精品草草| 婷婷丁香激情网| 成人免费毛片高清视频| 国产1区2区在线观看| 亚洲一区二区三区在线看| 国产精品第六页| 亚洲成人激情在线| 天堂аⅴ在线地址8| 97av在线影院| 国产精品一区二区美女视频免费看 | 欧美大片在线看免费观看| 欧美电影免费看| 国产日本一区二区三区| 中文精品电影| 色www免费视频| 久久综合久久久久88| 毛片aaaaa| 欧美精品久久久久久久多人混战| 午夜在线视频观看| 色综合天天综合网国产成人网 | 久久久99999| 色综合天天综合狠狠| 欧洲成人一区二区三区| 欧美成在线视频| 啪啪av大全导航福利综合导航| 欧美亚洲免费高清在线观看 | 日本欧美一二三区| 1313精品午夜理伦电影| 天天干天天操天天干天天操| 日韩专区欧美专区| 呦呦视频在线观看| 亚洲午夜激情av| 国产sm主人调教女m视频| 一区二区在线免费视频| 高清av不卡| 久久久一本精品99久久精品| 亚洲人成高清| 亚洲av无码专区在线播放中文| 亚洲人一二三区| 国产日韩免费视频| 久久亚洲精品小早川怜子66| 91成人抖音| 日韩中文一区| 日韩高清电影一区| 亚洲一二三四视频| 欧美亚洲高清一区| 在线观看美女网站大全免费| 国产精品国产福利国产秒拍| 免费一区二区三区视频导航| 色欲色香天天天综合网www| 不卡的av在线播放| 国产香蕉视频在线| 亚洲少妇中文在线| 亚洲不卡系列| 亚洲欧美99| 国产主播一区二区三区| 麻豆天美蜜桃91| 制服丝袜av成人在线看| 在线免费观看a视频| 99电影在线观看| 亚洲福利电影| 中文字幕在线观看网址| 一本久道久久综合中文字幕| 国产免费a∨片在线观看不卡| 国产精品美女午夜av| 国产精品精品| 欧美69精品久久久久久不卡| 亚洲午夜在线视频| 图片区 小说区 区 亚洲五月| 日本欧美爱爱爱| 99久久99视频只有精品| 国产裸体视频网站| 欧美性jizz18性欧美| 成人性生交大片免费看午夜| 91青草视频久久| 一区在线视频| 性欧美丰满熟妇xxxx性仙踪林| 欧美综合久久久| 26uuu亚洲电影在线观看| 国产在线一区二| 琪琪一区二区三区| 欧美成人精品一区二区免费看片 | 欧美吞精做爰啪啪高潮| 成人在线观看亚洲| 激情五月综合色婷婷一区二区| 快she精品国产999| 波多野结衣爱爱视频| 亚洲精品美女免费| 欧美91在线|欧美| 人妻av无码专区| 久久久国产精品午夜一区ai换脸 | 亚洲精品美女久久久| 成人在线视频免费看| 国产黄色激情视频| 国产日韩影视精品| 丰满熟女一区二区三区| 国产a级全部精品| 91国语精品自产拍| 性色av蜜臀av色欲av| 欧美日韩成人高清| 理论不卡电影大全神| 一区二区三区|亚洲午夜| 成人午夜在线视频| 在线观看国产小视频| 国模吧一区二区| 欧美韩日一区| 免费看黄色的视频| 亚洲精品在线电影| 亚洲最大的免费视频网站| 欧美 日韩精品| 亚洲一二三区在线观看|