精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

GPT-4o成為全領域SOTA!基準測試遠超Gemini和Claude,多模態功能遠超GPT-4

人工智能 新聞
OpenAI半小時的發布會讓很多人第一反應是直呼「失望」,但隨著官網放出更多demo以及更多網友開始試用,大家才發現GPT-4o真的不可小覷,不僅在各種基準測試中穩拿第一,而且有很多發布會從未提及的驚艷功能。

OpenAI在發布會上官宣GPT-4o之后,各路大神也開始了對這個新模型的測評,結果就是,GPT-4o在多項基準測試上都展現了SOTA的實力。

別家發布會都在畫餅,OpanAI卻總能開出一種「欲揚先抑」的效果,驚喜全在發布會之后。

 基準測試結果

首先,在LMSys聊天機器人競技場上的ELO分數排行上,GPT-4o套了一個GPT2聊天機器人的馬甲,以一騎絕塵的態勢名列第一,評分為1310,和第二名GPT-4-turbo的1253分相比,呈現斷檔式的提升。

再來看多模態領域的基準Reka Vibe-Eval,這也是一個很有挑戰性的測試,由 269 個超高質量圖像文本對組成,用于評估多模態語言模型的性能。

在Reka Vibe-Eval 分數的排行榜上,GPT-4o再次榮登第一,相比谷歌新發布的Gemini Pro 1.5高出了將近三個百分點。

圖片

而且GPT-4o克服了這個測試集上大模型常見的「逆縮放」問題,也就是在某些案例中表現不如小模型的問題。

圖片

圖片

不止如此,GPT-4o的內存突破也值得關注。

針里尋針(Needle in a Needlestack,NIAN)是最近非常流行的開源基準測試,用于評估大模型關注上下文內容的能力。

大語言模型的進展導致曾經流行的基準測試「大海撈針」已經過時,在此基礎上,更具挑戰性的「針里尋針」測試誕生了。

圖片https://github.com/llmonpy/needle-in-a-needlestack

測試中,「針里尋針」會從一個大型打油詩數據庫中挑出幾首,將其放在prompt中的特定位置,之后再詢問關于這些打油詩的問題,由此可以很好地考察LLM的上下文記憶能力。

每個測試使用5-10個打油詩,放置在prompt中的5-10個位置,重復2-10次。

曾經,GPT-4 Turbo和Claude-3 Sonnet都在「針里尋針」測試中表現得非常慘烈,側面證明了這個任務對LLM的難度和挑戰性。

圖片

廣受歡迎的Mistral模型雖然表現得稍好一點,但正確率基本不超過60%。

圖片

相比之前的模型,GPT-4o取得了飛躍性的突破,正確率每個token位置上都不低于80%,一度接近100%,表現近乎完美!

圖片

GPT-4o的能力被嚴重低估了

圖片

新推出的輕量級「GPT-4o」模型,雖然有速率限制,但重點是——免費!

語音交互絕對是模型的「亮點」,但它的功能遠不止于此!

OpenAI表示這是他們第一個真正的多模態模型,通過單一的神經網絡完成所有任務。

網友表示「不知道這是否是真的還是有些夸大,但GPT-4o在所有領域的能力都超過了市場上的其他任何產品?!?/span>

有網友發現,作為原生多模態模型,GPT-4o的文生圖效果非常驚艷,甚至超過DALLE和MidJourney

圖片

而且,在生成圖片上的文字時,效果更是遠遠好過DALL-E 3。

DALL-E 3 在圖像上生成超過5個單詞后就會崩潰,而GPT-4o不僅做到文字的連續性,還能在之前生成圖像的基礎上進行迭代。

這種迭代是非常重要的,也標志著模型能力的巨大飛躍。雖然生成出來的文字還是非常「生硬」,甚至有明顯錯誤,但是迭代能力可以使GPT-4o后續逐漸減少文字和圖像方面的錯誤。

圖片

圖片

除了生成文字,GPT-4o還能你為生成獨立的角色形象,然后進行對話互動。

神奇的是,他們把對話界面隱藏在一個懸停圖標下!這意味著你可以對它進行任意動作、風格和場景的設計!而且GPT-4o在風格表現方面做得非常出色。

平面圖片不夠炫酷?GPT-4o能夠對圖片進行3D重建。

GPT-4o還是一個強大的PS工具,OpenAI的logo被輕松嵌入到了杯墊上,但仔細看的話,你會注意到這兩張圖片不是同一個杯墊。

模型沒有在原圖片基礎上進行修補,而是從頭生成,因此看起來像原始的、未經過PS的圖片。

Reddit上一位網友分析認為,OpenAI的Sam Altman等主創團隊可能是太喜歡《Her》這部電影了,他們對GPT-4o的語音互動設計很明顯受電影的啟發(Altman也暗示了這一點),而且發布會的展示也借鑒了電影的手法——

讓模型自己展示其驚人的能力,而不是像蘋果或者谷歌那樣列出原始數據和技術細節。

這樣做非常有「藝術感」,吊足了圍觀群眾好奇心,但也很容易讓人低估模型的能力。

GPT-4o的能力如此強大,也引發了對模型架構的猜測和熱烈討論,網友們的觀點也呈現出兩個方向。

一派認為,模型架構應該基本與GPT-4類似。

而另一方的觀點似乎更占上風,認為底層架構絕對有重大變動,目標是對齊GPT-4的文字能力,并在推理和多模態方面相比GPT-4有更多提升。

圖片

白熱化的開源與閉源之爭

雖然搭載GPT-4o的ChatGPT聊天界面及其API已經免費開放給用戶使用,但OpenAI依舊堅持了不開源的傳統,這次甚至連一篇技術報告都沒有。

但這并不影響GPT-4o在LLM角斗場中掀起風云。Liquid AI的資深科學家Maxime Labonne這樣描述:「LLM 爭奪戰愈演愈烈,GPT-4o 遙遙領先」

圖片

這場競爭中值得關注的另一個角度,則是大語言模型的開源和閉源之戰。GPT-4o能力的快速增長導致閉源和開源之間的差距再次被拉大。

更重要的是,閉源陣容中并非GPT-4o一枝獨秀。綜合迄今為止發布的所有LLM,閉源模型的總體表現始終比開源模型更加優秀,而且GPT、Claude、Gemini等系列的閉源模型始終走在最前沿。

紅色代表閉源模型,綠色代表開源模型,藍色區域表示二者之間的差距

曾經,大公司將Linux、安卓等項目開源的動力是希望借助所有開發者的力量,得到不同角度的反饋和更新意見,從而進行快速的迭代優化,并且構建了在世界范圍內有廣泛影響力的大規模社區,反哺其他的產品線。

但對于LLM來說,情況就不一樣了。

想要不斷提升大語言模型的能力,算力成本是更大的挑戰。根據斯坦福大學發布的2024年人工智能指數報告,訓練GPT-4的計算成本約為7800萬美元,Gemini Ultra則是一億九千一百萬美元左右。

圖片

原文鏈接:https://aiindex.stanford.edu/wp-content/uploads/2024/04/HAI_AI-Index-Report-2024.pdf

面對這種級別的投入,去中心化的開源社區對比有巨額投資的科技公司,顯然沒有優勢。企業要想擴大模型產品的影響力,只需像OpenAI一樣,免費開放API給用戶使用即可。

目前這種開源和閉源模型差距越來越大的趨勢,Jim Fan曾在去年6月就做出過類似的預測。

圖片

但是,LLM的開閉源之爭,不僅是企業的商業決策,更關乎AI行業整體的發展。

首先是安全性問題。最近剛從OpenAI離職的首席科學家Ilya Sutskever本人就對此十分關注,他曾在2016的一封電郵中寫道:「隨著我們越來越接近構建人工智能,開始變的不那么開放是有意義的?!?/span>

可以想象一下,如果像GPT-4o這樣能力強大的模型公布了代碼和模型權重,任何開發者都可以在此基礎上微調,以滿足自己定義的任何功能,AI的力量可能會迅速失控。

圖片

「像 GPT 這樣的研究如果落入壞人之手,也可能會進化并導致災難。」

但另一方面,這些只開放API但不開源的大語言模型對初創公司并不友好。他們沒辦法根據特定的需求和場景、使用私有數據對模型進行微調,開發出有獨創性的、功能靈活多樣的產品,只能開始「套殼」。

導致的結果就是,AI初創公司并沒有像我們想象的那樣蓬勃發展,我們也沒有看到更多的加入到工作和生活各方各面的AI產品。

正像Jim Fan推文中提到的,「開源LLM總是有更大的多樣性」。

這似乎是一個兩難問題。

隨著大模型之戰愈演愈烈,相信對于開源和閉源的激烈討論依舊會持續下去。

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-06-28 18:13:05

2024-05-21 12:23:17

2025-04-08 02:26:00

2024-12-18 13:24:30

谷歌AI大語言模型

2024-10-06 09:00:00

AI訓練數據

2025-05-14 09:15:00

2024-06-27 12:45:30

2024-06-21 09:51:17

2025-01-06 13:15:02

2023-06-19 08:19:50

2024-08-08 13:04:28

2024-03-28 14:26:51

人工智能

2024-05-08 07:28:06

LLMLinguaLLM大型語言模型

2024-06-05 08:29:35

2025-04-16 09:35:03

2025-02-18 12:30:00

2024-06-17 18:06:17

2024-07-16 13:24:38

2025-06-04 09:05:18

2025-01-02 11:01:45

點贊
收藏

51CTO技術棧公眾號

欧美aaaa视频| 国产在线观看a| 日日摸夜夜添夜夜添国产精品| 亚洲人线精品午夜| 国产美女18xxxx免费视频| 欧美24videosex性欧美| 久久久亚洲精品一区二区三区| 国产精品网址在线| 久久综合亚洲色hezyo国产| 久久综合亚洲| 欧美成人三级电影在线| 国产精品视频一区二区三区四区五区| a视频网址在线观看| 国产·精品毛片| 国产精品羞羞答答| 国产成人愉拍精品久久| 午夜久久免费观看| 亚洲免费中文字幕| 亚洲美女精品视频| 91精品国产色综合久久不卡粉嫩| 亚洲综合在线免费观看| 亚洲国产一区二区精品视频 | 久久精品女人的天堂av| 国产精品区在线观看| 每日更新成人在线视频| 欧美精品videos| 天天操夜夜操av| 国产探花一区二区| 亚洲精品久久在线| 国产女主播在线播放| 在线视频成人| 欧美三级日韩在线| 日本黄网站免费| а√天堂8资源中文在线| 亚洲丝袜另类动漫二区| 四虎影院一区二区三区| 深夜福利在线观看直播| 成人18视频在线播放| 亚洲自拍偷拍福利| 国产精品特级毛片一区二区三区| 日韩电影网1区2区| 欧洲成人免费aa| 日韩欧美激情视频| 国产欧美日韩一级| 91高清在线免费观看| 久久精品这里有| 亚洲国产天堂av| 91在线观看| 久久久久久久久97黄色工厂| 久久av免费观看| 天天干,夜夜操| 成人av资源网站| 国产乱码精品一区二区三区不卡| www.av日韩| 成人免费av网站| 国产乱码精品一区二区三区中文 | 国产不卡精品视频| 国产麻豆91精品| 亚洲最大福利视频网| 国产手机av在线| 成人综合婷婷国产精品久久 | www.看毛片| 国产东北露脸精品视频| 成人欧美一区二区三区视频| 风流少妇一区二区三区91| 99久久精品99国产精品| 噜噜噜噜噜久久久久久91| 青青草在线免费观看| 久久这里只有精品6| 精品无人区一区二区三区| 你懂的视频在线观看| 中文字幕免费不卡在线| 99re99热| free性护士videos欧美| 欧美日韩综合视频| 超碰网在线观看| 2020国产精品小视频| 欧美α欧美αv大片| 日韩 中文字幕| 大片网站久久| 久久777国产线看观看精品| 日韩乱码在线观看| 日本女人一区二区三区| 亚洲一区二区三| 日本黄色一区二区三区| 国产日韩精品视频一区| 日韩精品一区二区三区视频播放 | 4438x亚洲最大成人网| 少妇性l交大片7724com| 欧美电影完整版在线观看| 亚洲三级av在线| 91香蕉一区二区三区在线观看| 欧美阿v一级看视频| 性日韩欧美在线视频| 亚洲午夜无码久久久久| 国产激情一区二区三区桃花岛亚洲| 国产一区二区三区奇米久涩| www.黄在线观看| 五月天亚洲婷婷| 日本黄色的视频| 亚洲精品aaaaa| 久久国产视频网站| 99精品在线播放| 国产乱对白刺激视频不卡| 久久综合九色综合网站| 91精品久久| 欧美网站一区二区| 国产又粗又猛又色| 中文字幕一区二区三区在线视频| 欧美一区二区三区免费视| 国产成人精品免费看视频| 国产亚洲自拍一区| 男人添女人下面高潮视频| 亚洲成人a级片| 亚洲色图日韩av| 中文在线观看免费网站| 激情深爱一区二区| 日韩精品一区二区三区色偷偷| 丰乳肥臀在线| 欧美一区二区三区播放老司机| 日本黄色特级片| 亚洲激情自拍| 国产精品乱子乱xxxx| 麻豆传媒视频在线观看免费| 色就色 综合激情| 亚洲国产欧美视频| 99在线精品视频在线观看| 91在线精品观看| 欧美成人性生活视频| 在线精品国精品国产尤物884a| 97在线资源站| 99热这里只有精品4| 葵司免费一区二区三区四区五区| av资源站久久亚洲| www免费在线观看| 欧美日韩国产高清一区| 99在线视频免费| 日日骚欧美日韩| 欧美在线播放一区| 怡红院成人在线| 亚洲男人7777| 中文字幕一区二区三区四区欧美| 久久蜜桃一区二区| 午夜肉伦伦影院| 国产精品一区二区av日韩在线| 欧亚精品中文字幕| 毛片在线播放网站| 在线精品视频免费播放| 在线观看日本黄色| 久久国产麻豆精品| 亚洲精品一区二| 日韩欧美专区| 欧美刺激性大交免费视频| 国产男女裸体做爰爽爽| 亚洲毛片av在线| 性生交大片免费看l| 韩日精品在线| 国产一区二区三区四区五区加勒比| 国产精品探花在线| 日韩精品免费视频| 免费看一级视频| 国产精品无遮挡| 男女视频在线观看网站| 亚洲高清久久| 免费在线一区二区| 玖玖精品在线| 欧美猛交ⅹxxx乱大交视频| 黄色一级a毛片| 色综合天天综合网国产成人综合天 | 加勒比久久高清| 欧洲成人性视频| 日本天堂在线观看| 精品福利av导航| 无码任你躁久久久久久久| 国产精品嫩草影院com| 爱情岛论坛亚洲自拍| 99精品视频免费观看| 日本三级中国三级99人妇网站| www.天堂在线| 深夜福利久久| 青草热久免费精品视频 | 哺乳一区二区三区中文视频| 91国内揄拍国内精品对白| 国产三级视频在线播放线观看| 欧美精品一卡二卡| 日韩精品一区三区| 国产精品免费久久久久| 中文在线观看免费视频| 天堂久久久久va久久久久| 在线观看污视频| 台湾色综合娱乐中文网| 亚洲已满18点击进入在线看片| 国产777精品精品热热热一区二区| 亚洲一区第一页| 成人av手机在线| 欧美午夜电影在线播放| 日本在线视频免费观看| 1024精品合集| 天天躁日日躁aaaa视频| 福利视频网站一区二区三区| 天天色综合天天色| 在线看片日韩| 中国一级黄色录像| 狠狠色丁香婷婷综合影院| wwwxx欧美| 日韩电影免费观看高清完整版在线观看| 欧美激情伊人电影| 亚洲免费视频一区二区三区| 亚洲国产精品大全| 99久久精品国产一区色| 欧美性猛交一区二区三区精品| 日韩黄色在线视频| 亚洲色图在线看| 国产18无套直看片| 久久综合给合久久狠狠狠97色69| 国产a级片视频| 精品一区二区三区不卡| 久久久久久香蕉| 一本色道久久综合| 欧美视频在线观看视频| 久久影视一区| 精品午夜一区二区三区| japanese色系久久精品| 成人国产精品久久久久久亚洲| 欧美极度另类| 欧美亚洲日本黄色| 黄视频网站在线观看| 欧美激情免费视频| 午夜av在线播放| 久久久国产在线视频| 欧美成人hd| 三级精品视频久久久久| 爱爱爱免费视频在线观看| 亚洲人成网站色ww在线| 亚洲综合中文字幕68页| 在线a人片免费观看视频| 亚洲人成网7777777国产| 免费在线看v| 精品视频久久久久久久| 天天干天天干天天干| 亚洲韩国欧洲国产日产av| 日日夜夜精品免费| 精品国产不卡一区二区三区| 亚洲AV无码乱码国产精品牛牛| 91精品国产综合久久精品图片 | av电影一区| 青草青草久热精品视频在线网站| 婷婷电影在线观看| 欧洲一区二区视频| 欧美电影免费观看网站| 国产成人精品综合| 欧美影视资讯| 成人国产精品久久久| 久久综合偷偷噜噜噜色| 97人人做人人人难人人做| av成人男女| 欧美第一黄网| 欧美色图国产精品| 亚洲一区精品视频| 亚洲人体av| 大陆av在线播放| 亚洲自啪免费| 污视频免费在线观看网站| 精品无人区卡一卡二卡三乱码免费卡 | 亚洲女色av| 国产精品久久久久久久av电影| 国产一区影院| 成人看片视频| 网友自拍区视频精品| 亚洲国产综合自拍| 在线观看日韩| 欧美 日韩 国产一区| 久久精品国产色蜜蜜麻豆| 91精品国产高清91久久久久久| av福利精品导航| 少妇av片在线观看| 曰韩精品一区二区| www.com国产| 91精品国产综合久久香蕉的特点 | 欧美激情综合五月色丁香小说| 北条麻妃在线观看视频| 亚洲韩国精品一区| 自拍偷拍18p| 91精品国产欧美一区二区18| 熟妇人妻中文av无码| 在线观看欧美日韩国产| 中文字幕在线观看网站| 4444欧美成人kkkk| 7777在线视频| 欧美色图首页| 自拍偷拍 国产| 成人综合在线网站| 精品少妇一区二区三区密爱| 亚洲一区在线观看网站| 在线视频精品免费| 精品久久久久久久久久久久包黑料 | 国产欧美日韩激情| 永久久久久久久| 色婷婷久久99综合精品jk白丝| 国产免费福利视频| 亚洲久久久久久久久久久| www久久日com| 国产精品免费网站| 秋霞综合在线视频| 日本免费成人网| 奇米影视一区二区三区| 白嫩情侣偷拍呻吟刺激| 亚洲三级在线观看| 波多野结衣一区二区在线| 亚洲国产精品久久91精品| 免费黄色网页在线观看| 日本高清不卡在线| 久久人人爽人人爽人人片av不| 天堂av免费看| 理论片日本一区| 成人国产精品久久久网站| 亚洲成人精品在线观看| 国产情侣自拍小视频| 中文字幕日韩av综合精品| 亚洲精品中文字幕| 久久人人97超碰人人澡爱香蕉| 在线一区免费| 思思久久精品视频| 国产蜜臀97一区二区三区| 欧美三日本三级少妇99| 亚洲精品一线二线三线无人区| 国产不卡在线| 国产男女猛烈无遮挡91| 日韩精品免费一区二区在线观看 | 精品国模一区二区三区| 久草精品电影| 国产精品久久久久9999高清| 国产性猛交96| 亚洲高清一区二区三区| www.黄色一片| 久久久久久久影院| 大香伊人久久精品一区二区| 日韩a级黄色片| 国产精品一二三区在线| 欧美一区二区三区爽爽爽| 91精品啪在线观看国产60岁| 日本中文字幕在线观看| 国产欧美亚洲精品| 欧美电影《睫毛膏》| 女人高潮一级片| 伊人色综合久久天天人手人婷| 国产精品无码在线播放| 久久影院免费观看| 一区二区三区在线免费看| 91网站在线观看免费| 色综合999| 中文字幕日韩在线播放| 国产精品伊人| 在线视频不卡一区二区| 极品销魂美女一区二区三区| 污软件在线观看| 欧美va亚洲va| 理论片午夜视频在线观看| 久久久福利视频| 亚洲综合电影一区二区三区| 精品无码一区二区三区| 欧美日韩午夜在线| av色综合久久天堂av色综合在| 1卡2卡3卡精品视频| 亚洲伦伦在线| 久久午夜精品视频| 欧美一区二区三区在线观看 | 国模大尺度视频| 五月综合激情网| 国产h视频在线观看| 亚洲最大成人网色| 一本综合精品| 久久久免费看片| 精品三级在线看| 午夜精品成人av| 超碰在线免费观看97| 成人动漫一区二区| 国产精华7777777| 欧美成人高清视频| 亚洲理论电影| 亚洲综合在线一区二区| 欧美性色19p| 国内外激情在线| 麻豆91av| 国产一区二区三区黄视频| 日韩av无码中文字幕| 最近2019年手机中文字幕| 亚洲一区二区免费在线观看| 色欲av无码一区二区人妻| 中文字幕一区在线观看视频| 欧美熟女一区二区| 国产精品一香蕉国产线看观看| 亚洲视频一二| 日本污视频网站| 亚洲国产日韩欧美在线动漫| 国产第一亚洲| 日日摸日日碰夜夜爽av| 一区二区三区日韩欧美精品| 免费观看成年在线视频网站| 亚洲综合小说区|