精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大模型開始進入收益遞減的時代?

發布于 2024-5-21 13:47
瀏覽
0收藏

目前人們好像已在接受這樣的觀點:“大語言模型(LLMs)正在以指數速度進步。” 就在幾天前,賓州大學沃登商學院 (The Wharton School) 的Ethan Mollick教授在一篇廣受關注的博客文章中聲稱,“目前對 LLMs 的能力評估顯示,LLM的能力每5到14個月翻一番”。

大模型開始進入收益遞減的時代?-AI.x社區

實際上Mollick教授引用的研究并未顯示他所聲稱的內容。如果你仔細閱讀,它沒有提到能力的提高。它顯示的是模型在達到給定性能水平所需的計算資源變得更有效率,“達到給定性能水平所需的計算量大約每8個月減半,95%的置信區間為5到14個月。”但是,(a)過去的表現并不總是能預測未來的表現,且(b)研究中的大部分數據都比較陳舊,沒有今年的數據。

關鍵是——我們都知道GPT-3比GPT-2大幅提升。我們也都知道GPT-4(13個月前發布)比GPT-3大幅提升。但是從那以后發生了什么?

我可以被說服,在2020-2023年的某些月份里能力確實翻倍了,但我完全看不到過去13個月中有這樣的情況。

相反,我看到的諸多跡象表明我們已經進入了收益遞減的時期。

讓我真正開始思考這一切的是OpenAI幾天前發布的一張圖表,宣傳他們最新的模型GPT-4 Turbo。我一直懷疑這是他們嘗試但失敗的GPT-5。看起來不錯——進步了!但是仔細看。

大模型開始進入收益遞減的時代?-AI.x社區

實際上,這張圖表顯示了最近幾個月在一系列不同指標上的一些改進,大多數是適度的。但它也完全觸發了我的警覺感。

我立即不喜歡這張圖表的原因是它任意地顯示了兩個非常近期的模型,而沒有顯示之前的歷史數據。所以是的,在某些指標上確實有進展,但我們真正需要看到的是長期的增長。這讓我開始思考。并且繪圖。對于許多指標,我根本找不到GPT-2或GPT-3的任何數據,有時甚至對于GPT-4也是如此。(在一些新指標上,GPT-2和GPT-3的數據效果上都為零。)但對于一個稱為MMLU的常見基準,我能夠找到GPT-2、GPT-3和GPT-4的歷史數據(但沒有GPT 3.5)。

這是我找到的情況(y軸是百分比準確度):

大模型開始進入收益遞減的時代?-AI.x社區

從GPT-2到GPT-3有巨大的躍升。從GPT-3到GPT-4也有巨大的躍升……但從GPT-4(13個月前)到GPT-4 Turbo(剛發布)則不太明顯。很難不將這個圖表視為收益遞減假設的初步證據。無論曾經有過多少翻倍,現在也許已經到了盡頭。

當然,這里有一個問題:當你接近圖表的頂部時,你會遇到統計學上稱之為“范圍限制”的問題。你不能在MMLU上從85分跳到115分;100%是可能的最高分。而且許多基準測試都很復雜且不完美。得分為100可能實際上是可疑的,因為這可能表明所討論的模型只是簡單地記住了數據。也許真正的實際上限是95%。

我的直覺是我們還沒有達到MMLU的真正上限,這是收益遞減的真實跡象。但好吧,讓我們再找另一個指標看看。

X網站上有人向我指出了《紐約時報》的Connections游戲。聰明的人可能能夠在任何給定的數據上獲得90%以上的得分,但目前的模型還沒有接近。所以,在這里,就沒有范圍限制的問題了。多虧了Lech Mazur,我能夠找到一系列歷史模型的數據,盡管沒有回溯到GPT-2或GPT-3。但足以讓我們對可能正在發生的情況有些了解:

大模型開始進入收益遞減的時代?-AI.x社區

從GPT 3.5 Turbo到4有很大的飛躍,但(再次)從GPT-4到兩個不同版本的GPT-4 Turbo只有適度的進步。范圍限制并不是問題,但我們再次看到了收益遞減的跡象。

如果我繪制的兩張圖表有一點正確,那么Mollick所聲稱的“大型語言模型改進速度顯示能力每5到14個月翻一番”的說法已經不再成立。

我在2022年曾警告過的墻壁,現在可能終于快要來臨了。

再從另一個角度看,我剛看到的這張圖表:自GPT-4發布以來,多個模型在GPT-4水平性能上的巨大收斂,然而并沒有明顯領先的模型。

大模型開始進入收益遞減的時代?-AI.x社區

那么質性數據呢?在很多方面,質性數據看起來都是一樣的。一個思考的方式是詢問在2022年我警告過的任何問題(比如幻覺和愚蠢的錯誤)是否已經解決了。

我認為公平地說,它們沒有。本周發布的GPT-Turbo仍然會產生一些讓人咂舌的問題,就像Phil Libin剛剛發來的這個對話一樣:

大模型開始進入收益遞減的時代?-AI.x社區

大模型開始進入收益遞減的時代?-AI.x社區

本周我讀到的最引人注目的事情之一是在《信息》(The Information)上。消息已經傳開,而問題顯然并沒有得到解決:

?

大模型開始進入收益遞減的時代?-AI.x社區

另一種思考這個問題的方式(見上面的第三張圖)是,大約有5到7個最近的模型與GPT-4持平,但沒有一個明顯地領先。

當然,單純在基準測試上取得進步并不足以說明問題;很少有基準測試能夠捕捉到現實世界的復雜性。即使LLMs在所有現有的基準測試中都達到了最高水平,我們可能仍然有很長的路要走。

如果我們真的已經從快速進展轉向了收益遞減的制度,而幻覺和愚蠢的錯誤仍然存在,那么LLMs可能永遠不會準備好投入實際應用。

相反,正如我在八月份所警告的那樣,我們很可能會迎來一場糾正。在最極端的情況下,OpenAI的860億美元估值在事后可能會被視為人工智能的WeWork時刻。

在最近幾周,Inflection AI基本上關閉了業務,Stability AI陷入了困境,以LLM為基礎的自動駕駛車輛公司Ghost關閉了業務,一個YouTube上的軟件工程師提出了關于備受炒作的AI編碼系統Devin的相當嚴重的問題。

如果對GenAI的熱情消退,市場估值暴跌,人工智能不會消失,LLMs也不會消失;它們仍然會作為統計近似的工具存在。

但這個位置可能會更小;完全有可能LLMs本身永遠無法達到去年的瘋狂期望。

可靠、值得信賴的人工智能肯定是可以實現的,但我們可能需要重新審視問題來實現這一點。

本文轉載自 ??MoPaaS魔泊云??,作者: Gary Marcus

收藏
回復
舉報
回復
相關推薦
亚洲黄色在线观看视频| 666欧美在线视频| 亚洲欧洲日韩国产| 女人床在线观看| 中文文字幕一区二区三三| 99re91这里只有精品| 亚洲在线播放| 精品国产sm最大网站免费看| 亚洲国产精品综合| 91video| 欧美精品影院| 亚洲男人天堂av网| 成人国内精品久久久久一区| 3d动漫精品啪啪一区二区下载| 羞羞电影在线观看www| 色综合狠狠操| 欧美三级中文字| 欧美一级二级三级九九九| 日韩免费黄色片| 国产一区在线电影| 精品久久久久久久久国产字幕| 国产成人精品自拍| 国产无套在线观看| 国产香蕉精品| 欧美日韩亚州综合| 91猫先生在线| 手机看片福利在线观看| 国产欧美高清| 亚洲欧美中文字幕| 国产a√精品区二区三区四区| 中国av在线播放| 高清不卡在线观看av| 欧美激情视频网址| 精品一区二区视频在线观看| www.youjizz.com在线| 成人国产在线观看| 日本韩国在线不卡| 黄大色黄女片18免费| 欧洲午夜精品| 一区二区三区丝袜| 国产欧美日韩亚洲| 狠狠人妻久久久久久综合| 国产欧美日韩在线一区二区| 日本久久一区二区三区| 亚洲午夜在线观看| 精品人妻伦一二三区久久| 黄色亚洲精品| 亚洲人精品午夜在线观看| 精品国产乱码久久久久夜深人妻| 日韩伦理一区二区| 欧美视频在线不卡| 国产一区 在线播放| 五月婷婷在线播放| 日本va欧美va瓶| 欧美大尺度在线观看| 中文字幕一区二区人妻电影丶| 日韩精品一级| 色伊人久久综合中文字幕| 亚洲综合首页| 思思99re6国产在线播放| 国产成人一级电影| 日产精品99久久久久久| 黑人狂躁日本娇小| eeuss鲁片一区二区三区| 欧美一区三区四区| 乱子伦视频在线看| av观看在线| 亚洲精品国产一区二区三区四区在线| 亚洲一区二区三区午夜| 色综合久久影院| 亚洲天堂免费在线观看视频| 精品国产综合久久| 国产精品久久久久久免费免熟| 亚洲手机视频| 992tv成人免费视频| 黑人狂躁日本娇小| 欧美1区2区3区| 亚洲区一区二区| 国产精品成人无码免费| 国产色噜噜噜91在线精品| 亚洲高清久久网| 国产精欧美一区二区三区白种人| 久草在线资源福利站| 椎名由奈av一区二区三区| 蜜桃传媒视频麻豆一区| 精品国自产在线观看| 成人妖精视频yjsp地址| 成人午夜黄色影院| 性做久久久久久久久久| av在线播放成人| 91精品国产高清久久久久久91裸体 | 视频精品国内| 日韩极品精品视频免费观看| 特黄视频免费观看| theporn国产在线精品| 亚洲伦理中文字幕| 国产一线在线观看| 国内精品视频| 欧美日韩激情在线| 免费观看成人在线视频| 国产网站在线| 欧美亚洲综合久久| 中国特级黄色片| 精品视频一区二区三区在线观看| 精品久久久久久久人人人人传媒| www.亚洲自拍| 亚洲精品大片| 日韩av资源在线播放| 无码人中文字幕| 一区二区日韩免费看| 久久久久久久久亚洲| 日韩在线观看视频一区二区| 色综合咪咪久久网| 午夜精品视频在线| 日韩精品一区二区不卡| 国户精品久久久久久久久久久不卡| 97人人做人人爱| 国产一区二区三区黄片| 九九精品视频在线看| 国产精品视频网站| 中文字幕av在线免费观看| 成人精品视频.| 在线观看成人免费| 婷婷色在线播放| 91传媒视频在线播放| 国产精品99久久久精品无码| 精品久久网站| 啊v视频在线一区二区三区| 色婷婷粉嫩av| 欧美激情视频一区二区三区免费| 国产精品成人aaaaa网站| 艳妇乳肉豪妇荡乳av无码福利 | 天堂在线资源库| 99视频精品在线| 特级西西人体www高清大胆| 91另类视频| 制服丝袜亚洲色图| 国产又大又粗又爽的毛片| 一区二区三区四区五区精品视频| 91免费看蜜桃| 成人在线视频亚洲| 亚洲成人免费观看| 乱子伦视频在线看| 亚洲小说图片视频| 日韩视频免费在线观看| 中文在线a天堂| 欧美极品aⅴ影院| 成人国产一区二区三区| 日本黄色免费在线| 亚洲国产精品人久久电影| 国产精品国产三级国产专业不 | 亚洲四区在线观看| 国产探花在线看| а√中文在线天堂精品| 久久综合免费视频| av大片免费观看| 麻豆国产精品官网| 成人资源av| 影音先锋男人资源在线| 日韩视频在线永久播放| 少妇真人直播免费视频| 亚洲成人一区| 日本精品久久久久久久| 欧美孕妇孕交| 一区二区免费视频| 日本人视频jizz页码69| 高清日韩中文字幕| 97在线视频免费看| 日本免费一区二区三区最新| 色婷婷综合久久久久中文| 麻豆av免费观看| 日本不卡的三区四区五区| 亚洲欧美日韩在线综合| 国产亚洲高清一区| 国内成人精品视频| 国产欧美日韩成人| 久久色中文字幕| 成年人深夜视频| 美女扒开腿让男人桶爽久久动漫| 日韩中文字幕精品视频| 国产三级按摩推拿按摩| 亚洲一区二三区| 91国内在线播放| 欧美日韩久久| 成人午夜小视频| 免费看电影在线| 911精品国产一区二区在线| 免费在线视频一区二区| 极品美女销魂一区二区三区免费| 国产激情一区二区三区在线观看 | 国产在线色视频| 午夜精品在线看| 少妇熟女视频一区二区三区 | 国产精品视频xxxx| 国产黄色大片在线观看| 欧美福利电影网| 国产黄色片在线| 成人av电影在线网| 男女视频在线看| 噜噜噜狠狠夜夜躁精品仙踪林| 日本精品久久久久久久| 在线观看中文| 亚洲欧美中文日韩在线v日本| 99在线观看免费| 18欧美乱大交hd1984| 国产又黄又粗又猛又爽的视频 | 97av在线视频| 免费黄色网页在线观看| 欧美色男人天堂| 国产无遮挡又黄又爽| 国产精品免费视频一区| 特级丰满少妇一级| 在线观看日韩av电影| 99在线观看视频网站| а√资源新版在线天堂| 亚洲欧美激情一区| 囯产精品久久久久久| 亚洲高清视频中文字幕| 欧美性生给视频| 972aa.com艺术欧美| 动漫av网站免费观看| 伊人久久大香线| 成人精品水蜜桃| 成人国产在线| 热re91久久精品国99热蜜臀| 黄页网站在线观看免费| 日韩视频亚洲视频| 阿v免费在线观看| 91精品久久久久久久91蜜桃| 日本免费精品视频| 国产精品电影一区二区| 不卡的一区二区| 午夜在线播放视频欧美| 国产美女主播在线| 精品国产一区一区二区三亚瑟| 国产在线精品一区| 国产精品17p| 风间由美一区二区三区| 日韩中文字幕无砖| 成人动漫网站在线观看| 欧美91在线|欧美| 欧美激情网友自拍| 日本无删减在线| 欧美黑人xxx| a毛片不卡免费看片| 一区二区三区国产在线观看| 国产精品视频一区二区三区,| 欧美在线短视频| 欧美一级黄视频| 欧美日韩亚洲综合在线| 依依成人在线视频| 555www色欧美视频| 国产欧美久久久| 精品免费国产二区三区 | 欧美日韩破处视频| 国产专区欧美专区| a'aaa级片在线观看| 国内精品美女av在线播放| 91福利在线免费| 国产91精品黑色丝袜高跟鞋| 美女免费久久| 欧美超级免费视 在线| а√资源新版在线天堂| 欧美多人爱爱视频网站| 日本一二三区在线视频| 国产亚洲欧美日韩美女| 国产99视频在线| 日韩三级视频在线观看| 亚洲av无码国产精品永久一区 | 天堂成人在线视频| 亚洲精品美女久久久久| 国产在线网站| 在线亚洲男人天堂| 亚洲国产www| 国产视频精品在线| av免费观看网址| 日韩一区二区免费视频| 秋霞网一区二区| 欧美精品在线视频| 国产三级漂亮女教师| 91麻豆精品国产91久久久资源速度 | 日韩中文字幕电影| 国产精品视频九色porn| 久久爱一区二区| 精品动漫一区二区三区| 久久精品视频2| 国产精品每日更新| 久久免费播放视频| 国产精品欧美久久久久无广告 | 亚洲欧美日韩成人高清在线一区| 欧美黄色免费看| 福利微拍一区二区| www中文在线| 亚洲成人一区在线| 在线永久看片免费的视频| 欧美日韩亚洲丝袜制服| 香港一级纯黄大片| 中文字幕免费国产精品| 成年人黄视频在线观看| 欧美中文字幕在线| 天堂久久一区| 成人欧美一区二区三区在线观看| 精品久久成人| 99久久久精品视频| 另类欧美日韩国产在线| 国产无套精品一区二区三区| 久久只精品国产| 国产一级视频在线观看| 91国产福利在线| 朝桐光av在线一区二区三区| 中文字幕欧美日韩在线| 国产在线xxx| 国产欧美一区二区白浆黑人| 少妇精品导航| 国产精品二区二区三区| 亚洲宅男一区| 成人免费播放器| 欧美三级午夜理伦三级中文幕| 免费毛片小视频| 不卡在线观看av| 91精品少妇一区二区三区蜜桃臀| 亚洲一区二区三区四区五区中文| 中文字幕永久免费视频| 亚洲精品720p| 久久av少妇| 欧美亚洲第一区| 精品视频在线观看免费观看| 亚洲福利av在线| 亚洲影音一区| 亚洲午夜激情影院| 国产精品国产三级国产普通话99| 成人毛片18女人毛片| 精品噜噜噜噜久久久久久久久试看| 最新电影电视剧在线观看免费观看| 亚洲欧洲在线免费| 在线观看的黄色| 91精品国产色综合久久不卡98| 在线成人免费| 国产日韩精品推荐| 亚洲乱码电影| 九九九久久久久久久| 精品在线播放午夜| 天堂久久精品忘忧草| 中文字幕一区二区三区在线播放| 精品免费囯产一区二区三区| 精品电影一区二区三区| 久草在线资源站资源站| 91免费人成网站在线观看18| 亚洲国产视频二区| 欧美 日韩 国产在线| 亚洲欧洲日本一区二区三区| a级片一区二区| 国产91色综合久久免费分享| 蜜臀av午夜精品久久| 亚洲卡通欧美制服中文| 99在线小视频| 欧美久久久精品| 亚洲免费福利| 国产在线精品二区| 日韩网站在线| a级在线免费观看| 91精品办公室少妇高潮对白| 国产免费a∨片在线观看不卡| 久久精品99久久香蕉国产色戒| 超碰免费在线播放| 成人三级视频在线观看一区二区| 亚洲欧美偷拍自拍| 色婷婷一区二区三区在线观看| 一区二区三区中文免费| 午夜成人鲁丝片午夜精品| 国产99在线|中文| 美女久久99 | 久久精品国产免费| 欧美成人三级在线观看| 亚洲一区二区三区小说| 欧美一区二区公司| 国产不卡视频在线| 久久免费视频66| 白嫩少妇丰满一区二区| 国产精品午夜电影| 日韩电影在线观看一区二区| 中文字幕一区日韩电影| 88久久精品| 黄色三级视频在线| 久久精品免费在线观看| 国产农村妇女毛片精品| 国语自产精品视频在免费| 欧洲三级视频| 成熟妇人a片免费看网站| 成人免费在线电影| 国产美女精品免费电影| 自拍偷拍欧美专区| 黄色正能量网站| 在线免费一区三区| 后入内射欧美99二区视频| 97视频在线播放| 欧美色图在线播放| 国产一级免费片| 欧美午夜理伦三级在线观看| 七七久久电影网|