精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Ilya錯了,預訓練沒結束!LeCun等反擊,「小模型時代」讓奧特曼預言成真

人工智能 新聞
Ilya「預訓練結束了」言論一出,圈內嘩然。谷歌大佬Logan Klipatrick和LeCun站出來反對說:預訓練還沒結束!Scaling Law真的崩了嗎?Epoch AI發布報告稱,我們已經進入「小模型」周期,但下一代依然會更大。

最近,Ilya在NeurIPS 2024中宣布:預訓練結束了!瞬間一石激起千層浪。

在他看來,數據如同化石燃料般難以再生,因此訓練模型需要的海量數據即將枯竭。

圖片

作為前OpenAI首席科學家,Ilya的這番話,有可能影響之后數十年的AI發展方向。

不過,預訓練真的結束了嗎?

最近,幾位圈內大佬,就公開站出來質疑和反對Ilya了。

谷歌大佬Logan Kilpatrick是這樣內涵Ilya的:認為預訓練結束,恐怕是因為你缺乏想象力。

圖片

前Meta具身智能團隊的高級總監Dhruv Batra也站出來共同表示:Ilya錯了!

在他看來,人類的數據還沒有用完。

我們只是用完了人類書寫的文本而已,但我們擁有的視頻數量,依然遠超我們的處理能力,目前只是尚未解決視覺領域的預訓練問題罷了。

圖片

的確,要知道,網絡上的文本公共數據,畢竟只是冰山一角而已。

我們除了文本,還能對音頻、視頻、圖像進行預訓練,甚至可以把視覺、嗅覺、觸覺、平衡和傳感器這些人類進化出來的功能賦予機器。

而如果模型真的可以學習的話,那數據或許確實是無所不在。

圖片

圖片

圖片

有人則充分放分想象:如果預訓練能和生物相連,那它的確永遠不會結束。

圖片

Scaling Law和預訓練到底有沒有撞墻?

種種事件表明,我們已經站在了一個發展路線的分水嶺。

Ilya、LeCun甚至奧特曼,都已經感覺到:目前的發展路線不能再延續下去了,我們亟需探索新的出路。

早期,Ilya曾是暴力Scaling的早期倡導者之一,認為通過增加數據和算力來「scale up」,能顯著改善模型性能。

但現在,Ilya已經承認自己曾經的想法錯了,并透露SSI正在研究一種全新的替代方法,來擴展預訓練。

圖片

相較之下,外媒SemiAnalysis則在一篇關于o1的深度報道中指出——scale的維度遠不止預訓練,Scaling Law仍將繼續下去。

圖片

最近,Epoch AI研究員的一篇長文,更是直觀地展示了這個「矛盾」的現象。

圖片

從2017年Transformer架構誕生到GPT-4發布,SOTA模型的規模一直在變大,但增幅在變小。

  • 從GPT-1到GPT-3,用了2年時間,模型參數量從1.17億增加到1750億,增加了1000倍
  • 從GPT-3到GPT-4,用了2年9個月,模型參數量從1750億增加到1.8萬億,增加了10倍

而到了2023年,這一趨勢直接發生了逆轉。

據估計,當前SOTA模型的參數可能要比GPT-4的1.8萬億小一個數量級!

  • GPT-4o大約為2000億參數
  • Claude 3.5 Sonnet約為4000億參數

但有趣的是,下一代模型的規模,可能又會重新超過GPT-4。

圖片

當今SOTA模型最大只有約4000億參數

盡管許多實驗室沒有公開模型架構,Epoch AI的研究員依然從蛛絲馬跡中發現了線索。

首先是開源模型的證據。根據Artificial Analysis的模型質量指數,當前最佳的開源模型是Mistral Large 2和Llama 3.3,分別擁有1230億和700億參數。

這些稠密模型,架構與GPT-3相似,但參數更少。它們總體的基準表現超過了GPT-4和Claude 3 Opus,且由于參數更少,它們的推理成本和速度也更優。

對于閉源模型,盡管我們通常無法得知參數詳情,但可以根據推理速度和收費推測它們的大小。

僅考慮短上下文請求,OpenAI提供的2024年11月版本GPT-4o,每個用戶每秒100-150個輸出token,收費每百萬輸出token 10美元;而GPT-4 Turbo每秒最多大約55個輸出token,費用是每百萬輸出token 30美元。

顯然,GPT-4o比GPT-4 Turbo更便宜且更快,因此它的參數可能比GPT-4小得多。

另外,我們還可以使用推理經濟學的理論模型,來預測GPT-4在H200上進行推理的成本。

假設使用H200進行推理的機會成本為每小時3美元,下面的圖顯示了不同價格點下,GPT-4及其假設縮小版的生成速度。

圖片

總體來說,為了讓模型每秒生成100個以上的token并且能夠流暢服務,模型需要比GPT-4小得多。

根據上圖,假設OpenAI的價格加成大約是GPU成本的八分之一,GPT-4o的參數量可能在2000億左右,雖然這個估計可能有2倍的誤差。

有證據表明,Anthropic的Claude 3.5 Sonnet可能比GPT-4o更大。Sonnet每秒生成約60個token,每百萬輸出token收費15美元。這速度在優化設置下接近原版GPT-4的收支平衡點。

不過,考慮到Anthropic API可能加價不少,Sonnet參數規模仍顯著小于GPT-4,估計在4000億左右。

總體來看,當前前沿模型的參數大多在4000億左右,像Llama 3.1 405B和Claude 3.5 Sonnet可能是最大的。

雖然對于閉源模型的參數估計有很大的不確定性,但我們仍然可以推測,從GPT-4和Claude 3 Opus到如今最強的模型,規模縮小的幅度可能接近一個數量級。

為什么會這樣?

針對這一現象,Epoch AI認為有四個主要原因:

1. AI需求爆發,模型不得不瘦身

自ChatGPT和GPT-4發布以來,AI產品需求激增,服務商面臨的推理請求大大超出預期。

此前,從2020年到2023年3月,模型訓練的目標是最小化訓練計算量,即在固定的能力水平下,花費盡可能少的計算資源完成訓練。Kaplan和Chinchilla的Scaling Law建議,隨著訓練計算量的增加,模型規模也應擴大。

隨著推理成本占據支出的大頭,傳統法則的適用性受到了挑戰。相比scaling模型規模,在更多訓練數據(token)上訓練較小的模型反而更劃算,因為較小的模型在推理階段的計算需求較低,能夠以更低的成本服務用戶。

比如,從Llama 2 70B到Llama 3 70B,雖然模型參數規模沒有顯著增加,但模型的性能卻顯著提升。

這是因為通過過度訓練(在更多數據上訓練較小的模型),可以讓模型在保持小規模的同時,表現得更強大。

2. 蒸餾,讓小模型更能打

實驗室還采用了「蒸餾」方法,從而讓更小的模型表現得更強大。

蒸餾指的是讓小模型模仿已經訓練好的大模型的性能。

蒸餾方法有很多種,其中一種簡單的方法是使用大模型生成高質量的合成數據集來訓練小模型,而更復雜的方法則需要訪問大模型的內部信息(如隱藏狀態和logprobs)。

Epoch AI認為,GPT-4o和Claude 3.5 Sonnet很可能是從更大的模型蒸餾得到的。

3. Scaling Law的轉變

Kaplan Scaling Law(2020)建議,模型的參數量與訓練用的token數量(即數據量)應保持較高的比例。簡單來說,當你增加訓練數據時,應該相應增加模型的規模(參數量)

而Chinchilla Scaling Law(2022)則偏向于更多訓練數據和更少的參數。模型不必越來越大,關鍵在于訓練數據的規模和多樣性。

這個轉變導致了訓練方式的改變:模型變得更小,但訓練數據更多。

從Kaplan到Chinchilla的轉變,并非因為推理需求的增加,而是我們對如何有效scaling預訓練的理解發生了變化。

4. 推理更快,模型更小

隨著推理方法的改進,模型生成token的效率和低延遲變得更加重要。

過去,判斷一個模型「足夠快」的標準是看它的生成速度是否接近人類的閱讀速度。

然而,當模型在生成每個輸出token時需要先推理出多個token時(比如每個輸出token對應10個推理token),提升生成效率就變得更關鍵。

這推動了實驗室,像OpenAI,專注于優化推理過程,使得模型在處理復雜推理任務時能夠更高效運行,也因此促使它們縮小模型的規模。

5. 用AI喂AI,成本更低

越來越多的實驗室開始采用合成數據作為訓練數據來源,這也是促使模型變小的原因之一。

合成數據為訓練計算scaling提供了一種新的途徑,超越了傳統的增加模型參數量和訓練數據集大小的方法(即,超越預訓練計算scaling)。

我們可以生成將來用于訓練的token,而不是從互聯網上抓取它們,就像AlphaGo通過自我對弈生成訓練數據一樣。

這樣,我們可以保持Chinchilla Scaling Law下計算最優的token與參數比例,但通過生成數據時為每個token投入更多計算,從而增加訓練計算量而不增加模型大小。

奧特曼:參數規模競賽即將終結?

2023年4月,OpenAI發布了當時最強的,同時也是第一款未公開參量的模型GPT-4。

之后不久,CEO奧特曼曾預言了模型參數競賽的終結:圍繞模型參數量的競賽,就像歷史上對更高處理器主頻的追求,是一個死胡同。

圖片

那么,前沿模型的規模會不會越變越小呢?

簡短的答案是——可能不會。但也很難說是否應該期待它們在短期內變得比GPT-4更大。

從Kaplan到Chinchilla的轉變是一次性的,因此我們沒有理由期待它繼續讓模型變小。

GPT-4發布后的推理需求增長也可能快于未來推理支出的增長速度。且合成數據和scaling計算并非每個實驗室都在采納——即使有高質量的訓練數據,對于非常小的模型而言,能夠取得的成就可能非常有限。

此外,硬件的進步可能會促使更大的模型變得更優,因為在相同預算下,大模型通常表現更好。

較小的模型在推理時可能表現更差,尤其在長上下文和復雜任務上。

未來的模型(如GPT-5或Claude 4)可能會恢復或稍微超過GPT-4的規模,之后是否繼續縮小規模難以預料。

理論上,當前硬件足以支持比GPT-4大50倍、約100萬億參數的模型,可能以每百萬輸出token 3000美元、每秒10-20個token的速度提供服務。

但正如Karpathy所說,相比于如今這種只能根據prompt去解決博士級別問題的AI,一個能夠真正作為「實習生」入職的AI更為實用。

圖片

責任編輯:張燕妮 來源: 新智元
相關推薦

2025-11-03 17:29:54

LeCun世界模型多模態

2024-12-16 07:10:00

OpenAIAI人工智能

2024-12-16 08:20:00

AI工具

2024-09-29 13:40:00

2023-06-26 07:10:51

2024-12-16 07:15:00

2025-10-10 07:48:12

大模型預訓練初始化

2024-12-24 14:30:00

模型AI訓練

2024-11-12 13:07:44

2022-05-30 15:44:33

模型訓練GAN

2022-08-25 10:31:57

模型人工智能

2025-07-07 01:20:00

AIAgent形態

2025-06-13 09:29:51

2025-10-11 09:23:28

RLPT強化學習預訓練數據

2025-09-28 09:09:00

2024-11-04 00:24:56

2022-06-25 21:38:36

AI模型

2022-01-21 15:33:56

架構模型AI

2025-08-24 09:24:07

2024-05-29 13:11:00

點贊
收藏

51CTO技術棧公眾號

日韩一级理论片| 久久国产精品 国产精品| 亚洲二区在线播放| 国产精品15p| 91久久一区二区| 四虎免费在线观看视频| 天天av天天翘| 久草在线在线精品观看| 91精品国产91久久久久久久久 | 麻豆一二三区精品蜜桃| 天天色 色综合| 吴梦梦av在线| 美州a亚洲一视本频v色道| 国产专区综合网| 日本午夜人人精品| 精品无码人妻一区二区三| 精品久久久久久久| 亚洲国产欧美自拍| 精品人妻一区二区三| 韩国成人漫画| 亚洲午夜久久久久中文字幕久| 水蜜桃一区二区三区| 色偷偷在线观看| 国产一本一道久久香蕉| 国产91精品最新在线播放| 91aaa在线观看| 水蜜桃精品av一区二区| 亚洲美女在线看| 色哟哟无码精品一区二区三区| 91综合国产| 日本韩国视频一区二区| 国产特级黄色大片| 国产福利在线免费观看| 亚洲视频资源在线| 亚洲一区二区三区加勒比| 免费观看成年在线视频网站| 99在线精品观看| 成人毛片网站| 性生活视频软件| 激情综合色播激情啊| 国产精品永久免费视频| japanese国产在线观看| 欧美亚洲一级| 国产91|九色| 日韩女同强女同hd| 伊人激情综合| 97婷婷大伊香蕉精品视频| 国产无套内射又大又猛又粗又爽 | 超碰成人免费在线| 欧美xxx黑人xxx水蜜桃| 亚洲美腿欧美偷拍| 久久久国产精华液999999| 免费观看在线午夜影视| 国产精品国产三级国产专播品爱网| 日韩av一级大片| 男女av在线| 国产精品三级电影| 一区二区三区av在线| 国产丝袜在线| 一区二区三区美女| 国产自产在线视频| 日韩影院在线| 色婷婷综合久久| 我看黄色一级片| 日本久久一区| 日韩午夜av一区| 成人午夜精品无码区| 任你弄精品视频免费观看| 亚洲精品久久久久久久久久久| 黄色性生活一级片| 红桃成人av在线播放| 日日狠狠久久偷偷四色综合免费| 天天操夜夜操av| 黑人一区二区三区四区五区| 国内精品国产三级国产在线专| 日韩成人在线免费视频| 日日噜噜夜夜狠狠视频欧美人| 国产精品久在线观看| 一区二区视频网站| 高清视频一区二区| 久久精品综合一区| 在线视频二区| 一区二区三区在线免费视频| 国产精品无码av在线播放| 外国电影一区二区| 精品剧情v国产在线观看在线| 北岛玲一区二区| 日韩美女一区二区三区在线观看| 欧美成人小视频| 国产视频91在线| 麻豆精品久久精品色综合| 亚洲伊人久久综合| 亚洲欧美日本在线观看| 亚洲欧洲日本在线| av动漫在线看| 中文字幕成人| 亚洲电影天堂av| 免费黄在线观看| 亚洲韩日在线| 国产精品久久久| 欧美少妇bbw| 国产精品免费免费| 国产日本在线播放| 永久免费观看精品视频| 日韩电视剧在线观看免费网站 | 亚洲精品中文在线影院| 乱妇乱女熟妇熟女网站| 视频二区欧美毛片免费观看| 一区二区三区视频免费| 日韩少妇裸体做爰视频| 麻豆传媒一区二区三区| 精品一区二区三区自拍图片区| 欧美a在线看| 色伊人久久综合中文字幕| 午夜诱惑痒痒网| 成人亚洲一区二区| 日本国产高清不卡| 国产小视频免费观看| 国产精品久久午夜| 日韩在线第三页| 欧洲在线一区| 久久久久久伊人| 国产99视频在线| 国产精品福利影院| 狠狠操精品视频| 亚洲第一福利社区| 午夜精品福利视频| 风流老熟女一区二区三区| 中文字幕一区二区视频| 免费黄色一级网站| 综合国产视频| 91高清视频免费| 欧美性受xxxx狂喷水| 亚洲黄色av一区| 中文字幕资源在线观看| 精品国产乱码久久久久久蜜坠欲下| 97**国产露脸精品国产| 黄色av一区二区三区| 亚洲免费观看高清| 久久精品久久99| 欧美~级网站不卡| 亚洲一区二区三区毛片| 草莓福利社区在线| 91精品国产日韩91久久久久久| 国产三级精品三级观看| 奇米影视一区二区三区小说| 色综合久久久久久久久五月| 日韩美女在线看免费观看| 亚洲摸下面视频| 亚洲国产成人精品女人久久| 久久久久88色偷偷免费| 妓院一钑片免看黄大片| 加勒比久久综合| 国产精品久久久久久av下载红粉| 阿v免费在线观看| 欧美日韩精品高清| 国产免费久久久久| 国产suv精品一区二区883| 女人色极品影院| 欧美91在线| 国产成人涩涩涩视频在线观看| 国产福利电影在线| 欧美色区777第一页| 国产激情无码一区二区三区| 国产91精品欧美| 日本一区二区黄色| 国产在线日韩精品| 成人xvideos免费视频| 动漫一区在线| 亚洲精品按摩视频| av毛片在线免费观看| 国产精品美女久久福利网站| 四虎成人在线播放| 一区二区黄色| 亚洲国产精品久久久久婷婷老年 | 欧美精品日韩精品| 久草视频在线免费看| 91香蕉视频污| 激情黄色小视频| 国语自产精品视频在线看8查询8| 久久久精品动漫| 欧美爱爱视频| 久久久久久久国产精品| 欧美69xxxxx| 在线电影国产精品| 日韩av女优在线观看| 国产精品美女久久久久久久久久久| 污免费在线观看| 久久激情久久| 无码人妻aⅴ一区二区三区日本| 精品三级av在线导航| 国产精品都在这里| 国模雨婷捆绑高清在线| 亚洲桃花岛网站| 亚洲av永久无码国产精品久久| 色综合激情久久| 日韩女优一区二区| 国产亚洲精品久| 国产又粗又猛又爽又黄| 视频一区二区国产| 久久av高潮av| 91久久夜色精品国产按摩| 国产原创精品| 激情久久免费视频| 国产精品第七影院| 爱看av在线入口| 精品国产欧美一区二区三区成人| 午夜福利视频一区二区| 欧美一区二区视频免费观看| 国产性生活视频| 亚洲成人精品一区| 美女的奶胸大爽爽大片| 中文字幕成人av| 成人免费av片| 成人激情小说网站| 中文字幕第10页| 蜜臀av亚洲一区中文字幕| 欧美二区在线视频| 欧美在线亚洲综合一区| 一区二区不卡在线| 精品久久精品| 欧美一级二级三级| 欧美午夜寂寞| 国产一区二区自拍| 18国产精品| 亚洲在线一区二区| 国产成人精品一区二区三区视频 | 中文字幕日韩有码| 欧美91精品久久久久国产性生爱| 亚洲国产精品久久久久| 性猛交xxxx乱大交孕妇印度| 欧美日韩国产一级二级| 最好看的日本字幕mv视频大全| 欧美性生交xxxxxdddd| 日韩欧美亚洲国产| 亚洲午夜精品一区二区三区他趣| 国产高潮流白浆| 亚洲视频中文字幕| 日本少妇高清视频| 亚洲桃色在线一区| 婷婷在线精品视频| 亚洲人成在线观看一区二区| 中文字幕无码日韩专区免费| 国产精品嫩草99a| 欧美h片在线观看| 中文字幕亚洲电影| 精品亚洲乱码一区二区| 中文字幕日韩精品一区| 中文字幕无码日韩专区免费| 亚洲欧美经典视频| 亚洲av鲁丝一区二区三区| 依依成人精品视频| 久久久综合久久| 亚洲第一av色| 国产精品美女久久久久av爽| 欧美午夜性色大片在线观看| 日韩精品一区二区亚洲av| 在线免费观看不卡av| 国产情侣小视频| 欧美福利视频导航| 国产xxxxxx| 亚洲精品99久久久久中文字幕| 午夜小视频在线播放| 亚洲欧美一区二区三区在线| eeuss影院www在线播放| 久久亚洲成人精品| av电影院在线看| 奇米4444一区二区三区| 懂色aⅴ精品一区二区三区| 亚洲一区二区三区视频播放| 欧美大奶一区二区| 日韩av不卡播放| 欧美福利专区| 国产美女无遮挡网站| 日本不卡123| 国产a级片视频| 久久久精品人体av艺术| 亚洲人做受高潮| 亚洲成av人**亚洲成av**| 亚洲毛片一区二区三区| 制服丝袜成人动漫| 天天综合在线视频| 中文字幕欧美日韩| 黄页网站在线| 国产精品久久久久aaaa九色| 91精品短视频| 日韩精品一区二区三区丰满| 欧美激情1区2区| 久久国产色av免费观看| 国产麻豆视频精品| 少妇按摩一区二区三区| 亚洲精品美腿丝袜| 国产寡妇亲子伦一区二区三区四区| 欧美精品一卡两卡| 天天干视频在线| 久久精品国产欧美激情| 在线天堂资源| 91精品国产综合久久久久久丝袜 | 中国黄色录像片| 毛片一区二区| 欧美双性人妖o0| 18欧美乱大交hd1984| 欧美日韩综合一区二区三区| 欧美一级二级三级蜜桃| wwwxxx在线观看| 91精品国产99久久久久久| www.久久99| 日韩视频在线播放| 国产精品女主播一区二区三区| 天堂在线一区二区三区| 久久久青草青青国产亚洲免观| 曰本女人与公拘交酡| 欧美日韩一区二区电影| 色播色播色播色播色播在线| 久久91精品国产91久久久| 久久91视频| 日韩久久在线| 另类天堂av| 国产成人av无码精品| 一区二区三区在线播放| 97精品人妻一区二区三区| 国产亚洲免费的视频看| 日本不卡1234视频| 国产精品一区二区三区在线 | 国产福利在线免费| 久久美女艺术照精彩视频福利播放| 国产一级大片在线观看| 日韩三级视频在线观看| 久久综合网导航| 成人黄色av网站| 91视频精品| gogogo高清免费观看在线视频| 国产视频在线观看一区二区三区 | 欧美精品一区二区在线观看| 黄色视屏免费在线观看| 国产欧美日韩丝袜精品一区| 成人3d动漫在线观看| 日本中文字幕片| 91免费在线视频观看| 天天操中文字幕| 日韩精品视频在线观看免费| 国产污视频在线播放| 国内视频一区二区| 国产一级一区二区| 特级西西人体wwwww| 欧美性猛交xxxx富婆| 三级做a全过程在线观看| 欧美孕妇性xx| 精品成人影院| 久热精品在线播放| 亚洲欧洲成人精品av97| 国产人妖一区二区三区| 久久艹在线视频| 大奶在线精品| 欧美日韩亚洲一| 欧美国产禁国产网站cc| 亚洲综合精品国产一区二区三区| 久久精视频免费在线久久完整在线看| 日韩一区中文| 大胆欧美熟妇xx| 99久久99久久精品免费看蜜桃| 91国产丝袜播放在线| 亚洲天堂av在线播放| 欧美成人毛片| 麻豆视频传媒入口| 成人高清视频在线| 在线免费黄色av| 色伦专区97中文字幕| 日韩精品成人| www国产黄色| 专区另类欧美日韩| 欧美性猛交 xxxx| 国产精品第一区| 国产综合网站| 最近中文字幕在线mv视频在线 | 国精产品一品二品国精品69xx| 青青a在线精品免费观看| 成人免费在线播放| 欧美性生交xxxxx| 色94色欧美sute亚洲线路一ni| 麻豆传媒在线免费| 国产精品久久国产三级国电话系列| 久久国产99| 可以直接看的黄色网址| 日韩电影第一页| 另类视频一区二区三区| 男女午夜激情视频| 亚洲欧美一区二区三区久本道91 | 国产精品毛片视频| 日本爱爱免费视频| 一二三四社区欧美黄| 成人在线观看黄色| 国产一区福利视频| 狠狠色丁香久久婷婷综| 欧美一级特黄视频| 欧美丰满少妇xxxxx做受| 国产一卡不卡| 大桥未久恸哭の女教师| 欧美日韩一区二区三区不卡| 福利影院在线看|