精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

終極「揭秘」:GPT-4模型架構、訓練成本、數據集信息都被扒出來了

人工智能 新聞
他們從許多來源收集了大量有關 GPT-4 的信息,包括模型架構、訓練基礎設施、推理基礎設施、參數量、訓練數據集組成、token 量、層數、并行策略、多模態視覺適應、不同工程權衡背后的思維過程、獨特的實現技術以及如何減輕與巨型模型推理有關的瓶頸等。

一直以來,大家都對 GPT-4 的模型架構、基礎設施、訓練數據集、成本等信息非常好奇。

奈何 OpenAI 嘴太嚴,很長時間以來,大家也都只是猜測這些數據。

不久之前,喬治?霍茲(George Hotz)在接受一家名為 Latent Space 的 AI 技術播客采訪時透露出一個小道消息,稱 GPT-4 是由 8 個混合專家模型組成的集成系統,每個專家模型都有 2200 億個參數(比 GPT-3 的 1750 億參數量略多一些),并且這些模型經過了針對不同數據和任務分布的訓練。

雖然此消息無法驗證,但其流傳度非常高,也被部分業內人士認為非常合理。

最近,更多的消息似乎被泄露了出來。

今日,SemiAnalysis 發布了一篇付費訂閱的內容,「揭秘」了有關 GPT-4 的更多信息。

圖片圖片

文章稱,他們從許多來源收集了大量有關 GPT-4 的信息,包括模型架構、訓練基礎設施、推理基礎設施、參數量、訓練數據集組成、token 量、層數、并行策略、多模態視覺適應、不同工程權衡背后的思維過程、獨特的實現技術以及如何減輕與巨型模型推理有關的瓶頸等。

作者表示,GPT-4 最有趣的方面是理解 OpenAI 為什么做出某些架構決策。

此外,文章還介紹了 A100 上 GPT-4 的訓練和推理成本,以及如何拓展到下一代模型架構 H100 。

我們根據 Deep Trading(一家算法交易公司)創始人 Yam Peleg 的推文(目前已刪除),整理了以下關于 GPT-4 的數據信息。感興趣的讀者可以細致研究下。

圖片圖片

不過請注意,這并非官方確認的數據,大家自行判斷其準確性。

圖片圖片

1、參數量:GPT-4 的大小是 GPT-3 的 10 倍以上。文章認為它 120 層網絡中總共有 1.8 萬億個參數。

2、確實是混合專家模型。OpenAI 能夠通過使用混合專家(MoE)模型來保持合理成本。他們在模型中使用了 16 個專家模型,每個專家模型大約有 111B 個參數。這些專家模型中的 2 個被路由到每個前向傳遞。

3、MoE 路由:盡管文獻中對于選擇將每個 token 路由到哪個專家模型的高級路由算法進行了大量討論,但據稱 OpenAI 在當前的 GPT-4 模型中采用了相當簡單的路由方式。該模型大約使用了 550 億個共享參數來進行注意力計算。

圖片圖片

4、推理:每次前向傳遞的推理(生成 1 個 token)僅利用約 2800 億個參數和約 560 TFLOP 的計算量。相比之下,純密集模型每次前向傳遞需要大約 1.8 萬億個參數和約 3700 TFLOP 的計算量。

5、數據集:GPT-4 的訓練數據集包含約 13 萬億個 token。這些 token 是重復計算之后的結果,多個 epoch 中的 token 都計算在內。

Epoch 數量:針對基于文本的數據進行了 2 個 epoch 的訓練,而針對基于代碼的數據進行了 4 個 epoch 的訓練。此外,還有來自 ScaleAI 和內部的數百萬行的指令微調數據。

6、GPT-4 32K:在預訓練階段,GPT-4 使用了 8k 的上下文長度(seqlen)。而 32k 序列長度版本的 GPT-4 是在預訓練后對 8k 版本進行微調而得到的。

圖片圖片

7、Batch Size:在計算集群上,幾天時間里,batch size 逐漸增加,最后,OpenAI 使用 batch size 達到了 6000 萬!當然,由于不是每個專家模型都能看到所有 token,因此這僅僅是每個專家模型處理 750 萬個 token 的 batch size。

真實的 batch size:將這個數字除以序列長度(seq len)即可得到真實的 batch size。請不要再使用這種誤導性的數字了。

8、并行策略:為了在所有 A100 GPU 上進行并行計算,他們采用了 8 路張量并行,因為這是 NVLink 的極限。除此之外,他們還采用了 15 路流水線并行。(很可能使用了 ZeRo Stage 1,也可能使用了塊級的 FSDP)。

9、訓練成本:OpenAI 在 GPT-4 的訓練中使用了大約 2.15e25 的 FLOPS,使用了約 25,000 個 A100 GPU,訓練了 90 到 100 天,利用率(MFU)約為 32% 至 36%。這種極低的利用率部分是由于大量的故障導致需要重新啟動檢查點。

如果他們在云端的每個 A100 GPU 的成本大約為每小時 1 美元,那么僅此次訓練的成本將達到約 6300 萬美元。(而如今,如果使用約 8192 個 H100 GPU 進行預訓練,用時將降到 55 天左右,成本為 2150 萬美元,每個 H100 GPU 的計費標準為每小時 2 美元。)

10、使用專家混合模型時的 tradeoff:在使用專家混合模型時存在多方面 tradeoff。

例如,在推理過程中處理 MoE 非常困難,因為并非模型的每個部分都在每個 token 生成時被利用。這意味著在某些部分被使用時,其他部分可能處于閑置狀態。在為用戶提供服務時,這會嚴重影響資源利用率。研究人員已經證明使用 64 到 128 個專家比使用 16 個專家能夠實現更好的損失(loss),但這僅僅是研究的結果。

選擇較少的專家模型有多個原因。OpenAI 選擇 16 個專家模型的一大原因是:在許多任務中,更多的專家模型很難泛化,也可能更難收斂。

由于進行了如此大規模的訓練,OpenAI 選擇在專家模型數量上更加保守。

圖片圖片

11、推理成本:GPT-4 的推理成本是 1750 億參數的 Davinci 模型的 3 倍。這主要是因為 GPT-4 需要更大規模的集群,并且達到的利用率要低得多。

據估計,在用 128 個 A100 GPU 進行推理的情況下,8k 版本 GPT-4 推理的成本為每 1,000 個 token 0.0049 美分。如果使用 128 個 H100 GPU 進行推理,同樣的 8k 版本 GPT-4 推理成本為每 1,000 個 token 0.0021 美分。值得注意的是,這些估計假設了高利用率和保持較高的 batch size。

12、Multi-Query Attention:OpenAI 和其他機構一樣,也在使用 Multi-Query Attention(MQA)。由于使用 MQA 只需要一個注意力頭(head),并且可以顯著減少用于 KV 緩存的內存容量。即便如此,32k 序列長度的 GPT-4 也絕對無法在 40GB 的 A100 GPU 上運行,而 8k 序列長度的模型則受到了最大 batch size 的限制。

圖片圖片

13、連續 batching:OpenAI 實現了可變 batch size 和連續 batching。這樣做是為了允許一定程度的最大延遲,并優化推理成本。

14、視覺多模態:它是一個獨立于文本編碼器的視覺編碼器,二者之間存在交叉注意力。該架構類似于 Flamingo。這在 GPT-4 的 1.8 萬億個參數之上增加了更多參數。在純文本的預訓練之后,它又經過了另外約 2 萬億個 token 的微調。

對于視覺模型,OpenAI 本來希望從零開始訓練,但由于其尚未成熟,所以他們決定先從文本開始訓練來降低風險。

這種視覺能力的主要目的之一是使自主智能體能夠閱讀網頁并轉錄圖像和視頻中的內容。

他們訓練的一部分數據是聯合數據(包括渲染的 LaTeX / 文本)、網頁的截屏、YouTube 視頻(采樣幀),并使用 Whisper 對其進行運行以獲取轉錄文本。

圖片圖片

15、推測式解碼(Speculative Decoding):OpenAI 可能在 GPT-4 的推理過程中使用了推測式解碼技術(不確定是否 100%)。這種方法是使用一個更小更快的模型提前解碼多個 token,并將它們作為單個 batch 輸入到一個大型的預測模型(oracle model)中。

如果小型模型對其預測是正確的,大型模型將會同意,我們可以在單個 batch 中解碼多個 token。

但是,如果大型模型拒絕了草稿模型預測的 token,那么 batch 中剩余的部分將被丟棄,然后我們將繼續使用大型模型進行解碼。

有些陰謀論指出,新的 GPT-4 質量已經下降,這可能只是因為他們讓推測式解碼模型(speculative decoding model)將概率較低的序列傳遞給預測模型,從而導致了這種誤解。

圖片圖片

16、推理架構:推理運行在由 128 個 GPU 組成的集群上。在不同地點的多個數據中心存在多個這樣的集群。推理過程采用 8 路張量并行(tensor parallelism)和 16 路流水線并行(pipeline parallelism)。每個由 8 個 GPU 組成的節點僅具有約 1300 億個參數。

該模型有 120 層,因此適合于 15 個不同的節點。可能第一個節點的層數較少,因為它還需要計算嵌入。

根據這些數字,如果 OpenAI 試圖按照 chinchilla 的最佳指標進行訓練,他們應該使用的 token 數量是現在的兩倍。這表明他們在獲取高質量數據方面遇到了困難。

最后想說的是,這應該是迄今為止關于 GPT-4 最為詳細的數據揭秘。目前還不能求證是否真實,但也值得大家研究下。正如原文作者所說,「有趣的方面是理解 OpenAI 為什么做出某些架構決策。

關于 GPT-4 的這些架構信息,你怎么看?

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-04-16 12:15:42

AI模型

2025-01-02 13:15:00

2023-11-06 09:26:00

模型測評

2023-03-16 19:17:57

2023-05-19 13:01:10

ChatGPT模型

2023-03-28 08:23:38

2023-06-08 11:27:10

模型AI

2023-10-18 12:50:12

數據模型

2024-07-22 09:01:20

2023-06-19 08:19:50

2024-01-29 00:05:00

OpenAI嵌入機器學習

2023-02-20 13:50:39

AI 領域建模大數據

2023-12-11 19:08:59

AI模型

2023-09-06 16:44:03

2025-04-16 09:35:03

2023-03-30 11:08:49

AI模型訓練

2023-07-13 12:54:42

GPT-4OpenAI

2023-12-26 08:17:23

微軟GPT-4

2023-08-11 13:15:35

ChatGPTMBTIGPT-4

2024-01-16 12:31:13

OpenAIGLM-4大模型
點贊
收藏

51CTO技術棧公眾號

手机在线视频一区| 日韩高清三级| 成人免费看片98欧美| 奇米狠狠一区二区三区| 欧美日本一道本| 欧美图片激情小说| 免费一级在线观看| 久久99国产精品久久99果冻传媒| 欧美放荡办公室videos4k| 黄色正能量网站| 国产亚洲字幕| 色噜噜久久综合| 国产精品无码电影在线观看| 日本亚洲一区| 国产精品一二一区| 国产精品wwwwww| 日本一区二区欧美| 国产精品99一区二区三区| 亚洲国产精品电影在线观看| 国模私拍视频在线观看| 中文在线免费二区三区| 亚洲黄色免费电影| 亚洲精品9999| 日本v片在线免费观看| 国产曰批免费观看久久久| 日本成人黄色片| 久久亚洲AV无码| 欧美wwwww| 亚洲欧美中文在线视频| 在线观看免费视频国产| 婷婷久久免费视频| 91九色02白丝porn| av网站在线观看不卡| 欧美videossex另类| 自拍偷自拍亚洲精品播放| 奇米888一区二区三区| 日韩一区免费视频| 国产成人免费在线观看不卡| 国产精品尤物福利片在线观看| 青青草成人av| 亚洲欧洲一区二区天堂久久| 九九综合九九综合| 精品无码一区二区三区蜜臀| 日韩情爱电影在线观看| 亚洲人成电影在线播放| 无套内谢大学处破女www小说| 一区二区三区视频播放| 日韩一区二区三区精品视频| 污视频在线观看免费网站| 国产成人免费| 欧美男同性恋视频网站| 午夜在线观看av| 成人国产精品| 欧美丝袜丝交足nylons| 天天影视综合色| 日本成人片在线| 在线一区二区观看| 无码内射中文字幕岛国片| 亚洲欧洲自拍| 一本大道久久a久久综合| 中文字幕乱码人妻综合二区三区| 欲香欲色天天天综合和网| 疯狂做受xxxx欧美肥白少妇| 男人操女人免费软件| 在线能看的av网址| 色偷偷久久人人79超碰人人澡| 国产午夜福利视频在线观看| 日韩电影免费观| 在线观看日产精品| 污视频网站观看| 国产情侣一区在线| 精品三级在线看| 亚洲の无码国产の无码步美| 亚欧日韩另类中文欧美| 亚洲欧美在线免费| 国产美女网站视频| 在线成人激情| 性欧美xxxx交| 波多野结衣人妻| 国产美女一区二区| 国产chinese精品一区二区| 天天色综合av| 欧美激情在线看| 国产树林野战在线播放| 国产91足控脚交在线观看| 欧美日韩国产在线| 另类小说第一页| 日本免费一区二区视频| 国产视频久久网| 中文乱码字幕高清一区二区| 亚洲天堂成人| 国产成人97精品免费看片| 亚洲最大成人av| 成人听书哪个软件好| 欧美一区二区三区电影在线观看| 欧美96在线| 五月综合激情婷婷六月色窝| 无需播放器的av| 中文字幕一区二区三区四区久久| 亚洲欧美一区二区三区四区| 日韩欧美国产成人精品免费| 国产日韩精品视频一区二区三区| 国产欧美日韩视频| 国产小视频免费观看| 国产情人综合久久777777| 免费国产成人看片在线| 一个人看的www视频在线免费观看| 欧美三级电影一区| 中文在线观看免费视频| 国产精品久久观看| 欧美自拍视频在线| 国产浮力第一页| 亚洲国产精品二十页| 国产3p露脸普通话对白| 99综合久久| 国产午夜精品全部视频在线播放| 久久久夜色精品| 美女在线一区二区| 蜜桃91精品入口| bl在线肉h视频大尺度| 欧美欧美欧美欧美首页| 亚洲欧美视频在线播放| 狠狠色丁香久久综合频道| 国产免费一区视频观看免费| 日本一级在线观看| 亚洲v中文字幕| 九九九久久久久久久| 日本不卡高清| 国产精品久久久久999| 神马午夜电影一区二区三区在线观看| 亚洲欧美日韩在线不卡| 黄色片视频在线| 国产精品嫩模av在线| 亚洲3p在线观看| 不卡av中文字幕| 亚洲人123区| 手机免费av片| 日韩在线观看| 国产精品久久久久久久久免费看| 欧美日韩影视| 疯狂做受xxxx欧美肥白少妇| 水蜜桃av无码| 在线综合亚洲| 久久五月天婷婷| 玖玖在线播放| 日韩av中文字幕在线免费观看| 国产一级特黄a高潮片| 国产乱人伦偷精品视频免下载 | 男人的天堂狠狠干| 欧美片网站免费| 欧美另类69精品久久久久9999| 国产美女免费看| 亚洲色图都市小说| 日本黄色三级网站| 91av精品| 国产精品久久久对白| 丁香花电影在线观看完整版| 欧美成人福利视频| 国产成人在线免费观看视频| 99国产精品99久久久久久| 欧美精品一区免费| 国产成人1区| 国产热re99久久6国产精品| 日本最新在线视频| 欧美大片拔萝卜| 国产suv精品一区二区| 天天天天天天天干| 中文字幕一区二区三区色视频| 天天操天天干天天做| 综合五月婷婷| 极品尤物一区二区三区| 成人勉费视频| 色婷婷成人综合| a天堂在线视频| 无码av中文一区二区三区桃花岛| 波多野结衣办公室33分钟| 日本成人在线电影网| 99精品视频网站| 国产精品午夜av| 国产精品成人久久久久| av网站在线免费看推荐| 亚洲精品按摩视频| 中文有码在线播放| 亚洲综合清纯丝袜自拍| 欧美黑人欧美精品刺激| 久久99久久99精品免视看婷婷 | 国产精品免费一区二区| 国模套图日韩精品一区二区| 少妇久久久久久| 韩国av免费在线| 欧美伊人久久久久久久久影院| 国产高潮流白浆| 久久蜜桃香蕉精品一区二区三区| 国产精品视频中文字幕| 亚洲激情午夜| 手机在线视频你懂的| 欧美中文一区| 91精品啪在线观看麻豆免费| 天堂网在线最新版www中文网| 日韩在线欧美在线| 午夜影院在线视频| 欧美放荡的少妇| 色一情一乱一伦| 亚洲精品水蜜桃| 日本一二三不卡视频| 成人午夜视频在线观看| 亚洲欧美自偷自拍另类| 一区二区高清| 热久久最新网址| 成人三级视频| 欧美高清性xxxxhd| 99热这里只有精品首页| 国产欧美欧洲在线观看| 最近在线中文字幕| 久久久久久中文字幕| 麻豆免费在线视频| 国产亚洲xxx| 五月天激情开心网| 欧美变态凌虐bdsm| 一级特黄特色的免费大片视频| 色香色香欲天天天影视综合网| 久久综合成人网| 亚洲三级在线播放| 99久久99久久精品免费看小说.| av一区二区三区黑人| 日本特黄在线观看| 九色|91porny| 国产日韩欧美久久| 热久久国产精品| 日本新janpanese乱熟| 国产日韩亚洲| 免费看又黄又无码的网站| 欧美午夜不卡| 日韩人妻一区二区三区蜜桃视频| 日韩电影免费网址| 亚洲成人18| 日韩精品欧美| 一区二区高清视频| 日本午夜一区| 亚洲高清乱码| 久久人体视频| 宅男一区二区三区| 日韩欧美在线中字| 亚洲一区二区三区色| 成人亚洲一区| 一区国产精品| 久久久久久美女精品| 日韩视频在线免费播放| 亚洲欧美偷拍自拍| 小说区视频区图片区| 91精品国产成人观看| 综合操久久久| 欧美日本中文| 成人性免费视频| 在线综合视频| 北条麻妃视频在线| 麻豆精品在线视频| 欧美一级特黄aaa| 国产馆精品极品| 在线中文字日产幕| 91香蕉视频在线| 亚洲一区二区三区日韩| 国产精品美女久久久久aⅴ | 91在线在线观看| 成人性生交大片免费看96| 精品亚洲第一| 欧美日韩水蜜桃| 中文字幕av日韩精品| 欧美在线日韩| 国产免费成人在线| 蜜臀av性久久久久av蜜臀妖精| www.成人黄色| 成人激情免费网站| 亚洲成人黄色av| 亚洲精品网站在线观看| 毛片视频网站在线观看| 在线观看一区二区视频| 97精品久久人人爽人人爽| 欧美不卡123| 成人激情电影在线看| 欧美理论片在线观看| a日韩av网址| 成人精品久久一区二区三区| a看欧美黄色女同性恋| 热舞福利精品大尺度视频| 欧美韩日一区| 久在线观看视频| 久久99久久久欧美国产| 你懂得在线视频| 国产精品久久久久天堂| 四虎永久在线精品| 欧美日韩视频专区在线播放| 丰满人妻妇伦又伦精品国产| 亚洲热线99精品视频| 午夜影院免费在线| 国产精品高清网站| 亚洲一区二区三区四区电影 | 色综合天天视频在线观看| 亚洲影视一区二区| 亚洲精品一区二区网址 | 97国产精品人人爽人人做| 国产成人免费精品| 久久久久无码国产精品一区| 亚洲欧美偷拍自拍| 久久久久国产精品熟女影院| 国产91精品在线观看| 日韩福利在线视频| 黑人与娇小精品av专区| 99久久久久久久| 伊人久久男人天堂| 午夜av不卡| 成人自拍视频网站| 天天天综合网| 五月婷婷狠狠操| 99视频国产精品| 69av视频在线| 欧美日韩国产成人在线91 | 久久韩剧网电视剧| 女生影院久久| 久久国产精品一区二区三区| 午夜亚洲福利| 亚洲18在线看污www麻豆| 国产视频一区在线观看| 97人人澡人人爽人人模亚洲| 日韩区在线观看| 毛片免费不卡| 国产欧美 在线欧美| 欧美综合一区| 久久精品视频91| 久久亚洲精精品中文字幕早川悠里| 久久视频免费看| 精品动漫一区二区三区在线观看| 黄黄的网站在线观看| 成人免费淫片aa视频免费| 久久国产亚洲精品| 日韩一级免费片| 国产精品免费丝袜| 亚洲一区二区天堂| 日日狠狠久久偷偷四色综合免费| 色8久久影院午夜场| 日本高清不卡一区二区三| 亚洲专区一区| 日韩一区二区a片免费观看| 一本久道久久综合中文字幕| 国产一级网站视频在线| 日本视频久久久| 精品成人影院| www.夜夜爽| 亚洲欧美国产高清| 亚洲av少妇一区二区在线观看| 欧美裸体男粗大视频在线观看| 欧美第一在线视频| 久久艹国产精品| 99视频一区二区| 欧美日韩综合一区二区三区| 亚洲欧美制服中文字幕| 不卡亚洲精品| 裸体大乳女做爰69| 国产盗摄视频一区二区三区| 国产亚洲欧美久久久久| 日韩av网站电影| 欧美一区久久久| 亚洲视频在线观看日本a| 精品一区二区三区蜜桃| 欧美成人免费观看视频| 亚洲国产精品成人精品| 欧美大片免费观看网址| 一区二区精品国产| 国产91精品免费| 国产无套丰满白嫩对白| 少妇高潮 亚洲精品| 伊人www22综合色| 99色精品视频| 日韩一区欧美一区| 国产香蕉在线观看| 国产精品a久久久久久| 99热精品久久| 日本黄色录像片| 欧美日韩一区二区在线观看视频 | 欧美亚洲视频一区二区| 凹凸成人精品亚洲精品密奴| 9191在线视频| 色88888久久久久久影院按摩| 蜜桃视频在线观看www社区| 国产精品xxxx| 媚黑女一区二区| 国产男女猛烈无遮挡在线喷水| 欧美精品一区二区三| 国产精品亚洲d| av高清在线免费观看| 国产精品毛片大码女人| 狠狠躁日日躁夜夜躁av| 国产精品美女免费看| 精品动漫3d一区二区三区免费版 | 三级黄色片免费看| 欧美性生交xxxxxdddd| 性爱视频在线播放| 亚洲精品视频一二三| 91在线国产福利| 国产乱子伦精品无码码专区|