精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

650億參數(shù),8塊GPU就能全參數(shù)微調(diào):邱錫鵬團隊把大模型門檻打下來了

人工智能 新聞
全參數(shù)微調(diào)的顯存使用量和推理一樣多,大模型不再只是大型科技公司的玩具了。

在大模型方向上,科技巨頭在訓更大的模型,學界則在想辦法搞優(yōu)化。最近,優(yōu)化算力的方法又上升到了新的高度。

大型語言模型(LLM)徹底改變了自然語言處理(NLP)領(lǐng)域,展示了涌現(xiàn)、頓悟等非凡能力。然而,若想構(gòu)建出具備一定通用能力的模型,就需要數(shù)十億參數(shù),這大幅提高了 NLP 研究的門檻。在 LLM 模型調(diào)優(yōu)過程中通常又需要昂貴的 GPU 資源,例如 8×80GB 的 GPU 設(shè)備,這使得小型實驗室和公司很難參與這一領(lǐng)域的研究。

最近,人們正在研究參數(shù)高效的微調(diào)技術(shù)(PEFT),例如 LoRA 和 Prefix-tuning,為利用有限資源對 LLM 進行調(diào)優(yōu)提供了解決方案。然而,這些方法并沒有為全參數(shù)微調(diào)提供實用的解決方案,而全參數(shù)微調(diào)已被公認為是比參數(shù)高效微調(diào)更強大的方法。

在上周復旦大學邱錫鵬團隊提交的論文《Full Parameter Fine-tuning for Large Language Models with Limited Resources》中,研究人員提出了一種新的優(yōu)化器 LOw-Memory Optimization(LOMO)。

通過將 LOMO 與現(xiàn)有的內(nèi)存節(jié)省技術(shù)集成,與標準方法(DeepSpeed 解決方案)相比,新方法將內(nèi)存使用量減少到了之前的 10.8%。因此,新方法能夠在一臺具有 8×RTX 3090 的機器上對 65B 模型進行全參數(shù)微調(diào),每個 RTX 3090 具有 24GB 內(nèi)存。

圖片

論文鏈接:https://arxiv.org/abs/2306.09782

在該工作中,作者分析了 LLM 中內(nèi)存使用的四個方面:激活、優(yōu)化器狀態(tài)、梯度張量和參數(shù),并對訓練過程進行了三方面的優(yōu)化:

  1. 從算法的角度重新思考了優(yōu)化器的功能,發(fā)現(xiàn) SGD 在微調(diào) LLM 完整參數(shù)方面是一種很好的替代品。這使得作者可以刪除優(yōu)化器狀態(tài)的整個部分,因為 SGD 不存儲任何中間狀態(tài)。
  2. 新提出的優(yōu)化器 LOMO 將梯度張量的內(nèi)存使用量減少到 O (1),相當于最大梯度張量的內(nèi)存使用量。
  3. 為了使用 LOMO 穩(wěn)定混合精度訓練,作者集成了梯度歸一化、損失縮放,并在訓練期間將某些計算轉(zhuǎn)換為全精度。

新技術(shù)讓內(nèi)存的使用等于參數(shù)使用加上激活和最大梯度張量。全參數(shù)微調(diào)的內(nèi)存使用被推向了極致,其僅等同于推理的使用。這是因為 forward+backward 過程的內(nèi)存占用應該不會比單獨的 forward 過程少。值得注意的是,在使用 LOMO 節(jié)省內(nèi)存時,新方法確保了微調(diào)過程不受影響,因為參數(shù)更新過程仍然等同于 SGD。

該研究評估了 LOMO 的內(nèi)存和吞吐量性能,表明借助 LOMO,研究者在 8 個 RTX 3090 GPU 上就可以訓練 65B 參數(shù)的模型。此外,為了驗證 LOMO 在下游任務上的性能,他們應用 LOMO 來調(diào)優(yōu) SuperGLUE 數(shù)據(jù)集集合上 LLM 的全部參數(shù)。結(jié)果表明了 LOMO 對具有數(shù)十億參數(shù)的 LLM 進行優(yōu)化的有效性。

方法介紹

在方法部分,本文詳細介紹了 LOMO(LOW-MEMORY OPTIMIZATION)。一般而言,梯度張量表示一個參數(shù)張量的梯度,其大小與參數(shù)相同,這樣一來內(nèi)存開銷較大。而現(xiàn)有的深度學習框架如 PyTorch 會為所有參數(shù)存儲梯度張量。現(xiàn)階段,存儲梯度張量有兩方面原因:計算優(yōu)化器狀態(tài)以及歸一化梯度。

由于該研究采用 SGD 作為優(yōu)化器,因此沒有依賴于梯度的優(yōu)化器狀態(tài),并且他們有一些梯度歸一化的替代方案。

他們提出了 LOMO,如算法 1 所示,LOMO 將梯度計算與參數(shù)更新融合在一個步驟中,從而避免了梯度張量的存儲。

下圖為 SGD 和 LOMO 在反向傳播和參數(shù)更新階段的比較。Pi 為模型參數(shù),Gi 為 Pi 對應的梯度。LOMO 將梯度計算和參數(shù)更新融合到一個步驟中,使梯度張量最小。

圖片

LOMO 對應的算法偽代碼:

圖片

具體而言,該研究將 vanilla 梯度下降表示為

圖片

,這是一個兩步過程,首先是計算梯度,然后更新參數(shù)。融合版本為 

圖片

 該研究的關(guān)鍵思想是在計算梯度時立即更新參數(shù),這樣就不會在內(nèi)存中存儲梯度張量。這一步可以通過在向反向傳播中注入 hook 函數(shù)來實現(xiàn)。PyTorch 提供了注入 hook 函數(shù)的相關(guān) API,但卻無法用當前的 API 實現(xiàn)精確的即時更新。相反,該研究在內(nèi)存中最多存儲一個參數(shù)的梯度,并隨著反向傳播逐一更新每個參數(shù)。本文方法減少了梯度的內(nèi)存使用,從存儲所有參數(shù)的梯度到只存儲一個參數(shù)的梯度。

大部分 LOMO 內(nèi)存使用與參數(shù)高效微調(diào)方法的內(nèi)存使用一致,這表明 LOMO 與這些方法相結(jié)合只會導致梯度占用內(nèi)存的輕微增加。這樣就可以為 PEFT 方法調(diào)優(yōu)更多的參數(shù)。

實驗結(jié)果

在實驗部分,研究者從三個方面評估了他們提出的方法,即內(nèi)存使用情況、吞吐量和下游性能。如果不作進一步解釋,所有的實驗都是用 7B 到 65B 的 LLaMA 模型進行的。

內(nèi)存使用情況

研究者首先剖析了,在不同設(shè)置下,訓練期間的模型狀態(tài)和激活的內(nèi)存使用情況。如表 1 所示,與 AdamW 優(yōu)化器相比,LOMO 優(yōu)化器的使用導致內(nèi)存占用大幅減少,從 102.20GB 減少到 14.58GB;與 SGD 相比,在訓練 LLaMA-7B 模型時,內(nèi)存占用從 51.99GB 減少到 14.58GB。內(nèi)存用量的大幅減少主要歸因于梯度和優(yōu)化器狀態(tài)的內(nèi)存需求減少。因此,在訓練過程中,內(nèi)存大部分被參數(shù)占據(jù),與推理過程中的內(nèi)存用量相當。

圖片

如圖 2 所示,如果采用 AdamW 優(yōu)化器進行 LLaMA-7B 訓練,相當大比例的內(nèi)存(73.7%)被分配給優(yōu)化器狀態(tài)。用 SGD 優(yōu)化器替換 AdamW 優(yōu)化器可以有效減少優(yōu)化器狀態(tài)占用內(nèi)存的百分比,從而減輕 GPU 內(nèi)存使用(從 102.20GB 減少到 51.99GB)。如果使用 LOMO,參數(shù)更新和 backward 會被融合到一個步驟中,進一步消除優(yōu)化器狀態(tài)對內(nèi)存的需求。

圖片

吞吐量

研究者比較了 LOMO、AdamW 和 SGD 的吞吐性能。實驗是在一臺配備了 8 個 RTX 3090 GPU 的服務器上進行的。

對于 7B 的模型,LOMO 的吞吐量呈現(xiàn)顯著優(yōu)勢,超過 AdamW 和 SGD 約 11 倍。這一重大改進可歸功于 LOMO 在單個 GPU 上訓練 7B 模型的能力,這減少了 GPU 間的通信開銷。與 AdamW 相比,SGD 的吞吐量略高,這可歸因于 SGD 排除了動量和方差的計算。

至于 13B 模型,由于內(nèi)存的限制,它無法在現(xiàn)有的 8 個 RTX 3090 GPU 上用 AdamW 訓練。在這種情況下,模型的并行性對 LOMO 來說是必要的,LOMO 在吞吐量方面仍然優(yōu)于 SGD。這一優(yōu)勢歸功于 LOMO 的內(nèi)存高效特性,以及只需要兩個 GPU 以相同的設(shè)置來訓練模型,從而降低了通信成本,提高了吞吐量。此外,在訓練 30B 模型時,SGD 在 8 個 RTX 3090 GPU 上遇到了內(nèi)存不足(OOM)的問題,而 LOMO 在只有 4 個 GPU 的情況下表現(xiàn)良好。

最后,研究者使用 8 個 RTX 3090 GPU 成功訓練了 65B 模型,實現(xiàn)了 4.93 TGS 的吞吐量。利用這樣的服務器配置和 LOMO,模型在 1000 個樣本上的訓練過程(每個樣本包含 512 個 token)大約需要 3.6 小時。

下游性能

為了評估 LOMO 在微調(diào)大型語言模型方面的有效性,研究者進行了一系列廣泛的實驗。他們將 LOMO 與其他兩種方法進行比較,一種是不需要微調(diào)的 Zero-shot,另一種是目前很流行的參數(shù)高效微調(diào)技術(shù) LoRA。

圖片

表 3 結(jié)果顯示:

  • LOMO 的表現(xiàn)明顯好于 Zero-shot;
  • 在大多數(shù)實驗中,LOMO 普遍優(yōu)于 LoRA;
  • LOMO 可以有效擴展至 650 億參數(shù)的模型。

LOMO 和 LoRA 在本質(zhì)上是相互獨立的。為了驗證這一說法,研究者使用 LLaMA-13B 在 BoolQ 和 MultiRC 數(shù)據(jù)集上進行了實驗。結(jié)果如圖 3 所示。

他們發(fā)現(xiàn),LOMO 在持續(xù)增強 LoRA 的性能,不管 LoRA 取得的結(jié)果有多高。這表明,LOMO 和 LoRA 采用的不同微調(diào)方法是互補的。具體來說,LOMO 專注于微調(diào)預訓練模型的權(quán)重,而 LoRA 則調(diào)整其他模塊。因此,LOMO 不會影響到 LoRA 的性能;相反,它有助于對下游任務進行更好的模型調(diào)優(yōu)。

圖片

更多細節(jié)參見原論文。

責任編輯:張燕妮 來源: 機器之心
相關(guān)推薦

2023-11-24 12:11:35

2024-02-28 11:37:53

英偉達AI

2021-06-11 15:02:36

模型人工智能深度學習

2023-12-13 12:55:39

模型數(shù)據(jù)

2022-08-20 07:52:56

語言模型參數(shù)PaLM

2023-09-12 17:52:00

模型智能

2022-11-09 17:12:38

AI模型

2023-10-30 14:59:28

2024-01-06 17:39:47

數(shù)據(jù)視頻

2023-06-26 12:49:25

2023-09-23 12:35:19

模型參數(shù)

2024-03-04 12:32:20

模型訓練

2023-06-02 15:47:49

2023-08-10 14:04:15

代碼模型

2023-07-18 15:05:00

開源大模型

2023-02-25 16:14:36

AIMeta語言模型

2025-07-08 03:22:00

大模型參數(shù)AI

2024-01-18 15:38:17

語言模型大型語言模型

2023-06-07 17:55:01

模型性能

2023-01-04 12:47:05

AI
點贊
收藏

51CTO技術(shù)棧公眾號

亚洲国产精品综合久久久| 国产精品久久久久77777丨| 成人免费观看视频| 日本精品一区二区三区在线| 欧美一区二区三区粗大| 欧美黄色一级| 日韩欧美精品中文字幕| 亚洲国产日韩欧美| 欧美视频一二区| 日韩电影在线一区二区| 欧美黄色片在线观看| 伊人网伊人影院| 99国产精品免费网站| 午夜激情一区二区| 亚洲va久久久噜噜噜久久狠狠| 国产熟女一区二区三区五月婷 | 欧美视频在线播放一区| 日本美女在线中文版| 99久久99精品久久久久久| 国产精品视频永久免费播放| 日韩av男人天堂| 国产大片一区| 亚洲一二在线观看| 国产精品熟妇一区二区三区四区| 成人涩涩视频| 精品欧美激情精品一区| 91大学生片黄在线观看| 成人在线观看一区| 91视视频在线观看入口直接观看www| 91精品久久久久久综合乱菊| 中文字幕免费观看| 日韩午夜免费| 欧美精品福利在线| 精品无码一区二区三区蜜臀| 精品精品99| 亚洲美女福利视频网站| 丰满人妻一区二区三区免费视频棣| 成人国产一区二区三区精品麻豆| 精品久久久久久中文字幕| 欧美性猛交内射兽交老熟妇| 男女啪啪在线观看| 国产精品欧美极品| 亚洲国产一区二区三区在线播| 日本免费不卡| 久久综合久久综合亚洲| 精品国产一区二区三| 国内爆初菊对白视频| 国产福利视频一区二区三区| 91九色国产在线| 亚洲在线观看av| 看片的网站亚洲| 国产精品久久久久久久久久久久| 免费看一级视频| 美女尤物久久精品| 日本国产高清不卡| 日本黄色一级视频| 美女视频黄 久久| 国产在线精品自拍| 97在线播放免费观看| 精品伊人久久久久7777人| 国产精品视频xxx| 亚洲网站在线免费观看| 国产资源精品在线观看| 91福利视频导航| 亚洲国产av一区二区| 成人午夜精品在线| 久久本道综合色狠狠五月| 亚州精品国产精品乱码不99按摩| 99久久久无码国产精品| 免费亚洲一区二区| av每日在线更新| 亚洲色图视频网| 国产一级不卡视频| 麻豆免费在线| 在线视频观看一区| 在线看免费毛片| 美女久久精品| 亚洲国产欧美一区二区丝袜黑人 | 国产91对白在线播放| 久久国产视频精品| 免费一级片91| 99国产超薄丝袜足j在线观看| 亚洲欧美激情另类| 久久蜜桃av一区精品变态类天堂| 亚洲7777| xxxx在线视频| 欧洲一区二区三区在线| 亚洲热在线视频| 欧洲亚洲视频| 日韩亚洲一区二区| 国产一国产二国产三| 久久久亚洲人| 91在线国产电影| 国产视频一区二区视频| 婷婷久久综合九色国产成人 | 91亚洲一区| 久久99精品国产99久久6尤物| 日韩av一区二区在线播放| 日韩精品国产精品| 亚洲综合日韩在线| 免费在线稳定资源站| 亚洲天堂成人网| a在线视频观看| 亚洲国产91视频| 日韩精品中文字幕在线观看| 国产一区二区三区视频播放| 伊人久久亚洲影院| 国产免费亚洲高清| 天天操天天干天天干| 国产精品久久久久久户外露出| 国产亚洲黄色片| 久久精品国产精品亚洲毛片| 精品国产91九色蝌蚪| 国产精品情侣呻吟对白视频| 99精品视频免费观看| 成人美女av在线直播| 嫩草研究院在线| 一区二区免费在线| 欧美婷婷精品激情| 色爱av综合网| 欧美激情喷水视频| 国产又大又长又粗| 久久精品一区二区三区不卡牛牛 | 欧美一区二区成人6969| 呻吟揉丰满对白91乃国产区| 国产欧美亚洲一区| 国产福利不卡| 综合久久2o19| 欧美精品99久久久**| 五月天综合视频| 亚洲在线视频| 国外成人在线视频网站| 亚洲综合图区| 91精品在线免费| 亚洲欧美日韩第一页| 久久精品主播| 欧美日韩精品不卡| 在线高清av| 亚洲精品国产品国语在线| 极品颜值美女露脸啪啪| 精品一区二区影视| 亚洲图片欧洲图片日韩av| 欧美三级精品| 亚洲无av在线中文字幕| 黄色av一级片| 久久精品综合网| 日韩av播放器| 成人免费在线播放| 国产精品视频一区国模私拍 | 黄色国产精品视频| 亚洲另类av| 2024亚洲男人天堂| 日本私人网站在线观看| 欧美性69xxxx肥| 波多野结衣一本| 美女视频一区免费观看| 日本一区视频在线观看| 国产精品黄色片| 久久久999成人| 99热这里只有精品99| 亚洲欧美日韩国产另类专区| 色黄视频免费看| 欧美喷水视频| 国模精品娜娜一二三区| 伊人久久在线| 中文字幕亚洲二区| 国产精品国产三级国产普通话对白| ㊣最新国产の精品bt伙计久久| 污视频在线观看免费网站| 红桃视频欧美| 免费亚洲精品视频| 久久久精品一区二区毛片免费看| 日韩在线观看高清| 亚洲国产精品二区| 精品女厕一区二区三区| 日本精品在线观看视频| 精品中文字幕一区二区小辣椒 | 免费一区视频| 亚洲国产激情一区二区三区| 国产成人免费av一区二区午夜| 欧美国产精品va在线观看| 日韩中文字幕免费观看| 91久久精品日日躁夜夜躁欧美| 潮喷失禁大喷水aⅴ无码| 国产乱码精品一区二区三区五月婷| 国产一线二线三线女| 国产一区二区三区探花| 成人免费网站在线看| 成人性生交大片免费看在线播放| 精品亚洲男同gayvideo网站| 国产又大又粗又硬| 精品毛片三在线观看| 亚洲毛片亚洲毛片亚洲毛片| 国产成人综合精品三级| 成人黄色片视频| 欧美在线不卡| 日本一区二区三区视频在线观看| 麻豆国产精品| 国产精品久久中文| 国产精品yjizz视频网| 色99之美女主播在线视频| 婷婷丁香一区二区三区| 在线不卡免费欧美| 午夜影院免费在线观看| 亚洲精品日日夜夜| 真实乱视频国产免费观看| 国产精品18久久久久久久久 | 国产成人在线网站| 亚洲五月天综合| 激情自拍一区| 91麻豆天美传媒在线| 欧美精品一区二区久久| 精品91免费| 欧州一区二区三区| 国产欧美va欧美va香蕉在| 色一区二区三区| 精品少妇v888av| 青青青青在线| 尤物yw午夜国产精品视频| 日韩有码第一页| 日韩精品在线一区| 国产乱淫片视频| 欧美视频一区二区三区在线观看 | 美女被啪啪一区二区| 日本一区影院| 91久久精品国产91性色| 日本欧美韩国| 热久久这里只有| h片在线观看视频免费免费| 粗暴蹂躏中文一区二区三区| 五月婷婷在线视频| 永久免费精品影视网站| 飘雪影院手机免费高清版在线观看| 精品女同一区二区| 性生活视频软件| 日韩视频123| 国产免费一区二区三区免费视频| 欧美色倩网站大全免费| 午夜一区二区三区四区| 91成人在线免费观看| 免费的毛片视频| 色婷婷综合中文久久一本| 久久夜靖品2区| 午夜精品成人在线| 天天爽夜夜爽夜夜爽精品| 午夜精品久久久久久不卡8050| 国产精久久久久久| 亚洲成a人片在线观看中文| 国产一级免费观看| 午夜精品国产更新| 五月天婷婷激情| 色菇凉天天综合网| 最新中文字幕免费| 欧美日韩高清在线| 国产精品一区二区黑人巨大| 欧美一区二区三区视频在线观看| av免费观看网址| 欧美videos中文字幕| 亚洲国产成人在线观看| 亚洲第一页自拍| 天天射,天天干| 亚洲精品在线视频| а天堂8中文最新版在线官网| 日韩在线中文视频| 国产婷婷视频在线| 九九视频这里只有精品| 国产精品蜜芽在线观看| 青草成人免费视频| 九七电影院97理论片久久tvb| 91免费福利视频| 999久久久久久久久6666| 久草热久草热线频97精品| 精品一区亚洲| 亚洲午夜激情| 国内久久精品| 国产成人精品视频ⅴa片软件竹菊| 青青草一区二区三区| 91在线第一页| 99精品国产热久久91蜜凸| 日本一区二区视频在线播放| 亚洲天堂精品在线观看| 日韩av在线播| 欧美日韩国产一二三| 亚洲a视频在线| 亚洲女成人图区| 岛国中文字幕在线| 97国产在线视频| 本网站久久精品| 99精品欧美一区二区三区| 亚洲素人在线| 国产免费一区二区三区四在线播放 | 久久成人免费网| japanese在线观看| 国产精品久久久久久久久免费丝袜 | 全亚洲最色的网站在线观看| 亚洲天堂网站| 欧美福利精品| 欧美一区综合| 日韩一级片播放| 丁香桃色午夜亚洲一区二区三区| 99久久久无码国产精品衣服| 一区二区三区美女| 亚洲高清在线看| 亚洲第一视频网站| 免费的黄网站在线观看| 欧洲永久精品大片ww免费漫画| 成人亚洲精品| 日韩欧美精品久久| 91久久黄色| 日本黄色一级网站| 国产嫩草影院久久久久| 欧美一级视频免费观看| 日韩欧美亚洲国产另类| 午夜在线视频播放| 欧美在线免费视频| 白白在线精品| 在线观看三级网站| 蜜臀国产一区二区三区在线播放 | 日日天天久久| 国产www免费| 国产精品一区二区免费不卡 | 亚洲精品国产成人av在线| 综合久久国产九一剧情麻豆| 亚洲图片欧美日韩| 日韩精品高清视频| av在线理伦电影| 97碰碰视频| 欧美jjzz| 两女双腿交缠激烈磨豆腐| 国产精品美女一区二区| 波多野结衣一区二区三区在线| 日韩精品高清视频| 亚洲v.com| 久久久婷婷一区二区三区不卡| 国内在线观看一区二区三区| 三上悠亚 电影| 亚洲欧美日韩系列| 国产美女永久免费| zzjj国产精品一区二区| 全球中文成人在线| 亚洲精品欧美精品| 麻豆精品一二三| 呻吟揉丰满对白91乃国产区| 欧美日韩一区二区三区四区五区 | 欧美亚洲国产日韩| 日韩五码在线观看| 成av人片一区二区| 狠狠躁夜夜躁人人爽天天高潮| 精品国产91亚洲一区二区三区婷婷| 蜜乳av一区| 精品久久久久久中文字幕动漫| 亚洲美女一区| 香蕉视频黄色在线观看| 欧美性xxxxxxxxx| 九色在线免费| 国产精品人人做人人爽| 97视频精品| 超级砰砰砰97免费观看最新一期| 有码一区二区三区| 国产xxxx孕妇| 久久久免费在线观看| 日韩中文av| 精品福利电影| 成人乱色短篇合集| 国产精品黑丝在线播放| 国产精品自拍视频在线| 亚洲天堂精品在线观看| 亚洲精品国产一区二| 5278欧美一区二区三区| 精品国产乱码久久久久久果冻传媒| 久久国产色av免费观看| 亚洲欧洲精品一区二区三区 | 一本色道精品久久一区二区三区 | 男人女人黄一级| 中文字幕永久在线不卡| 亚洲国产精品国自产拍久久| 91国产精品视频在线| 日韩免费视频| 欧美xxxxx少妇| 欧美性大战久久久久久久蜜臀| 国产黄a三级三级三级av在线看| 国产成人精品日本亚洲11| 久久aⅴ乱码一区二区三区| 午夜激情视频在线播放| 亚洲大胆美女视频| 成人综合网站| 麻豆传媒网站在线观看| xfplay精品久久| 国产乱子伦精品无码码专区| 亚洲**2019国产| 欧美好骚综合网| 黄色污在线观看| 欧美电影影音先锋| 天堂√8在线中文| 小说区视频区图片区| 91女人视频在线观看| 国产精品欧美久久久久天天影视| 96精品视频在线| 91精品国偷自产在线电影 | 青青草精品视频在线观看|