精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

MLSys’25 | 極低內存消耗:用SGD的內存成本實現AdamW的優化性能

人工智能 新聞
隨著大語言模型規模不斷攀升,內存需求也在呈爆炸式增長。APOLLO 不僅在理論上打破了優化器內存瓶頸,更在實踐中展現出預訓練與微調的卓越性能。

本文第一作者 Hanqing Zhu 與 Zhengyu Zhang 均為 UT Austin 博士生。Hanqing Zhu 專注于高效 AI 計算,致力于優化機器學習硬件、系統及算法;Zhengyu Zhang 聚焦構建高效可靠的機器學習系統。通訊作者為 UT Austin 的 David Z. Pan、Zhangyang Wang 以及 Meta AI 的 Jinwon Lee 。

大語言模型(LLM)正以驚人的速度重塑各個領域的格局,但其預訓練與微調過程卻面臨著前所未有的資源考驗 —— 不僅需要龐大的計算能力,更對內存提出了極高要求。

訓練 LLM 時,不僅需要存儲億級參數,還必須額外保存梯度與優化器狀態(例如 Adam 中的動量和方差)。

例如,預訓練 LLaMA 7B 的一個批次就消耗高達 58GB 內存:14GB 用于模型參數,42GB 用于優化器狀態和梯度。這巨大的 “隱形” 內存開銷迫使研究者不得不選用顯存更大的高端 GPU、增加 GPU 數量,甚至犧牲訓練速度調低批量大小。

首次以類 SGD 內存成本完成大模型訓練

UT Austin 和 Meta AI 推出了全新訓練策略 ——APOLLO(Approximated Gradient Scaling for Memory Efficient LLM Optimization)。這一創新方法首次實現了以 SGD 級別的內存成本訓練大模型,同時保持了 AdamW 的卓越優化性能(已在 LLaMA 7B 的預訓練上驗證)。

文章已經被 MLSys 2025 接受,同時目前 APOLLO 已在 Hugging Face Transformers、LLaMA-Factory 等主流開源項目中落地,研究者可以輕松調用這一方法開展低內存大模型訓練與微調。

核心亮點

  • 極低內存消耗:首次以類 SGD 內存成本完成大模型訓練,達到甚至超越 AdamW 的性能。

  • 無需 SVD 計算:首次實現僅需輕量級隨機投影進行大模型預訓練,甚至在 7B 模型上優化速度超越 Adam。

卓越系統性能

  • 3 倍預訓練加速:在 8 塊 A100 GPU 上,APOLLO 預訓練 LLaMA 7B 模型實現了 3 倍的加速。

  • 突破規模限制:首次利用 DDP 成功訓練 13B 模型,并在 12GB 內存的消費級 GPU(如 NVIDIA RTX 4090)上完成 7B 模型的預訓練,無需依賴模型并行、檢查點或卸載策略。

  • 論文地址:https://arxiv.org/pdf/2412.05270
  • 論文網站:https://zhuhanqing.github.io/APOLLO/
  • 論文代碼: https://github.com/zhuhanqing/APOLLO

方法簡要介紹

從 Adam 到結構化更新

在傳統的 Adam 優化器中,學習率的自適應更新是基于每個參數的梯度動量和方差:

APOLLO 首先將 Adam 的更新過程等效理解為對原始梯度  施加一個基于梯度動量和方差的梯度縮放因子,進一步發現這一縮放因子可以通過結構化更新(例如按通道或張量進行縮放)來近似實現。

在 LLaMA-130M 上的實驗驗證表明,結構化更新不僅不會導致性能損失,反而會略微提升模型性能(見圖 1)。這一發現為 APOLLO 的設計提供了理論基礎。

圖 1: 結構化梯度縮放與 Adam 的訓練損失對比

APOLLO 框架

盡管結構化更新簡化了優化器設計,但仍需保存完整的優化器狀態,內存開銷依然較高。這促使解決以下關鍵問題:

問題①:是否可以將結構化的學習率自適應轉換為一種既實用又內存高效的優化方法?

作者提出了 APOLLO,在低秩空間中構造一個輔助優化器狀態,用于預測結構化更新的梯度縮放因子(見圖 2)。由于優化器狀態建立在低秩空間中,其內存占用顯著減少。

圖 2: APOLLO 框架

問題②:低秩空間中的自適應學習率能否有效近似其在原始空間中的行為?

APOLLO 通過理論證明,低秩空間中的結構化梯度縮放因子能夠有效近似其在原始空間中的行為。同時從低秩空間預測的縮放因子會以 √(n/r) 的比例變化(n 為原始空間維度,r 為低秩空間的秩)。

這使得 APOLLO 可通過放縮縮放因子來彌補低秩帶來的誤差, 從而可采用極低的秩近似,在不犧牲性能的前提下實現極低的內存消耗。實驗表明,在 LLaMA-7B 上,APOLLO 僅需 256 的秩,性能仍優于使用 1024 秩的 GaLore。

圖 3:梯度縮放因子隨秩的變化按照理論推導的 √(n/r) 變化

問題③:是否仍需要昂貴的 SVD 來構造低秩空間?

不需要。APOLLO 無需傳統方法中基于昂貴 SVD 運算的低秩投影方法,只需采用基于隨機投影的方法。這種方法避免了 SVD 的計算開銷,引入了極低的額外計算,甚至 APOLLO 在 7B 上的優化速度還快于 Adam。

問題④:是否能進一步壓縮優化器狀態至 SGD 的內存消耗,同時達到甚至超越 AdamW 的性能?

為實現極致內存高效,APOLLO 提出了 APOLLO-Mini。APOLLO-Mini 通過僅使用 rank-1 的輔助子空間進行張量級梯度縮放,而非 APOLLO 中的通道級更新。

實驗結果顯示,APOLLO-Mini 在實現 SGD 內存消耗的同時,其預訓練性能甚至超越了 AdamW。這一結果充分證明了結構化學習率更新的有效性,并為資源有限的研究者提供了高效訓練大模型的解決方案。

下圖為將 APOLLO 應用于 Adam 的算法:

實驗及結果

研究者對 APOLLO 的 LLM 預訓練、微調以及系統級性能優勢進行了全面評估。

預訓練

研究團隊在 C4 數據集(經過凈化處理的 Common Crawl 語料庫)上對基于 LLaMA 的大型語言模型進行了預訓練實驗。

實驗結果顯示 APOLLO 系列方法(即使在使用極低秩的情況下,如秩分別為 256 和 1)均能顯著降低內存需求,并且獲得比 Adam 以及當前 SOTA 方法更好的結果。

表 1: 使用 C4 數據集預訓練不同大小的 LLaMA 模型驗證集困惑度(↓)對比

在 LLaMA 7B 模型上,APOLLO 系列不僅在內存使用上取得巨大突破,其訓練性能也遠超過 Adam 以及使用高秩(例如 1024)的 GaLore 方法。

表 2: 使用 C4 數據集預訓練 LLaMA-7B 模型驗證集困惑度(↓)對比

微調

微調任務(常識推理和 MMLU)中,APOLLO 的表現同樣搶眼,達到了甚至超越 Adam 基線的效果。

系統優勢

  • 加速訓練

在硬件資源受限的情況下,APOLLO 能夠支持比 AdamW 高達 4 倍的批量大小,從而實現最高可達 3 倍的訓練加速。

  • 極低內存消耗

首次實現了在 12GB 內存的消費級 GPU 上成功預訓練 LLaMA 7B 模型,為大模型訓練在低資源環境下提供了新的可能性。

圖 4:APOLLO 內存和訓練速度優勢

  • 極低的計算開銷

由于不依賴昂貴的 SVD 計算,APOLLO 優化時間在 7B 上甚至比 adam 還要快。

隨著大語言模型規模不斷攀升,內存需求也在呈爆炸式增長。APOLLO 不僅在理論上打破了優化器內存瓶頸,更在實踐中展現出預訓練與微調的卓越性能。APOLLO 為資源受限的團隊提供了一條低成本、高效率的大模型訓練之路,預示著未來大模型訓練將進入一個全新的時代。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2018-02-08 09:37:27

Pandas大數據Spark

2013-06-03 09:40:53

內存消耗性能優化優化技巧

2017-02-14 17:00:39

iOSApp內存優化

2015-09-16 15:21:23

Android性能優化內存

2016-12-22 17:21:11

Android性能優化內存泄漏

2017-12-14 14:32:30

.Net內存代碼

2009-07-09 18:25:31

MyEclipse消耗

2010-05-20 18:40:33

IIS服務器

2018-12-14 10:34:57

內存性能虛擬機

2017-03-14 18:48:06

Android性能優化內存優化

2024-10-07 08:37:32

線程池C#管理機制

2018-07-23 09:26:08

iOS內存優化

2024-07-03 10:46:10

2025-02-21 13:00:00

2021-07-21 09:02:44

開發技能代碼

2020-12-21 08:32:07

內存性能優化

2024-04-26 09:26:43

Nginx負載均衡算法

2009-12-29 13:52:49

寬帶接入網

2025-04-16 10:19:21

Python列表推導式

2019-12-16 10:43:38

Linux內存消耗進程
點贊
收藏

51CTO技術棧公眾號

国产精品无码永久免费888| 人人狠狠综合久久亚洲| 亚洲国产精品99久久| www黄色av| 麻豆视频在线播放| 成人av网在线| 国产欧美日韩91| 国产午夜久久久| 欧美美女一区| 亚洲高清福利视频| 亚欧美在线观看| 91破解版在线观看| 国产精品白丝在线| 精品在线一区| 国产高清不卡视频| 日韩av电影免费观看高清完整版| 美女黄色丝袜一区| 日韩视频在线观看免费视频| 国产suv精品一区二区四区视频| 一本色道久久综合亚洲aⅴ蜜桃| 九一免费在线观看| 电影av一区| 99精品黄色片免费大全| 444亚洲人体| 中文字幕1区2区3区| 国产欧美欧美| 久久免费精品日本久久中文字幕| 182在线观看视频| 国产最新精品| 日韩的一区二区| 久久久久99人妻一区二区三区| 成人精品国产| 日本乱人伦一区| 男人添女人下面高潮视频| 九色porny在线| 欧美国产日本视频| 欧洲久久久久久| 婷婷五月综合激情| 国模无码大尺度一区二区三区| 国产精品电影观看| 91午夜精品亚洲一区二区三区| 亚洲黄色三级| 欧美激情视频一区二区| 久久r这里只有精品| 国产精品99一区二区三区| 中文字幕国产精品| 国产在线免费av| 日韩在线视屏| 日韩视频―中文字幕| 超碰人人干人人| 成人午夜av| 中文字幕免费精品一区高清| www.日本高清视频| 成人精品天堂一区二区三区| 国产亚洲精品久久久久动| 色噜噜日韩精品欧美一区二区| 亚洲性视频大全| 亚洲精品一区中文字幕乱码| 亚洲成人网在线播放| 国产99久久久国产精品成人免费| 亚洲男人天堂网| 香蕉视频久久久| 91免费精品| 欧美成人精品不卡视频在线观看| 一区二区在线观看免费视频| 韩国久久久久| 国内精品视频久久| 欧美h在线观看| 丝袜美腿亚洲色图| 国产男人精品视频| 99久久亚洲精品日本无码 | 日本精品www| 欧美成人精品三级网站| 欧美私模裸体表演在线观看| 欧美日韩一区二区三区69堂| 国产精品一级在线观看| 欧美sm美女调教| 四虎永久免费影院| 成人嘿咻视频免费看| 久久国产精品网站| 久久视频免费在线观看| 久久久久.com| 成人欧美一区二区三区黑人| 午夜精品久久久久久久第一页按摩| 成人福利视频在线看| 欧美一区二区三区成人久久片| 日韩毛片久久久| 亚洲在线观看免费视频| www.com毛片| 青草综合视频| 亚洲精品大尺度| 殴美一级黄色片| 亚洲黄色免费| 成人写真福利网| 欧美zzoo| 亚洲三级久久久| 国产精品丝袜久久久久久消防器材| 国产综合色激情| 亚洲精品ady| 永久免费看片视频教学| 亚洲国产高清一区二区三区| 国产精品免费看久久久香蕉| 亚洲精品久久久久久动漫器材一区 | 亚洲一区影音先锋| 熟妇人妻无乱码中文字幕真矢织江| av在线亚洲一区| 亚洲人成免费电影| 日本a在线观看| 久久国产夜色精品鲁鲁99| 国产伦精品一区二区三区四区视频| shkd中文字幕久久在线观看| 午夜亚洲国产au精品一区二区| 欧美特级aaa| 特黄特色欧美大片| 欧美黄色www| 一本久道久久综合无码中文| 26uuu亚洲综合色| 99国产精品白浆在线观看免费| 中文字幕系列一区| 国产丝袜精品视频| 国产一二三四在线| 国产在线精品一区二区| 水蜜桃一区二区三区| 98色花堂精品视频在线观看| 3d成人h动漫网站入口| 日本理论中文字幕| 嫩草成人www欧美| 好看的日韩精品视频在线| 一区二区三区伦理| 欧美一区二区美女| frxxee中国xxx麻豆hd| 麻豆国产欧美一区二区三区| 青青影院一区二区三区四区| 国产乱码午夜在线视频| 精品国产sm最大网站| 男女性高潮免费网站| 久久99精品网久久| 亚洲一区二区高清视频| 99久久久国产精品免费调教网站| 精品一区二区电影| 国产精品21p| 久久―日本道色综合久久| 福利视频一二区| 美女网站色精品尤物极品姐弟| 午夜精品蜜臀一区二区三区免费| 成人精品在线播放| 午夜久久久影院| 中文视频在线观看| 亚洲在线日韩| 欧美一区二区三区在线播放| 日韩精品99| 曰本色欧美视频在线| 中文字幕欧美在线观看| 国产精品毛片久久久久久久| 亚洲天堂2018av| 婷婷中文字幕一区| 亚洲最大av网站| 国产精品—色呦呦| 亚洲黄在线观看| 在线永久看片免费的视频| 久久精品视频网| 天天干天天综合| 国产精品传媒精东影业在线| 91手机在线播放| 多野结衣av一区| 亚洲人成电影网站色www| 国产精品高清无码| **网站欧美大片在线观看| 国产精品19p| 99精品国产在热久久婷婷| 欧美日韩一区二区三区免费| 日韩成人在线电影| 欧美激情亚洲国产| 男女av在线| 欧美一区永久视频免费观看| 国产极品在线播放| 国产香蕉久久精品综合网| 777一区二区| 亚洲东热激情| 欧美日韩综合网| 亚洲精品成a人ⅴ香蕉片| 欧美大片在线免费观看| 天堂a√中文在线| 欧美精品v国产精品v日韩精品| 久久久久性色av无码一区二区| xfplay精品久久| 黄色小视频免费网站| 亚洲国产裸拍裸体视频在线观看乱了中文 | 手机免费av片| 国产欧美午夜| 在线看视频不卡| 牛牛精品成人免费视频| 国产综合香蕉五月婷在线| 超碰在线97国产| 中文字幕无线精品亚洲乱码一区 | 成人jjav| 亚洲成人a**站| 中文字幕久久熟女蜜桃| 亚洲永久免费视频| 免费看的黄色网| aaa亚洲精品| 在线观看日本www| 狂野欧美性猛交xxxx巴西| 欧美人与动牲交xxxxbbbb| 久草在线成人| 国产精品日韩欧美一区二区三区| 国产成人免费精品| 18一19gay欧美视频网站| а√天堂官网中文在线| 亚洲性xxxx| 五月婷婷狠狠干| 日韩欧美国产午夜精品| 中文字幕视频免费观看| 欧美特黄级在线| 国产中文字字幕乱码无限| 国产精品传媒入口麻豆| 亚洲一区二区三区蜜桃| www.亚洲激情.com| 人妻激情偷乱视频一区二区三区| 丝袜脚交一区二区| 777精品久无码人妻蜜桃| 欧美日韩免费| 国产三级中文字幕| 色一区二区三区四区| 欧美日本韩国一区二区三区| 伦理一区二区三区| 国产精品成人一区二区三区| 成人午夜888| 国产日韩换脸av一区在线观看| 性欧美videohd高精| 欧美亚洲国产精品| 春色校园综合激情亚洲| 久久久久久久一区二区| 色呦呦在线视频| 欧美日韩福利在线观看| 羞羞网站在线免费观看| 久久中文字幕一区| 精品自拍一区| 久久视频在线看| 99热国产在线| 久久99久国产精品黄毛片入口| 午夜激情在线观看| 日韩在线视频观看| 欧美成人高清在线| 久久精品久久久久久| 看黄网站在线观看| 久久av.com| av毛片在线看| 欧美精品成人91久久久久久久| 国产天堂在线播放视频| 久久久久久久久久久免费| 国产丝袜精品丝袜| 韩日精品中文字幕| 亚洲精品永久免费视频| 日本三级久久久| 国产精品天堂蜜av在线播放| 成人激情电影一区二区| 日韩成人在线看| 国产伦精品一区| 女人av一区| 色女人综合av| 亚洲国产一区二区在线观看| 国产91沈先生在线播放| 亚洲视频www| 国产天堂在线播放| 老司机精品视频在线| 伊人精品视频在线观看| 成人av网在线| 亚洲av毛片基地| 亚洲视频中文字幕| 538精品在线视频| 亚洲国产精品久久久久秋霞影院| 日本高清不卡码| 欧美精品在线观看一区二区| 亚洲免费成人在线| 国产亚洲精品久久久久久777| 米奇777四色精品人人爽| 久久免费视频在线观看| 欧美黑人一区| 亚洲一区精品电影| 亚洲理论电影片| 中国一级黄色录像| 国产一区二区精品| 中文av一区二区三区| 成人精品免费网站| 亚洲毛片亚洲毛片亚洲毛片| 亚洲综合一区在线| 国产精品高清无码| 亚洲国产精品嫩草影院久久| 91社区在线| 91精品国产色综合久久不卡98| 国产成人77亚洲精品www| 国产91精品入口17c| 欧美综合视频| 又大又硬又爽免费视频| 美女免费视频一区| 小毛片在线观看| 成人免费小视频| 午夜精品一区二| 精品久久久网站| 麻豆网站在线观看| 日本一区二区不卡| 国产欧美自拍一区| 亚洲精品偷拍视频| 日韩高清国产一区在线| 亚洲自拍偷拍精品| 中文字幕永久在线不卡| 国产寡妇亲子伦一区二区三区四区| 91精品国产综合久久久蜜臀图片| 久久精品国产亚洲a∨麻豆| 久国内精品在线| 久久av影院| 日本精品一区二区| a91a精品视频在线观看| 无码人妻久久一区二区三区蜜桃| 国产精品国产三级国产| 亚洲成熟少妇视频在线观看| 亚洲国产精品资源| 日本电影全部在线观看网站视频| 奇米一区二区三区四区久久| 99re6热只有精品免费观看| 免费观看黄色的网站| 蜜乳av一区二区| 久久久久久成人网| 91久久免费观看| 欧美精品久久久久久久久久丰满| 韩国福利视频一区| 国产成人夜色高潮福利影视| 欧美a级黄色大片| 极品美女销魂一区二区三区免费| 精品欧美一区二区久久久| 欧美性猛交xxxx免费看| 午夜国产在线视频| 91爱视频在线| 久久久久高潮毛片免费全部播放| 国产成人永久免费视频| 国产精品99久久久久久久vr| 精品国产欧美日韩不卡在线观看| 欧美男女性生活在线直播观看| 在线激情小视频| 国产精品女人久久久久久| 欧美偷拍综合| 久久黄色片网站| 国产精品美女久久久久久| 亚洲视频中文字幕在线观看| 自拍偷拍亚洲精品| 亚洲tv在线| 性生活免费观看视频| 国产麻豆成人传媒免费观看| 欧美色图一区二区| 精品国产免费人成在线观看| av在线视屏| 快播日韩欧美| 日本午夜一本久久久综合| 久久久国产一级片| 制服.丝袜.亚洲.中文.综合| 18加网站在线| 黑人另类av| 日韩成人午夜电影| 天海翼在线视频| 日韩亚洲欧美在线| 国产三级电影在线播放| 欧洲在线视频一区| 美美哒免费高清在线观看视频一区二区 | 1000部国产精品成人观看| 国产深喉视频一区二区| 欧美精品激情blacked18| 伊人久久大香线蕉| 中文字幕在线观看日| 一级女性全黄久久生活片免费| 日本精品一二区| 国产精品v片在线观看不卡| 亚洲欧美色图| 黄色片视频免费观看| 欧美在线一二三| 最爽无遮挡行房视频在线| 久久精品日产第一区二区三区乱码 | 神马久久久久久久久久| 国产精品久久久91| 欧美日韩伊人| 国产手机在线观看| 欧美一三区三区四区免费在线看| 国产高清视频色在线www| 亚洲人成网站在线播放2019| 夫妻av一区二区| 91丨九色丨海角社区| 欧美国产精品人人做人人爱| 国产成人手机高清在线观看网站| 小明看看成人免费视频| 天天做天天摸天天爽国产一区| av男人的天堂在线| 精品999在线观看| 九九久久精品视频| 国产无遮挡呻吟娇喘视频| 久久精品99久久久香蕉| 在线日韩网站| 亚洲少妇一区二区三区| 欧美日韩电影在线| 亚洲第一二三四区| 国产精品一线二线三线|