精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

無損減少80%激活值內存,提升5倍訓練序列長度,僅需兩行代碼

人工智能 新聞
來自港中文(深圳)和上海交通大學的團隊提出?StreamBP?算法。通過對鏈式法則進行線性分解和分步計算,StreamBP 將大語言模型訓練所需的激活值內存(logits 和 layer activation)降低至梯度檢查點(gradient checkpointing)的 20% 左右。

本文的第一作者羅琪竣、第二作者李夢琦為香港中文大學(深圳)計算機科學博士生,本文在上海交通大學趙磊老師、香港中文大學(深圳)李肖老師的指導下完成。

長序列訓練對于模型的長序列推理等能力至關重要。隨著序列長度增加,訓練所需儲存的激活值快速增加,占據訓練的大部分內存。即便使用梯度檢查點(gradient checkpointing)方法,激活值依然占據大量內存,限制訓練所能使用的序列長度。

來自港中文(深圳)和上海交通大學的團隊提出 StreamBP 算法。通過對鏈式法則進行線性分解和分步計算,StreamBP 將大語言模型訓練所需的激活值內存(logits 和 layer activation)降低至梯度檢查點(gradient checkpointing)的 20% 左右。

圖片

  • 論文標題:StreamBP: Memory-Efficient Exact Backpropagation for Long Sequence Training of LLMs
  • 論文:https://arxiv.org/abs/2506.03077
  • 代碼:https://github.com/Ledzy/StreamBP

在相同內存限制下,StreamBP 最大序列長度為梯度檢查點的 2.8-5.5 倍。在相同序列長度下,StreamBP 的速度和梯度檢查點接近甚至更快。StreamBP 適用于 SFT、GRPO、PPO 和 DPO 等常見 LLM 目標函數。代碼已開源,可集成至現有訓練代碼。

激活值內存和梯度檢查點

在反向傳播(Backpropagation, BP)的過程中,計算模型梯度需要用到模型的中間輸出(激活值)。舉例來說,對于模型中的線性變換圖片的梯度為圖片,因而計算圖片的梯度時需要儲存相應的激活值圖片。

對于模型中的任意函數變換 圖片 的梯度由以下鏈式法則計算:

圖片

其中 L 為目標函數,圖片為 Jacobian 矩陣。為了計算以上 Jacobian-vector product,需要在模型 forward 時儲存函數變換圖片的中間值(激活值),其內存消耗與 batch size、序列長度以及中間值維度正相關。

為了減少激活值的內存消耗,梯度檢查點(gradient checkpointing)方法在 forward 時只儲存每一層網絡的輸入,而不儲存該層的中間值。在 backward 至該層時,將重新 forward 此層輸入來計算得到該層激活值。使用梯度檢查點時儲存的激活值包括:

  • 所有層的輸入,一般為激活值內存的 5%-15%。
  • 單層的完整激活值,占據超過 85% 的激活值內存。

StreamBP 的核心思想

不同于梯度檢查點,StreamBP 避免儲存單層的完整激活值,而將單層的 BP 過程進行線性分解,序列化計算并累加。注意到對于函數變換圖片,鏈式法則存在以下線性分解:

圖片

StreamBP 基于以下觀察:對于 LLM 中的大部分函數變換圖片,如 Transformer 層、lmhead 層,可通過策略性地將輸出分塊圖片,使得計算塊 Jacobian-vector product 圖片所需的激活值遠小于計算完整的 Jacobian-vector product?;谠撚^察,StreamBP 依次計算上式中 D 個塊的 Jacobian-vector product 并累加,得到準確的梯度。

為了計算塊 Jacobian-vector product,需要分析圖片輸入和輸出的相關性,每次 forward 塊輸入圖片 得到塊輸出圖片,建立對應子計算圖。以簡單的線性變換圖片 為例,輸出和輸入在行維度上一一對應。StreamBP 按行分塊,每次計算單行的 Jacobian-vector product 并累加。下圖對比了標準 BP 和 StreamBP 在上述線性變換下的實現:

圖片

D 步累加得到的圖片圖片即為圖片圖片準確梯度。相比于標準 BP,StreamBP 僅需儲存圖片圖片,且總計算 FLOPs 相同。下表為 StreamBP 和標準 BP 的內存和時間對比:

圖片

LLM 訓練中的 StreamBP

StreamBP 應用于 LLM 中的 Transformer 層和 lmhead 層,分別用于降低層激活值和 logits 的內存消耗。

與線性變換不同,由于 Transformer 層存在注意力機制,塊輸出圖片并非僅由對應位置的塊輸入圖片決定,而與該塊及以前所有位置的輸入圖片都有關。StreamBP 利用圖片只與塊圖片有關的性質,建立了如下計算圖:

圖片

StreamBP 所需儲存的激活值和注意力掩碼(橙色)大幅低于梯度檢查點(橙色 + 白色部分)。

對于 lmhead 層,當以 SFT 或 GRPO 為目標函數時,觀察到不同位置的 logits 對于目標函數的影響相互獨立。因此,StreamBP 從序列維度分塊,每次計算單塊損失函數的梯度,從而只需儲存單塊 logits 和 logits 梯度。

圖片

圖:StreamBP for SFT

圖片

圖:StreamBP for GRPO

對于 DPO,由于非線性 sigmoid 函數的存在,每個位置的 logits 對于目標函數的影響并不獨立。StreamBP 利用 logits 梯度在序列維度的獨立性,分塊進行梯度計算。

圖片

圖:StreamBP for DPO

實驗結果

我們在單張 A800-80GB GPU 上測試了不同大小的模型,StreamBP 的最大 BP 序列長度為標準 BP 的 23-36 倍,梯度檢查點的 2.5-5.5 倍。

圖片

圖:不同序列長度下的 BP 峰值內存

在現有 Transformers 框架下,StreamBP 的實現可避免計算掩碼部分的 pre-attention score(見論文 3.2.2 部分),在長序列訓練下相較于梯度檢查點實現了加速。

圖片

通過使用 StreamBP,不同目標函數下最大的序列長度得到了大幅提升。在同樣的序列長度下,StreamBP 允許更大的批處理大小以加速訓練。

圖片

表:Qwen 3-4B 單個樣本 BP 時間,序列長度為 9000。

在 Deepspeed ZeRO 分布式訓練模式下,Distributed StreamBP 比梯度檢查點的最大可訓練序列長度提升了5—5.6倍。

圖片

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-07-11 08:54:00

2022-05-25 10:04:43

Go編程

2023-01-12 08:07:03

Python代碼版權

2020-07-22 08:30:02

代碼開發工具

2020-03-26 12:38:15

代碼節點數據

2024-11-27 14:30:00

模型訓練

2022-03-09 14:57:53

Numbapython

2023-09-12 14:58:00

Redis

2021-06-18 10:12:09

JS代碼前端

2025-05-15 13:40:13

數據訓練模型

2023-12-06 18:09:01

2025-06-18 10:05:26

2024-02-20 12:49:00

CSS函數前端

2017-02-28 15:35:09

OPPO

2022-06-07 08:07:05

GoNode.js

2024-04-03 12:32:00

數據訓練

2022-10-19 14:03:45

開源AI

2024-02-19 00:00:00

SQLite3數據庫代碼

2020-02-21 16:51:58

前端可視化傳染病

2022-09-25 23:10:53

Python數據集機器學習
點贊
收藏

51CTO技術棧公眾號

国产在线资源一区| 国产精品久久占久久| 99re国产精品| 欧美日韩国产a| 精品国产区在线| 色欲一区二区三区精品a片| 亚洲奶汁xxxx哺乳期| 国内成人精品| 性感美女极品91精品| 成人久久18免费网站图片| 国产全是老熟女太爽了| 136福利第一导航国产在线| 99精品在线观看| 精品国产成人在线影院| 国产av第一区| 一区二区的视频| 日本一本不卡| 亚洲美女少妇撒尿| 91免费综合在线| 久久爱一区二区| 青草综合视频| 国产精品久久久久久久久晋中| 国产成人91久久精品| 9.1成人看片免费版| 色香欲www7777综合网| 久久久久久久性| 国产成人精品视| 九九视频在线免费观看| 一区二区三区在线免费看 | 香蕉成人久久| 日韩av在线精品| av在线播放亚洲| 天堂中文在线看| 国产精品人人爽人人做我的可爱| 日韩极品精品视频免费观看| japan高清日本乱xxxxx| 天堂va在线| 波多野结衣在线aⅴ中文字幕不卡| 欧美精品成人在线| 国产不卡一二三| 在线手机中文字幕| 国产午夜三级一区二区三| 国产精品久久久久久久久久| www欧美com| 国产精品欧美大片| 欧美日韩中文字幕| 日韩伦理一区二区三区av在线| 亚洲手机在线观看| 国产精品v亚洲精品v日韩精品| 亚洲国产精品va在线看黑人动漫| 人妻内射一区二区在线视频| av电影在线观看一区二区三区| 久久av中文字幕片| 欧美激情2020午夜免费观看| a视频免费观看| 欧美国产视频| 午夜影院久久久| 国产免费黄色一级片| 国内精品一区视频| 天天操天天操天天干| 日本免费久久| 97人妻一区二区精品视频| 麻豆久久久久| 欧美少妇一区二区| 激情五月五月婷婷| 日本视频在线播放| 岛国精品一区二区| 国产精品久久久久久久天堂| 少妇久久久久久被弄高潮| 精品视频在线你懂得| 色婷婷香蕉在线一区二区| 欧美一区观看| 亚洲精品一区二区三区新线路| 亚洲欧美日韩一区在线观看| 97视频在线观看免费高清完整版在线观看 | 国产精品中文久久久久久久| 538精品在线观看| 欧美日一区二区在线观看| 亚洲人成绝费网站色www| 色播五月激情五月| 国产拍在线视频| 日韩理论片一区二区| 精品亚洲一区二区三区四区五区高| 婷婷在线免费视频| 日本视频在线一区| 97在线视频免费观看| 91精品久久久久久久久久久久| 中文字幕一区日韩精品| 亚洲第一视频网站| a级片在线观看| 欧美丝袜美腿| 欧美va在线播放| 日本不卡一区二区在线观看| 福利一区三区| 欧美特级限制片免费在线观看| 国产超级av在线| 国产天堂在线播放视频| 日韩美女精品在线| 五码日韩精品一区二区三区视频| 少妇精品视频一区二区| 欧美韩国一区二区| 欧美日韩国产综合在线| 天堂在线免费av| 国产1区2区3区精品美女| 成人高h视频在线| 亚洲乱码在线观看| 国产欧美精品一区二区色综合朱莉| 综合久久国产| 欧美日韩xx| 国产精品女主播av| 亚洲激情一区二区三区| h网站在线免费观看| 国产三级三级三级精品8ⅰ区| 久久免费视频2| 久操视频在线播放| 亚洲日本青草视频在线怡红院 | 中国xxxx性xxxx产国| 国产精品久久久久久久久久久久久久久 | www日本在线| 国产一区二区成人久久免费影院 | wwwwww在线观看| 美女国产一区| 国产成人精品免费久久久久| 亚洲风情第一页| 国产精品黄色在线观看| 欧美一级在线看| gay欧美网站| 色婷婷av久久久久久久| 亚洲精品乱码久久久久久自慰| 日韩精品专区| 亚洲第一精品电影| 黑人巨大精品一区二区在线| 日本网站在线观看一区二区三区| 国产中文一区二区| 草美女在线观看| 91精品国产高清一区二区三区蜜臀 | 爱情岛亚洲播放路线| 在线综合亚洲欧美在线视频 | 风间由美性色一区二区三区| 26uuu成人| 精品美女一区| 一区二区三区视频免费在线观看| 久久久久久久久久久久| 国产精品日本欧美一区二区三区| 国产精品区一区二区三含羞草| 六月丁香色婷婷| 一区二区三区四区国产精品| 超碰97在线看| freexxx性亚洲精品| 日韩一区二区三区在线视频| 成年人看片网站| 少妇高潮一区二区三区| 视频在线一区二区| 强行糟蹋人妻hd中文| 黄色小说综合网站| 精品国产一区二区三区四区vr | 日韩美女免费观看| 91av国产精品| 中文字幕一区二区三中文字幕| 牛夜精品久久久久久久| 视频在线一区| 国产一区二区日韩精品欧美精品| 2025国产精品自拍| 国产一区在线精品| 国产成人免费高清视频| 一区二区三区视频免费视频观看网站 | 99热国产免费| 久蕉在线视频| 欧美午夜精品电影| 午夜三级在线观看| 国产电影一区二区三区| 日本一区二区三区精品视频| 欧美电影免费看| 中文字幕精品久久| 日韩美女黄色片| 另类综合日韩欧美亚洲| 国产亚洲精品久久飘花| 美女搞黄视频在线观看| 欧美一区二区三区四区五区 | 成人信息集中地欧美| 在线观看wwwxxxx| 色综合欧美在线| 日韩一区二区三区四区视频| 国产视频一区三区| 日本在线免费观看一区| 成人动漫视频在线观看| 欧美高清性猛交| 日本福利片在线| 午夜精品久久久久久久| 亚洲欧美视频在线播放| 日韩精品欧美精品| 精品综合久久久| 成人交换视频| 亚洲亚裔videos黑人hd| 国产精品无码天天爽视频| 国产偷国产偷精品高清尤物| 日本免费色视频| 韩国av一区| 五月天亚洲综合情| 国产视频网站一区二区三区| 欧美在线视频免费| 天堂网在线资源| 欧美日韩情趣电影| 日韩av在线天堂| 国产精品盗摄一区二区三区| 久久精品女同亚洲女同13| 免费成人在线观看视频| 性欧美大战久久久久久久免费观看| 精品久久国产一区| 美女扒开尿口让男人操亚洲视频网站| 亚洲图片中文字幕| 亚洲成人动漫一区| 国产av一区二区三区传媒| 国产精品v欧美精品v日本精品动漫| 欧美高清视频一区| 国产日韩三级| 91久久在线播放| 国产一区二区主播在线| 国产亚洲激情在线| 免费国产黄色片| 亚洲不卡在线观看| 五月综合色婷婷| 国产亚洲精品久| 小毛片在线观看| 国产福利一区在线| 日韩成人精品视频在线观看| 中文字幕一区二区av| 91超碰在线电影| bl在线肉h视频大尺度| 日韩一中文字幕| 国产免费黄色大片| 亚洲一二三专区| 中文字幕狠狠干| 国产91丝袜在线播放0| 欧美大片久久久| 日本欧美一区二区三区| 日本wwww视频| 国产欧美丝祙| 国产黄色一级网站| 99在线|亚洲一区二区| 300部国产真实乱| 欧美成人精品| 精品国产乱码一区二区三区四区 | 精品一区二区久久久久久久网站| 伊人久久影院| 不卡视频一区| 91夜夜蜜桃臀一区二区三区| 午夜剧场成人观在线视频免费观看| 超鹏97在线| 日韩电影大片中文字幕| 丰满少妇一级片| 欧美mv和日韩mv的网站| 亚洲xxx在线| 欧美精品一区二区久久婷婷| 亚洲国产精品欧美久久| 精品毛片乱码1区2区3区| 丰满肉嫩西川结衣av| 亚洲成成品网站| 在线观看xxx| 亚洲欧美在线第一页| 精品电影在线| 中文字幕日韩电影| 精品麻豆一区二区三区| 欧美人成在线视频| 国产露出视频在线观看| 欧美大片在线观看一区二区| 国产一区二区视频网站| 色天使久久综合网天天| 天堂av免费在线观看| 亚洲国产精品欧美一二99| 日韩精品成人一区| 日韩欧美国产激情| 亚洲午夜无码久久久久| 欧美精品视频www在线观看 | 人妻aⅴ无码一区二区三区| 中文一区二区完整视频在线观看| av在线天堂网| 91麻豆精品一区二区三区| 性色av浪潮av| av电影在线观看一区| 欧美一级片在线免费观看| 99免费精品在线观看| 欧美午夜激情影院| 夜色激情一区二区| 99久久99久久精品国产| 亚洲风情在线资源站| www.国产毛片| 日韩一区二区三区四区| 全色精品综合影院| 久久中文字幕在线| 午夜看片在线免费| 欧美激情高清视频| 国产亚洲一区二区手机在线观看 | 一区二区三区在线不卡| 日本天堂网在线| 亚洲一区二区在线观看视频| 黄色一级片免费在线观看| 欧美精品久久一区| 污污视频在线观看网站| 久久精品电影网| 日本三级视频在线播放| 久久久视频在线| 国产第一页在线视频| 国产精品你懂得| 风间由美一区二区av101| 亚洲欧美久久234| 日韩午夜精品| 一级黄色片国产| 久久麻豆一区二区| 人妻无码一区二区三区| 亚洲特黄一级片| 无码日韩精品一区二区| 精品国产sm最大网站免费看| 午夜视频在线看| 国产成人久久精品| 青青草久久爱| 精品国产av无码一区二区三区| 亚洲性视频h| 免费看一级大黄情大片| 国内精品第一页| 成人性生交大片免费看无遮挡aⅴ| 亚洲国产一区二区a毛片| 国产精品高潮呻吟AV无码| 亚洲欧美中文字幕| 国产直播在线| 国产成人亚洲欧美| 红杏视频成人| 国产在线拍揄自揄拍无码| 奇米精品一区二区三区四区 | 免费涩涩18网站入口| 久久亚洲综合av| 91看片在线播放| 一本一本久久a久久精品综合麻豆| 亚洲xxx在线| 欧美夫妻性生活视频| 精品一区二区三区四区五区 | 欧美日韩午夜在线| 国产女主播在线写真| 51精品在线观看| 在线一区视频观看| 欧美一区二区综合| 视频一区欧美日韩| 手机在线免费毛片| 91玉足脚交白嫩脚丫在线播放| 蜜桃av免费看| 狠狠躁夜夜躁久久躁别揉| 在线视频1卡二卡三卡| 亚洲性夜色噜噜噜7777| 欧美成人精品三级网站| 欧美成人第一区| 国产精品久久天天影视| 在线观看国产一级片| 国产91精品露脸国语对白| 欧美丰满艳妇bbwbbw| 精品欧美一区二区三区精品久久| 特级毛片在线| 国产嫩草一区二区三区在线观看| 在线看片一区| aa片在线观看视频在线播放| 岛国av在线不卡| 精品推荐蜜桃传媒| 成人h片在线播放免费网站| 婷婷综合亚洲| 亚洲精品鲁一鲁一区二区三区| 性欧美疯狂xxxxbbbb| 三级毛片在线免费看| 国产成人短视频| 欧美激情理论| 丰满人妻中伦妇伦精品app| 91啦中文在线观看| a片在线免费观看| 久久精品人人做人人爽| 国产精品115| 粉嫩虎白女毛片人体| 国产精品另类一区| www.国产欧美| 欧美诱惑福利视频| 日韩激情一区| 免费看三级黄色片| 日韩欧美在线免费| 男人在线资源站| 国产一区二区三区无遮挡 | a天堂在线资源| 亚洲自拍偷拍福利| 欧美一区2区| 国产伦精品一区二区三区妓女下载| 亚洲一区二区偷拍精品| 日本国产在线| 亚洲自拍偷拍视频| 免费精品视频| 超碰在线国产97| 亚洲欧美精品中文字幕在线| 成年人黄色大片在线| 日本一区二区精品| 懂色av中文字幕一区二区三区| 日本黄色中文字幕| 久久久久久久97| 久久精品国产68国产精品亚洲| 极品白嫩的小少妇| 欧美日韩久久久久久|