精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果

發布于 2024-4-15 08:56
瀏覽
0收藏

隨著大模型的參數量日益增長,微調整個模型的開銷逐漸變得難以接受。


為此,北京大學的研究團隊提出了一種名為 PiSSA 的參數高效微調方法,在主流數據集上都超過了目前廣泛使用的 LoRA 的微調效果。

改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區


  • 論文: PiSSA: Principal Singular Values and Singular Vectors Adaptation of Large Language Models
  • 論文鏈接: https://arxiv.org/pdf/2404.02948.pdf
  • 代碼鏈接: https://github.com/GraphPKU/PiSSA


如圖 1 所示,PiSSA (圖 1c) 在模型架構上和 LoRA [1] 完全一致 (圖 1b),只是初始化 Adapter 的方式不同。LoRA 使用高斯噪聲初始化 A,使用 0 初始化 B。而 PiSSA 使用主奇異值和奇異向量 (Principal Singular values and Singular vectors) 來初始化 Adapter 來初始化 A 和 B。

改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區

圖 1)從左到右依次為全參數微調、LoRA、以及 PiSSA。藍色代表凍結的參數,橘黃色代表可訓練參數及它們的初始化方式。相比全參數微調,LoRA 和 PiSSA 都大幅節省了可訓練參數量。對于相同輸入,這三種方法的初始輸出完全相等。然而,PiSSA 凍結模型的次要成分,直接微調主成分(前 r 個奇異值和奇異向量);而 LoRA 可看作凍結模型的主要部分,而去微調 noise 部分。


在不同的任務上對比 PiSSA、LoRA 的微調效果


研究團隊使用 llama 2-7B、Mistral-7B 以及 Gemma-7B 作為基礎模型,通過微調提升它們的數學、代碼和對話能力。其中包括:在 MetaMathQA 上訓練,在 GSM8K 和 MATH 數據集上驗證模型的數學能力;在 CodeFeedBack 上訓練,在 HumanEval 和 MBPP 數據集上驗證模型的代碼能力;在 WizardLM-Evol-Instruct 上訓練,在 MT-Bench 上驗證模型的對話能力。從下表的實驗結果可以看出,使用相同規模的可訓練參數,PiSSA 的微調效果顯著超越了 LoRA,甚至超越了全參數微調。


改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區


對比 PiSSA、LoRA 在不同的可訓練參數量下微調的效果


研究團隊在數學任務上對模型的可訓練參數量和效果之間的關系進行消融實驗。從圖 2.1 發現在訓練初期,PiSSA 的訓練 loss 下降特別快,而 LoRA 存在不下降,甚至略有上升的階段。此外,PiSSA 的訓練 loss 全程低于 LoRA,說明對訓練集擬合得更好;從圖 2.2、2.3、2.4 可以看出在每種 setting 下,PiSSA 的 loss 始終比 LoRA 低,準確率始終比 LoRA 高,PiSSA 能夠使用更少的可訓練參數追趕上全參數微調的效果。


改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區

圖 2.1) 當秩為 1 時 PiSSA、LoRA 在訓練過程中的 loss。每幅圖的右上角是前 100 步迭代放大的曲線。其中 PiSSA 用橙色線表示,LoRA 用藍色線表示,全參數微調用綠線展示了最終的 loss 作為參考。秩為 [2,4,8,16,32,64,128] 時的現象與此一致,詳見文章附錄。


改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區

圖 2.2)使用秩為 [1,2,4,8,16,32,64,128] 的 PiSSA 和 LoRA 的最終 training loss。


改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區

圖 2.3)使用秩為 [1,2,4,8,16,32,64,128] 的 PiSSA 和 LoRA 微調的模型在 GSM8K 上的準確率。


改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區

圖 2.4)使用秩為 [1,2,4,8,16,32,64,128] 的 PiSSA 和 LoRA 微調的模型在 MATH 上的準確率。


PiSSA 方法詳解


受到 Intrinsic SAID [2]“預訓練大模型參數具有低秩性” 的啟發,PiSSA 對預訓練模型的參數矩陣

改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區

進行奇異值分解,其中前 r 個奇異值和奇異向量用來初始化適配器 (adapter) 的兩個矩陣

改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區

改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區

改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區

;剩余的奇異值和奇異向量用來構造殘差矩陣

改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區

,使得

改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區

。因此,適配器中的參數包含了模型的核心參數,而殘差矩陣中的參數是修正參數。通過微調參數量較小的核心適配器 A、B,凍結參數量較大的殘差矩陣

改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區

,就達成了用很少的參數近似全參數微調的效果。


盡管同樣受到 Intrinsic SAID [1] 啟發,PiSSA 和 LoRA 背后的原理卻截然不同。


LoRA 認為大模型微調前后矩陣的變化 △W 具有很低的本征秩 r,因此通過

改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區

改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區

相乘得到的低秩矩陣來模擬模型的變化 △W。初始階段,LoRA 使用高斯噪聲初始化 A,使用 0 初始化 B,因此

改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區

,以此保證模型初始能力沒有變化,并微調 A 和 B 實現對 W 進行更新。與此相比,PiSSA 不關心 △W,而是認為 W 具有很低的本征秩 r。因此直接對 W 進行奇異值分解,分解成主成分 A、B,以及殘差項

改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區

,使得

改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區

。假設 W 的奇異值分解為

改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區

,A、B 使用 SVD 分解后奇異值最大的 r 個奇異值、奇異向量進行初始化:


改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區


殘差矩陣使用其余的奇異值、奇異向量進行初始化:


改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區


PiSSA 直接對 W 的低秩主成分 A、B 進行微調,凍結次要的修正項。相比 LoRA 用高斯噪聲以及 0 初始化適配器參數、凍結核心模型參數,PiSSA 收斂更快、效果更好。


PiSSA 的發音類似 “披薩”(pizza)--- 如果把整個大模型類比為一個完整的披薩,PiSSA 切掉其中一角,而且是餡料最豐富的一角(主奇異值、奇異向量),重新烘焙(在下游任務上微調)成喜歡的口味。


由于 PiSSA 采用了和 LoRA 完全相同的架構,其可以作為 LoRA 的一種可選初始化方式,在 peft 包中很方便的進行修改和調用 (如以下代碼所示)。相同的架構也使得 PiSSA 繼承了大多數 LoRA 的優點,如:對殘差模型使用 4bit 量化 [3],減小訓練開銷;微調完成后適配器能合并進殘差模型,不改變推理過程的模型架構;無需分享完整模型參數,只需要分享參數量很少的 PiSSA 模塊,使用者直接加載 PiSSA 模塊就能自動進行奇異值分解以及賦值;一個模型可以同時使用多個 PiSSA 模塊等等。一些對 LoRA 方法的改進,也能與 PiSSA 進行結合:比如不固定每層的秩,通過學習找到最佳的秩 [4];用 PiSSA 指導的更新 [5],從而突破秩的限制等等。


# 在 peft 包中 LoRA 的初始化方式后面增加了一種 PiSSA 初始化選項:

if use_lora:

  nn.init.normal_(self.lora_A.weight, std=1 /self.r)

  nn.init.zeros_(self.lora_B.weight) 

elif use_pissa:

  Ur, Sr, Vr = svd_lowrank (self.base_layer.weight, self.r, niter=4) 

  # 注意:由于 self.base_layer.weight 的維度是 (out_channel,in_channel, 所以 AB 的順序相比圖示顛倒了一下)

  self.lora_A.weight = torch.diag (torch.sqrt (Sr)) @ Vh.t ()

  self.lora_B.weight = Ur @ torch.diag (torch.sqrt (Sr)) 

  self.base_layer.weight = self.base_layer.weight - self.lora_B.weight @ self.lora_A.weight


對比高中低奇異值微調效果實驗


為了驗證使用不同大小奇異值、奇異向量初始化適配器對模型的影響,研究人員分別使用高、中、低奇異值初始化 LLaMA 2-7B、Mistral-7B-v0.1、Gemma-7B 的適配器,然后在 MetaMathQA 數據集上進行微調,實驗結果展示在圖 3 中。從圖中可以看出,使用主要奇異值初始化的方法訓練損失最小,在 GSM8K 和 MATH 驗證集上的準確率更高。這一現象驗證了微調主要奇異值、奇異向量的有效性。


改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區

圖 3)從左到右依次為訓練 loss、在 GSM8K 上的準確率、在 MATH 上的準確率。其中藍色表示最大奇異值、橙色表示中等奇異值、綠色表示最小奇異值。


快速奇異值分解


PiSSA 繼承了 LoRA 的優點,使用起來方便,效果超越 LoRA。代價是在初始化階段,需要對模型進行奇異值分解。雖然僅需要在初始化時分解一次,但是仍然可能需要幾分鐘甚至幾十分鐘的開銷。因此,研究人員使用一種快速奇異值分解 [6] 方法替代標準的 SVD 分解,通過下表的實驗可以看出,僅需幾秒鐘的時間,就能逼近標準 SVD 分解的訓練集擬合效果。其中 Niter 表示迭代次數,Niter 越大,時間越久但是誤差越小。Niter = ∞表示標準 SVD。表格中的平均誤差表示快速奇異值分解與標準 SVD 得到的 A、B 之間的平均 L_1 距離。


改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區


總結與展望


本工作對預訓練模型的權重進行奇異值分解,通過將其中最重要的參數用于初始化一個名為 PiSSA 的適配器,微調這個適配器來近似微調完整模型的效果。實驗表明,PiSSA 比 LoRA 收斂更快,最終效果更好,唯一的代價僅是需要幾秒的 SVD 初始化過程。


那么,您愿意為了更好的訓練效果,多花幾秒鐘時間,一鍵更改 LoRA 的初始化為 PiSSA 嗎?


本文轉自 機器之心 ,作者:機器之心


原文鏈接:??https://mp.weixin.qq.com/s/3gvLaFJtlHVUOP4-DcinTg??

收藏
回復
舉報
回復
相關推薦
色猫猫成人app| 刘亦菲久久免费一区二区| 波多野结衣在线观看一区二区| 欧美午夜片在线看| 男人天堂成人网| 婷婷av一区二区三区| 日本vs亚洲vs韩国一区三区二区| 久久精品久久精品亚洲人| 第一页在线视频| 欧美电影免费观看网站| 亚洲人精品一区| 久久久久国产精品视频| 亚洲一级黄色大片| 亚洲久色影视| 日韩中文字幕免费| 无码人妻aⅴ一区二区三区| 欧美亚洲人成在线| 岛国精品视频在线播放| 中文字幕中文字幕99| 你懂的网站在线| 久久99精品一区二区三区三区| 欧美精品激情在线| 免费91在线观看| 成人观看免费完整观看| 无码人妻精品一区二| 欧美淫片网站| 在线中文字幕日韩| 国产精品成人无码专区| 亚洲免费一区| 色www精品视频在线观看| 欧美午夜小视频| 国产原创精品视频| 日本一区二区在线不卡| 久久精品综合一区| 超碰人人人人人人| 久久国产视频网| 国产成人拍精品视频午夜网站 | 久久综合999| 亚洲综合中文字幕在线观看| 亚洲午夜在线播放| 销魂美女一区二区三区视频在线| 九九久久久久99精品| 战狼4完整免费观看在线播放版| 小说区图片区色综合区| 精品国产污网站| 99999精品| 99久久999| 欧美年轻男男videosbes| 男女无套免费视频网站动漫| 韩国美女久久| 日韩欧美在线视频日韩欧美在线视频 | 在线观看国产精品日韩av| 翔田千里亚洲一二三区| 青青草免费在线| 91麻豆蜜桃一区二区三区| 成人黄视频免费| 丰满少妇在线观看bd| 国产激情一区二区三区四区 | 久久久久久久九九九九| 久久久久久久久丰满| 日韩中文字幕免费看| 中国1级黄色片| 亚欧美无遮挡hd高清在线视频| 最近中文字幕日韩精品| 网站永久看片免费| 欧美丰满日韩| 久久久国产视频| 99热精品免费| 欧美成人一品| 国产69精品久久久| 国产又大又黑又粗免费视频| 国产视频欧美| 国产99久久久欧美黑人| 中文字幕精品无码亚| 蜜桃视频第一区免费观看| 国产日韩精品综合网站| 国产片在线播放| 成人看片黄a免费看在线| 国产精品伊人日日| 欧美日韩影视| 国产精品乱码人人做人人爱| 久久久一二三四| 日本不卡影院| 色综合天天综合网天天看片| 亚洲欧美自拍另类日韩| 嫩呦国产一区二区三区av| 精品久久久久久久一区二区蜜臀| 白嫩情侣偷拍呻吟刺激| 国产精品亚洲片在线播放| 中文字幕精品在线| 日本a级片视频| 亚洲三级视频| 国产精品旅馆在线| 国产美女主播在线观看| 成a人片国产精品| 日韩欧美三级一区二区| 天使と恶魔の榨精在线播放| 婷婷成人激情在线网| 91制片厂毛片| 一区中文字幕| 亚洲香蕉成人av网站在线观看| 美国黄色片视频| 亚洲日本国产| 91久久久久久久久久久久久| 日本黄色一区二区三区| 国产精品女主播av| 国产日韩av网站| 亚洲视频资源| 精品网站999www| 成人一级黄色大片| 久久精品九九| 成人激情直播| 久久精品视频观看| 欧美性生交xxxxxdddd| 红桃视频一区二区三区免费| 欧美人与拘性视交免费看| 欧美国产日本在线| 国产一区二区三区视频免费观看 | 极品蜜桃臀肥臀-x88av| 日韩天堂av| 亚洲最大成人在线| 91精品大全| 一本大道av一区二区在线播放| 成年人看片网站| 99久久99视频只有精品| 国产精品av电影| 亚洲欧洲综合在线| 亚洲激情欧美激情| 久久6免费视频| 日韩精品免费一区二区三区| 欧美有码在线视频| 视频一区 中文字幕| 亚洲免费在线观看| 亚洲怡红院在线| 久久国产小视频| 日本在线精品视频| 爽爽视频在线观看| 午夜成人免费视频| 一区二区免费在线观看视频| 亚洲午夜黄色| 国产精品久久亚洲| 亚洲小说区图片区都市| 日韩欧美中文一区| 天天鲁一鲁摸一摸爽一爽| 蜜臀国产一区二区三区在线播放| 欧美裸体网站| 成人短视频app| 日韩精品免费在线视频| 欧美一级片免费在线观看| 99久久免费国产| 加勒比成人在线| 久久久久高潮毛片免费全部播放| 久久久久久久久爱| 亚洲不卡中文字幕| 在线免费看91| 国产精品久久久久三级| 污污网站免费观看| 99久久99视频只有精品| 成人亚洲激情网| 日本免费中文字幕在线| 欧美巨大另类极品videosbest| 三级黄色录像视频| 韩国毛片一区二区三区| 日本福利视频网站| 豆花视频一区二区| 欧美一区二区影院| 成年人视频免费在线观看| 欧美日韩国产首页在线观看| 国产精品白丝喷水在线观看| 国产麻豆欧美日韩一区| 天堂8在线天堂资源bt| 久久九九热re6这里有精品 | 91精品xxx在线观看| 在线色欧美三级视频| 一炮成瘾1v1高h| 亚洲一区视频在线| 亚洲蜜桃精久久久久久久久久久久 | 欧美午夜电影网| 黄色av片三级三级三级免费看| 免费不卡在线观看| 黑人巨大国产9丨视频| 亚洲高清在线一区| 69久久夜色精品国产69乱青草| 黄色片在线看| 日韩一级精品视频在线观看| av资源免费观看| 国产精品免费视频网站| 亚洲美女高潮久久久| 久久久久久久高潮| 国产精品88久久久久久妇女 | 色噜噜色狠狠狠狠狠综合色一| 成人av在线播放| 国语自产偷拍精品视频偷| 久久这里精品| 日韩欧美成人一区二区| 久草手机在线观看| 亚洲色图在线播放| 欧美熟妇一区二区| 国产一区二区在线电影| 国产伦精品一区二区三区四区视频_| 精品一级毛片| 粉嫩高清一区二区三区精品视频 | 91亚洲国产成人精品性色| 川上优av中文字幕一区二区| 日韩最新中文字幕电影免费看| 六月婷婷中文字幕| 欧美日韩国产乱码电影| 日韩乱码一区二区| 中文字幕在线观看一区二区| 9.1在线观看免费| 捆绑调教一区二区三区| 一区二区传媒有限公司| 久久精品影视| 亚洲免费不卡| 亚洲区小说区图片区qvod| av成人综合网| 国产成人精品一区二区三区视频| 国语自产精品视频在免费| 成年人黄视频在线观看| 国产一区二区三区视频免费| 性xxxx搡xxxxx搡欧美| 欧美一级午夜免费电影| 最新在线中文字幕| 欧美日韩中文在线| 免费看一级一片| 亚洲手机成人高清视频| 美国美女黄色片| 久久亚洲精品小早川怜子| 在线观看欧美一区二区| 韩国一区二区三区| 亚洲 国产 图片| 三级不卡在线观看| 91免费视频网站在线观看| 在线欧美三区| 国产一线二线三线女| 在线中文字幕亚洲| 在线观看免费黄色片| 久久国产综合| 无遮挡亚洲一区| 成人国产精品一级毛片视频| 欧美一区二区在线视频观看| 三级精品视频| 精品久久精品久久| 国产成人tv| 国产精品v欧美精品v日韩| 影音先锋欧美激情| 99国产在线视频| 66精品视频在线观看| 亚洲一区国产精品| 精品国产一区二区三区2021| 91欧美激情另类亚洲| 96视频在线观看欧美| 91在线视频精品| 国产欧美日韩电影| 97人人模人人爽人人喊38tv| 香蕉大人久久国产成人av| 国产精品久久精品视| 国产毛片久久久| 麻豆传媒一区二区| 精品一二三区| 中文字幕第一页亚洲| 欧美精品激情| 欧美成人高潮一二区在线看| 日韩视频久久| 国产精品无码专区av在线播放| 日本亚洲天堂网| 天天干天天操天天玩| 国内精品伊人久久久久av一坑| 中文字幕亚洲影院| 成人看片黄a免费看在线| 亚洲の无码国产の无码步美| 久久精品亚洲国产奇米99| 精品熟妇无码av免费久久| 综合av第一页| 国产污片在线观看| 日韩欧中文字幕| 一级特黄aaa大片在线观看| 欧美一级黄色录像| 日韩大胆视频| 日韩视频一区在线| rebdb初裸写真在线观看| 国产成人高潮免费观看精品| av日韩一区| 久久偷窥视频| 911精品美国片911久久久| 国产精品第157页| 日韩二区在线观看| 中文字幕人妻熟女人妻a片| 99国产精品久久久久久久久久久| 国产黄色片在线| 香港成人在线视频| 亚洲国产无线乱码在线观看| 欧美大片一区二区三区| 韩国免费在线视频| 欧美俄罗斯性视频| 人人视频精品| 999国内精品视频在线| 亚洲欧美tv| 国产成a人亚洲精v品在线观看| 久久精品天堂| gogo亚洲国模私拍人体| 久久青草国产手机看片福利盒子| 天天鲁一鲁摸一摸爽一爽| 欧美性猛交xxxx免费看| 国产成人麻豆精品午夜在线| 亚洲欧美激情另类校园| 1区2区3区在线视频| 国产精品久久久久久网站| 北条麻妃在线一区二区免费播放 | 欧美视频一区二区三区…| 91亚洲国产成人精品一区| 日韩成人xxxx| 久久香蕉av| 成人黄色av网站| 久久99国产成人小视频| 日本免费成人网| 麻豆精品国产91久久久久久| 自拍视频一区二区| 亚洲综合图片区| 国产麻豆精品一区| 一区二区亚洲精品国产| 范冰冰一级做a爰片久久毛片| 999国产视频| 在线中文字幕第一区| 制服丝袜综合网| 国产亚洲综合在线| 午夜毛片在线观看| 亚洲精品国产精品乱码不99按摩| 成人黄色在线电影| 成人亚洲欧美一区二区三区| 日本久久精品| 日韩在线第三页| 久久久久久久久久久久久久久99 | 少妇特黄一区二区三区| 亚洲一区在线看| 国产91免费看| 欧美激情精品久久久久久蜜臀| 精品国产第一国产综合精品| 亚洲一区二区三区精品视频| 日韩电影在线看| 精品无码在线观看| 91福利在线播放| 成a人v在线播放| 国产精品久久av| 精品日韩在线| 男人搞女人网站| 欧美极品xxx| 亚洲天堂狠狠干| 日韩小视频在线| 国产一区二区视频在线看| 可以免费看的黄色网址| 国产精品一区专区| 欧美日韩精品在线观看视频 | 成人激情在线| gai在线观看免费高清| 最新国产の精品合集bt伙计| av中文字幕在线免费观看| 欧美激情二区三区| 欧美jizz19性欧美| 久久久久久久激情| 国产欧美中文在线| 国产老女人乱淫免费| 欧美成人激情在线| jazzjazz国产精品久久| 你懂的av在线| 久久九九影视网| 中文字幕一区二区三区波野结 | 2020av在线| 免费日韩电影在线观看| 日韩成人精品在线观看| 91嫩草丨国产丨精品| 欧美精品一区二区三区高清aⅴ | 五月婷婷久久丁香| 国产区av在线| 91在线播放国产| 亚洲欧洲一区二区天堂久久| 一区二区黄色片| 欧美一区二区三区影视| 99爱在线视频| 午夜精品亚洲一区二区三区嫩草| 国产精品一区二区三区四区| 久久精品视频8| 国产亚洲精品高潮| 欧美影院精品| 国产无套内射久久久国产| 中文字幕日韩一区二区| 人妻偷人精品一区二区三区| 国产999精品久久久影片官网| 91成人观看| 特大黑人巨人吊xxxx| 欧美日韩精品电影| 91丝袜在线| 一区二区不卡在线视频 午夜欧美不卡'| 国产精品中文字幕日韩精品| 欧美成人一区二区三区四区| 久久视频在线直播| 久久不见久久见中文字幕免费| 国产资源中文字幕| 色婷婷精品久久二区二区蜜臂av | 亚洲免费观看高清在线观看|