精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

ReFT(表征微調):比PeFT效果更好的新的大語言模型微調技術

人工智能
ReFT(Representation Finetuning)是一種突破性的方法,有望重新定義我們對大型語言模型進行微調的方式。

ReFT(Representation Finetuning)是一種突破性的方法,有望重新定義我們對大型語言模型進行微調的方式。

這是由斯坦福大學的研究人員剛剛(4月)發布在arxiv上的論文,ReFT與傳統的基于權重的微調方法大有不同,它提供了一種更高效和有效的方法來適應這些大規模的模型,以適應新的任務和領域!

在介紹這篇論文之前,我們先看看PeFT。

參數高效微調 PeFT

參數高效微調方法(Parameter-Efficient Fine-Tuning,PEFT)僅微調少量或額外的模型參數,固定大部分預訓練參數,大大降低了計算和存儲成本,同時最先進的 PEFT 技術也能實現了與全量微調相當的性能。

在PeFT的思想之上就產生了我們非常熟悉的LoRA,還有各種LoRA的變體,除了有名的LoRA之外常用的PeFT方法還有:

Prefix Tuning:通過virtual token構造連續型隱式prompt ,這是21年斯坦福發布的方法。

P-Tuning V1/V2:這是清華大學在21年提出的將自然語言的離散模版轉化為可訓練的隱式prompt (連續參數優化問題),V2版在輸入前面的每層加入可微調的參數,增強了V1版的性能。

然后就是我們熟悉的也是最長用的LoRA,這里就不多介紹了,我們可以狹義理解為LoRA是目前最好的PeFT方法,這樣可以對我們下面介紹的ReFT更好的對比。

表征微調 ReFT

ReFT (Representation Finetuning)是一組專注于在推理過程中對語言模型的隱藏表示學習干預的方法,而不是直接修改其權重。

與更新模型整個參數集的傳統微調方法不同,ReFT通過策略性地操縱模型表示的一小部分來操作,指導其行為以更有效地解決下游任務。

ReFT背后的核心思想受到最近語言模型可解釋性研究的啟發:在這些模型學習的表示中編碼了豐富的語義信息。通過干預這些表示,ReFT旨在解鎖和利用這些編碼知識,實現更高效和有效的模型適應。

ReFT的一個關鍵優點是它的參數效率:傳統的微調方法需要更新模型參數的很大一部分,這可能是計算昂貴和資源密集的,特別是對于具有數十億參數的大型語言模型。ReFT方法通常需要訓練數量級更少的參數,從而獲得更快的訓練時間和更少的內存需求。

ReFT與PeFT有何不同

ReFT與傳統PEFT方法在幾個關鍵方面有所不同:

1、干預目標

PEFT方法,例如,LoRA、DoRA和prefix-tuning,側重于修改模型的權重或引入額外的權重矩陣。而ReFT方法不直接修改模型的權重;它們會干預模型在向前傳遞期間計算的隱藏表示。

2、適應機制

像LoRA和DoRA這樣的PEFT方法學習權重更新或模型權重矩陣的低秩近似值。然后在推理期間將這些權重更新合并到基本模型的權重中,從而不會產生額外的計算開銷。ReFT方法學習干預,在推理過程中在特定層和位置操縱模型的表示。此干預過程會產生一些計算開銷,但可以實現更有效的適應。

3、動機

PEFT方法的主要動機是對參數有效適應的需求,減少了調優大型語言模型的計算成本和內存需求。另一方面,ReFT方法受到最近語言模型可解釋性研究的啟發,該研究表明,在這些模型學習的表示中編碼了豐富的語義信息。ReFT的目標是利用和利用這些編碼的知識來更有效地適應模型。

4.參數效率

PEFT和ReFT方法都是為了參數效率而設計的,但ReFT方法在實踐中證明了更高的參數效率。例如LoReFT(低秩線性子空間ReFT)方法通常需要訓練的參數比最先進的PEFT方法(LoRA)少10-50倍,同時在各種NLP基準測試中獲得具有競爭力或更好的性能。

5、可解釋性

雖然PEFT方法主要側重于有效的適應,但ReFT方法在可解釋性方面提供了額外的優勢。通過干預已知編碼特定語義信息的表示,ReFT方法可以深入了解語言模型如何處理和理解語言,從而可能導致更透明和值得信賴的人工智能系統。

ReFT架構

ReFT模型體系結構定義了干預的一般概念,這基本上意味著在模型向前傳遞期間對隱藏表示的修改。我們首先考慮一個基于transformer的語言模型,該模型生成標記序列的上下文化表示。

給定一個n個輸入令牌序列x = (x?,…,xn),模型首先將其嵌入到一個表示列表中,就h?,…,hn。然后m層連續計算第j個隱藏表示,每一個隱藏的表示都是一個向量h∈λ,其中d是表示的維數。

ReFT定義了一個干預的概念,它在模型向前傳遞期間修改隱藏的表示。

干預I是一個元組?Φ, P, L?,它封裝了由基于transformer的LM計算的表示的單個推理時間的干預動作,這個函數包含了三個參數:

干預函數Φ:用學習到的參數Φ (Φ)來表示。

干預所應用的一組輸入位置P≤{1,…,n}。

對層L∈{1,…,m}進行干預。

然后,干預的動作如下:

h??? ← (Φ(h_p???) if p ∈ P else h_p???)_{p∈1,…,n}

該干預在前向傳播計算完后立即進行,所以會影響到后續層中計算的表示。

為了提高計算的效率,也可以將干預的權重進行低秩分解,也就是得到了低秩線性子空間ReFT (LoReFT)。

在上面的公式中使用學習到的投影源Rs = Wh +b。LoReFT編輯R列的R維子空間中的表示,來或取從我們的線性投影Wh +b中獲得的值。

對于生成任務,ReFT論文使用語言建模的訓練目標,重點是在所有輸出位置上使用最小化交叉熵損失。

pyreft庫代碼示例

斯坦福大學的研究人員在發布論文的同時還發布了pyreft庫,這是一個建立在pyvene之上用于在任意PyTorch模型上執行和訓練激活干預的庫。

pyreft可以兼容HuggingFace上可用的任何預訓練語言模型,并且可以使用ReFT方法進行微調。以下是如何將lama- 27b模型的第19層輸出進行單一干預的代碼示例:

import torch
 import transformers
 from pyreft import (
     get_reft_model,
     ReftConfig,
     LoreftIntervention,
     ReftTrainerForCausalLM
 )
 # Loading HuggingFace model
 model_name_or_path = "yahma/llama-7b-hf"
 model = transformers.AutoModelForCausalLM.from_pretrained(
     model_name_or_path, torch_dtype=torch.bfloat16, device_map="cuda"
 )
 # Wrap the model with rank-1 constant reFT
 reft_config = ReftConfig(
     representations={
         "layer": 19,
         "component": "block_output",
         "intervention": LoreftIntervention(
             embed_dim=model.config.hidden_size, low_rank_dimension=1
        ),
    }
 )
 reft_model = get_reft_model(model, reft_config)
 reft_model.print_trainable_parameters()

剩下的代碼就和HuggingFace訓練模型沒有任何的區別了,我們來做一個完整的演示:

from pyreft import (
     ReftTrainerForCausalLM,
     make_last_position_supervised_data_module
 )
 tokenizer = transformers.AutoTokenizer.from_pretrained(
     model_name_or_path, model_max_length=2048, padding_side="right", use_fast=False)
 tokenizer.pad_token = tokenizer.unk_token
 
 # get training data to train our intervention to remember the following sequence
 memo_sequence = """
 Welcome to the Natural Language Processing Group at Stanford University!
 We are a passionate, inclusive group of students and faculty, postdocs
 and research engineers, who work together on algorithms that allow computers
 to process, generate, and understand human languages. Our interests are very
 broad, including basic scientific research on computational linguistics,
 machine learning, practical applications of human language technology,
 and interdisciplinary work in computational social science and cognitive
 science. We also develop a wide variety of educational materials
 on NLP and many tools for the community to use, including the Stanza
 toolkit which processes text in over 60 human languages.
 """
 data_module = make_last_position_supervised_data_module(
     tokenizer=tokenizer,
     model=model,
     inputs=["GO->"],
     outputs=[memo_sequence])
 
 # train
 training_args = transformers.TrainingArguments(
     num_train_epochs=1000.0,
     output_dir="./tmp",
     learning_rate=2e-3,
     logging_steps=50)
 trainer = ReftTrainerForCausalLM(
     model=reft_model, tokenizer=tokenizer,
     args=training_args, **data_module)
 _ = trainer.train()

一旦完成訓練,就可以檢查模型信息:

prompt = tokenizer("GO->", return_tensors="pt").to("cuda")
 base_unit_location = prompt["input_ids"].shape[-1] - 1  # last position
 _, reft_response = reft_model.generate(
     prompt, unit_locations={"sources->base": (None, [[[base_unit_location]]])},
     intervene_on_prompt=True, max_new_tokens=512, do_sample=False, 
     eos_token_id=tokenizer.eos_token_id, early_stopping=True
 )
 print(tokenizer.decode(reft_response[0], skip_special_tokens=True))

LoReFT的性能測試

最后我們來看看它在各種NLP基準測試中的卓越表現,以下是斯坦福大學的研究人員展示的數據。

LoReFT在8個具有挑戰性的數據集上獲得了最先進的性能,包括BoolQ、PIQA、SIQA、HellaSwag、WinoGrande、ARC-e、ARC-c和OBQA。盡管使用的參數比現有的PEFT方法少得多(少10-50倍),但LoReFT的性能還是大大超過了所有其他方法,展示了它有效捕獲和利用大型語言模型中編碼的常識性知識的能力。

雖然LoReFT在數學推理任務上沒有超過現有的PEFT方法,但它在AQuA、GSM8K、MAWPS和SVAMP等數據集上展示了具有競爭力的性能。研究人員指出LoReFT的性能隨著模型尺寸的增大而提高,這表明它的能力隨著語言模型的不斷增長而擴大。

圖片

在指令遵循領域,LoReFT取得了顯著的結果,在Alpaca-Eval v1.0基準測試上優于所有的微調方法,包括完全微調(這個要注重說明)。當在llama - 27b模型上訓練時,LoReFT的比GPT-3.5 Turbo模型的還要好1%,同時使用的參數比其他PEFT方法少得多。

LoReFT還展示了其在自然語言理解任務中的能力,當應用于RoBERTa-base和RoBERTa-large模型時,在GLUE基準測試中實現了與現有PEFT方法相當的性能。

當在參數數量上與之前最有效的PEFT方法相匹配時,LoReFT在各種任務中獲得了相似的分數,包括情感分析和自然語言推理。

總結

ReFT特別是LoReFT的成功,對自然語言處理的未來和大型語言模型的實際應用具有重要意義。ReFT的參數效率使其成為一種使大型語言模型適應特定的任務或領域,同時最大限度地減少計算資源和訓練時間的有效的解決方案。

并且ReFT還提供了一個獨特的視角來增強大型語言模型的可解釋性。在常識推理、算術推理和指令遵循等任務中的成功表明該方法的有效性。目前來看ReFT有望開啟新的可能性,克服傳統調優方法的局限性。

責任編輯:華軒 來源: DeepHub IMBA
相關推薦

2025-06-26 09:06:59

2023-06-07 08:22:59

LLM微調技術

2025-04-10 07:59:51

2024-05-07 08:00:00

自然語言處理機器學習

2025-01-14 10:56:14

2025-05-08 05:00:00

2024-01-18 15:38:17

語言模型大型語言模型

2023-10-07 10:41:54

語言模型微調BitFit

2024-09-09 07:46:16

2023-06-16 09:49:11

人工智能研究

2024-11-21 08:22:45

2025-11-03 09:12:00

AI模型論文

2023-06-09 08:00:00

QLoRa語言模型微調

2023-12-18 13:37:44

天翼云天池大語言模型

2023-12-26 12:07:14

模型訓練

2023-10-20 17:53:05

2024-12-30 00:01:00

多模態大模型Python

2024-11-04 14:42:12

2024-04-19 12:50:58

人工智能OpenAI
點贊
收藏

51CTO技術棧公眾號

日韩电影一区二区三区四区| 亚洲黄色录像| 亚洲综合色成人| 精品在线不卡| 91麻豆国产视频| 亚洲视频碰碰| 国产一区二区日韩精品欧美精品| 亚洲综合20p| 午夜激情在线播放| 亚洲欧美偷拍另类a∨色屁股| 国产精品精品软件视频| 中文字幕码精品视频网站| 欧美另类女人| 日韩在线视频一区| 黄色性生活一级片| 日韩一区二区三区高清在线观看| 在线视频国内自拍亚洲视频| 丰满人妻一区二区三区53号| 黄网在线观看| av男人天堂一区| 成人春色激情网| 欧美一级淫片免费视频黄| 欧美日本一区二区高清播放视频| 亚洲精品国产精品国自产观看浪潮 | 国产精品91在线| 九九在线观看视频| 国产精品97| 一区二区三区国产视频| 亚洲av成人精品一区二区三区| 久久婷婷五月综合色丁香| 亚洲成人在线网站| 成人午夜免费剧场| 免费网站成人| 亚洲国产精品精华液ab| 六月婷婷久久| 无码国产精品一区二区免费16| 精品一区二区久久| 国产欧美中文字幕| 久久精品99北条麻妃| 久久久久久婷| 欧美一二三视频| 日韩特黄一级片| 亚洲激情社区| 亚洲**2019国产| 日本天堂网在线观看| 欧美日韩日本国产亚洲在线 | 波多野结衣乳巨码无在线观看| 亚洲欧美综合网| 亚洲午夜在线观看| 日本在线免费| 一色桃子久久精品亚洲| 亚洲一区二区不卡视频| 免费黄色在线看| 中文字幕在线一区二区三区| 亚洲精品9999| jizzjizz在线观看| 亚洲欧美在线高清| 国产奶头好大揉着好爽视频| 91黄色在线| 夜夜嗨av一区二区三区网页| 美女av免费观看| 在线观看中文字幕的网站| 亚洲精品第1页| 9色porny| 擼擼色在线看观看免费| 欧美性色19p| 国产小视频精品| 日本午夜免费一区二区| 日韩视频在线你懂得| 国产精品久久久久野外| 久久91在线| 亚洲一品av免费观看| 五月天免费网站| 先锋资源久久| 久久久久女教师免费一区| 日韩av在线播放观看| 久久久久久久尹人综合网亚洲| 国产精品久久久久久av福利| 国产又大又粗又硬| 高清免费成人av| 欧美视频1区| 免费的黄网站在线观看| 亚洲午夜久久久久久久久久久 | 亚洲精品wwwww| 久久久视频6r| 欧美韩日精品| 欧美在线www| 国产精品久久久久久久免费| 成人av在线一区二区| 天堂一区二区三区| 欧美人动性xxxxz0oz| 欧美性高潮在线| 91免费视频污| 亚洲理论电影| 久久99热精品这里久久精品| 国产精品久久久久久久久久久久久久久久久| 巨乳诱惑日韩免费av| 51蜜桃传媒精品一区二区| 天堂资源最新在线| 亚洲欧美激情视频在线观看一区二区三区| 日本一区午夜艳熟免费| 国产成人精品一区二区三区免费| 日韩欧美aaaaaa| 极品久久久久久久| 亚洲激情专区| 51成人做爰www免费看网站| 国产一二在线观看| 婷婷综合五月天| www.污网站| 精品一区二区三| 国外视频精品毛片| 国产又黄又爽视频| 国产午夜亚洲精品理论片色戒 | 中文字幕电影av| 免费视频一区二区三区在线观看| 亚洲综合色av| av在线播放网站| 欧美日韩国产一区在线| 下面一进一出好爽视频| 久久电影院7| 国产99久久精品一区二区永久免费| 国产成人毛毛毛片| 最新国产成人在线观看| 中文字幕在线导航| 先锋影音国产精品| 9.1国产丝袜在线观看 | 国产亚洲精品成人av久久ww| 日本一级黄色大片| 国产69精品久久99不卡| 天天成人综合网| 九七影院97影院理论片久久| 亚洲日韩中文字幕在线播放| 成年人免费高清视频| 风间由美一区二区三区在线观看| 中文字幕欧美日韩一区二区三区| 3d欧美精品动漫xxxx无尽| 亚洲国产高清福利视频| 精品午夜福利视频| 高清国产一区二区| 国产女主播av| 亚洲综合网狠久久| 欧美激情视频三区| 亚洲精品一区二区口爆| 亚洲一区自拍偷拍| 欧美激情 亚洲| 亚洲福利国产| 久久久久久九九| 韩日毛片在线观看| 亚洲精品一区二区久| 在线观看黄网站| 久久婷婷综合激情| 日日碰狠狠丁香久燥| 精品视频亚洲| 国产日韩欧美视频| 1区2区在线观看| 精品国产麻豆免费人成网站| 日韩字幕在线观看| 久久亚洲精华国产精华液| 黄色国产精品视频| 日韩电影一区| 91精品国自产在线观看 | 国产xxx69麻豆国语对白| 免费动漫网站在线观看| 欧洲av在线精品| 三级黄色在线观看| 国产高清精品久久久久| 久久国产精品网| 亚洲激情播播| 成人福利视频在线观看| 五月花成人网| 日韩毛片在线看| 亚洲图片视频小说| 一区二区三区四区五区视频在线观看| 9191在线视频| 快she精品国产999| 在线看成人av电影| 国产伦理久久久久久妇女| 国产成人精品久久二区二区91 | 欧美一区,二区| 色噜噜偷拍精品综合在线| 亚洲a∨无码无在线观看| 国产高清不卡一区二区| 免费成人午夜视频| 日韩在线理论| 久久影院理伦片| 婷婷丁香久久| 欧美影院在线播放| a视频在线播放| 日韩精品中文字幕在线播放| 国产免费一区二区三区免费视频| 亚洲成a人片在线观看中文| 1024手机在线观看你懂的| 丁香五精品蜜臀久久久久99网站| 久久精品香蕉视频| 欧美大片一区| 亚洲第一在线综合在线| 成人av资源网址| 国产精品成人在线| gogo高清午夜人体在线| 中日韩美女免费视频网址在线观看 | 国产精品偷拍| 色偷偷91综合久久噜噜| 性插视频在线观看| 欧美一级欧美三级在线观看| 中文在线第一页| 亚洲午夜电影网| 精品一区二区在线观看视频| 99视频一区二区| 日韩欧美色视频| 免费人成精品欧美精品| 国产亚洲欧美在线视频| 欧美不卡一区| 中文字幕久精品免| 清纯唯美综合亚洲| 欧美精品一区二区三区久久| 91国内精品| 亚洲一区二区三区xxx视频| 国产精品字幕| 日本久久亚洲电影| 19禁羞羞电影院在线观看| 久久国产精品网站| 日本精品在线| 一本色道久久88综合日韩精品| 亚州精品国产精品乱码不99按摩| 日韩一级片在线观看| 91亚洲国产成人精品一区| 在线精品亚洲一区二区不卡| 国产精品人人人人| 亚洲成av人在线观看| 国产无遮挡裸体免费视频| 亚洲精品一二三四区| 5566中文字幕| 中文字幕中文字幕一区| 99国产精品免费| 中文字幕国产一区二区| 国产av自拍一区| 久久精品一区二区| 免费看污片的网站| 国产日产欧美一区| 69视频在线观看免费| 久久影院午夜论| 好吊视频在线观看| 国产日产欧美一区二区三区| 日韩精品无码一区二区三区久久久| 久久嫩草精品久久久精品一| 中文字幕一区二区三区人妻| 2021国产精品久久精品| 级毛片内射视频| 中文字幕不卡在线观看| 懂色av蜜臀av粉嫩av永久| 国产精品女同一区二区三区| 国产日产在线观看| 亚洲视频一二区| 国产亚洲精品久久久久久无几年桃 | 欧美一级免费在线观看| 欧美日本久久| 国产av国片精品| 久久不射网站| 欧美 日韩 国产 激情| 六月丁香综合在线视频| 激情成人在线观看| 国产成人午夜视频| 老熟妇精品一区二区三区| 91免费视频大全| 欧美色图17p| 亚洲一区在线观看免费观看电影高清 | 精品日韩免费| 在线观看欧美激情| 亚洲国产精品一区| 国产视频在线视频| 国产一区二区在线视频| 中文字幕天堂av| 久久久精品国产免费观看同学| 超碰人人人人人人人| 亚洲欧美日韩国产手机在线 | 蜜桃av一区二区| 波多野结衣电影免费观看| 99re热这里只有精品免费视频| 亚洲最大成人网站| 亚洲精品日日夜夜| 久久青青草原亚洲av无码麻豆| 欧美日韩精品一区二区三区四区| av在线资源观看| 亚洲另类图片色| 麻豆传媒视频在线观看免费| 久久久久国产一区二区三区| 精品成人av| 国产精品成人观看视频免费| 精品福利久久久| 日韩美女爱爱视频| 日本v片在线高清不卡在线观看| 成年人性生活视频| 国产亚洲精品bt天堂精选| 男女免费视频网站| 欧美午夜精品久久久久久孕妇| www.五月激情| 中文字幕日韩欧美在线视频| 俺来俺也去www色在线观看| 国产精品视频导航| 动漫av一区| 国产四区在线观看| 日韩成人av影视| 三叶草欧洲码在线| 亚洲午夜在线电影| 国产日韩精品suv| 国产亚洲欧美aaaa| 瑟瑟视频在线看| 成人女人免费毛片| 国产精品二区不卡| wwwxxx黄色片| 波多野结衣亚洲一区| 91香蕉视频在线播放| 在线观看av一区二区| 手机看片福利永久| 欧美福利视频网站| 中文成人激情娱乐网| 日韩av电影免费在线| 国产日韩亚洲| 五月天丁香社区| 亚洲另类在线制服丝袜| 一级黄色片在线| 中文字幕av一区二区三区谷原希美| 国产夫妻在线| 国产高清不卡av| 欧美激情aⅴ一区二区三区| 天天干天天草天天| 国产日韩在线不卡| 无码人妻av免费一区二区三区 | 少妇饥渴放荡91麻豆| 亚洲国产中文字幕| 精品国产九九九| 美乳少妇欧美精品| 精品精品视频| 五月天在线免费视频| 九色综合狠狠综合久久| 国内毛片毛片毛片毛片毛片| 欧美中文字幕久久| 91在线网址| 91久久久国产精品| 久久精品青草| 四虎国产精品免费| 一区二区三区精品在线| www.天堂av.com| 97精品视频在线播放| 秋霞蜜臀av久久电影网免费| 免费看国产曰批40分钟| 91视频com| 欧美亚洲另类小说| 中文字幕9999| 日本免费精品| 无码 制服 丝袜 国产 另类| 成人高清av在线| 亚洲成人第一网站| 在线精品国产成人综合| 香蕉久久久久久| 国产专区在线视频| caoporen国产精品视频| 中文字幕精品三级久久久| 亚洲午夜未删减在线观看 | 欧美日本一区二区三区| 黄色av电影在线播放| 97av影视网在线观看| 亚洲理论在线| 久久久久久久毛片| 777午夜精品视频在线播放| 亚洲国产精品精华素| 国内精品视频在线播放| 久久综合九色综合欧美狠狠| 欧美极品jizzhd欧美18| 欧美一区2区视频在线观看| 91高清视频在线观看| 欧美精品中文字幕一区二区| 久久精品国产色蜜蜜麻豆| 好吊色视频在线观看| 亚洲精品一区在线观看香蕉| 欧美美女福利视频| 亚洲一区二区三区av无码| 国产日韩欧美综合一区| 精品国产九九九| 国产成人精品在线播放| 欧美在线亚洲综合一区| 免费a在线观看播放| 欧美肥妇毛茸茸| 色在线中文字幕| 日日噜噜夜夜狠狠久久丁香五月| 成人av在线网| 国产又粗又猛又爽| 91精品国产99| 91精品一区二区三区综合在线爱| 91精品啪在线观看国产| 欧美三级日韩三级| 国产ktv在线视频| 亚洲欧洲日韩精品| av色综合久久天堂av综合| 国产精品久久777777换脸| 69av在线视频| 中文在线播放一区二区| 久久美女免费视频| 亚洲国产精品久久91精品| 日本亚洲欧洲无免费码在线|