精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Meta再放「長文本」殺器Llama 2-Long:70B尺寸登頂最強「32k上下文」模型,超越ChatGPT

人工智能 新聞
Llama 2-Long計算量需求比重新訓練降低40%,還不影響短任務性能!

雖然大型語言模型在處理日常問答、總結文本等任務上表現非常出色,但如何讓LLM在不顯著增加計算需求、不降低短文本性能的前提下,能夠處理「超長文本輸入」仍然是一個難題。

最近,Meta團隊公開了支持長上下文的模型Llama 2 Long的訓練方法,該模型的有效上下文窗口多達32768個token,在各種合成上下文探測、語言建模任務上都取得了顯著的性能提升。

論文鏈接:https://arxiv.org/pdf/2309.16039.pdf

并且,模型在指令調優的過程中不需要借助人工標注的長指令數據,70B參數量的模型就已經在各種長上下文任務中實現了超越gpt-3.5-turbo-16 k的性能。

除了結果外,論文中還對模型的各個組件進行了深入分析,包括Llama的位置編碼,并討論了其在建模長依賴關系的限制;預訓練過程中各種設計選擇的影響,包括數據混合和序列長度的訓練策略。

消融實驗表明,在預訓練數據集中具有豐富的長文本并不是實現強大性能的關鍵,驗證了長上下文持續預訓練比從頭開始長序列預訓練更有效,同樣有效。

LLAMA 2加長版

1、持續訓練(Continual Pretraining)

由于注意力機制需要進行二次復雜度的計算,如果使用更長的輸入序列進行訓練會導致巨大的計算開銷,研究人員通過實驗對比了不同的訓練策略:從頭開始進行長序列(32768)預訓練、以及在不同階段(20%、40%、80%)從4096長度切換到32768的持續學習。

結果發現,在輸入token數量長度相同的情況下,兩個模型的性能幾乎相同,但持續訓練最多可以減少40%的FLOPs

位置編碼(Positional Encoding)

在持續預訓練中,LLAMA 2的原始架構基本沒有變化,僅針對長距離信息捕獲需求對位置編碼進行了修改。

通過對7B尺寸LLAMA 2模型的實驗,研究人員發現了LLAMA 2的位置編碼(PE)的一個關鍵局限性,即阻礙了注意力模塊匯集遠處token的信息。

圖片

為了進行長上下文建模,研究人員假設該瓶頸來源于LLAMA 2系列模型使用的RoPE位置編碼,并控制超參數基礎頻率(base frequency)從10, 000增加到500, 000來減少RoPE位置編碼中每個維度的旋轉角度,從而降低了RoPE對遠處token的衰減效應。

圖片

從實驗結果來看,RoPE ABF在所有位置編碼變體中取得了最好的效果,證明了簡單修改RoPE即可有效提升模型的上下文長度。

并且,研究人員也選擇沒有選擇稀疏注意力,考慮到LLAMA 2-70B的模型維h為8192,只有當輸入序列長度超過6倍h(即49,152)個token時,注意力矩陣計算和值聚合的成本才會成為計算瓶頸。

數據混合(Data Mix)

在使用改良版位置編碼的基礎上,研究人員進一步探索了不同預訓練數據的組合,通過調整 LLAMA 2 的預訓練數據比例或添加新的長文本數據來提高長上下文能力。

圖片

實驗結果發現,在長上下文、持續預訓練的設置下,數據質量往往比文本長度發揮著更關鍵的作用。

優化細節

研究人員持續增加預訓練LLAMA 2檢查點的輸入序列長度,同時保持與LLAMA 2相同的每批token數量;

對所有模型進行了100,000步共計400B個token的訓練;

使用Flash-Attention,當增加序列長度時,GPU 內存開銷幾乎可以忽略不計,使用70B模型的序列長度從4,096增加到 16,384 時,可以觀察到大約17%的速度損失;

對于7B/13B模型,使用學習率2e^-5和余弦學習率調度,預熱步驟為 2000 步;

對于較大的34B/70B模型,必須設置較小的學習率1e^-5才能獲得單調遞減的驗證損失。

2、指令微調(Instruction Tuning)

為LLM對齊收集人工演示和偏好標簽是一個繁瑣而耗時耗力的過程,在長上下文場景下,往往會涉及到復雜的信息流和專業知識,例如處理密集的法律/科學文檔,標注成本還會更高,所以目前大多數開源指令數據集主要由短樣本組成。

在這項工作中,研究人員發現一種簡單且容易實現的方法,可以利用預先構建的大型多樣化短提示數據集,在長語境基準測試中效果也出奇地好。

具體來說,首先使用LLAMA 2-Chat中使用的RLHF數據集,并用LLAMA 2-Chat本身生成的自指導(self-instruct)長數據對其進行擴充,預期模型能夠通過大量RLHF數據學習到一系列不同的技能,并通過自指導數據將知識轉移到長上下文的場景中。

數據生成過程側重于QA格式的任務:從預訓練語料庫中的長文檔開始,隨機選擇一個文本塊,并提示LLAMA 2-Chat根據文本塊中的信息編寫問答對,通過不同的提示收集長短格式的答案。

除此之外,生成過程還包括自我批判(self-critque)步驟,即提示LLAMA 2-CHAT驗證模型生成的答案。

給定生成的 QA 對,使用原始長文檔(已截斷以適應模型的最大上下文長度)作為上下文來構建訓練實例。

對于短指令數據,將其連接為16,384個token序列;對于長指令數據,在右側添加填充token以便模型可以單獨處理每個長實例,而無需截斷。

雖然標準指令微調只計算輸出token的損失,但同時計算長輸入提示的語言建模損失也可以提升下游任務的性能。

實驗結果

1、預訓練評估

短任務

要使長上下文LLM具備普遍實用性,一個重要的要求是確保其在標準短上下文任務中的強大性能。

圖片

在短任務實驗中,可以看到其結果與LLAMA 2相當,而且在大多數情況下比LLAMA 2要更強,在編碼、數學和知識密集型任務(如 MMLU)上的結果有明顯改善,優于GPT-3.5

圖片

相比其他長上下文方法在短任務的不佳表現,研究人員將該模型的性能改進歸功于額外的計算FLOPs以及從新引入的長數據中學到的知識。

長任務

之前的方法大多依靠易錯性和合成任務來衡量模型在長上下文場景下的性能,與此不同,研究人員使用真實世界的語言任務來進行長上下文的評估:

在NarrativeQA上評估零樣本性能,在QuALITY和Qasper上評估2-shot性能,在QMSum上評估1-shot性能,具體的樣本數根據每個數據集的平均樣本長度決定。

使用的提示非常簡單「{Context} Q: {Question}, A:」,可以減少評估誤差;如果提示語超過模型的最大輸入長度或16,384個詞組,輸入提示語將從左側截斷。

圖片

對比其他開源長上下文模型,在 7B 尺度上,只有Together-7B  32k可以與該模型的性能相媲美。

有效利用上下文(Effective Context Utilization)

為了驗證該模型能夠有效利用增加的上下文窗口,從實驗中可以看到,隨著上下文長度的增加,每個長任務的結果都在單調地改善。

圖片

除此之外,模型的語言建模損失與上下文長度呈冪律加常數的比例關系,結果表明,盡管收益遞減,但該模型在 32,768 個文本token以內仍然顯示出性能增益(語言建模損失),更大的模型可以更有效地利用上下文。

圖片

2、指令微調結果

研究人員在ZeroSCROLLS基準上對指令微調模型進行測試,包含10個長上下文數據集,如摘要、問題回答和多文檔聚合任務。

為了進行公平比較,模型設置為相同的提示、截斷策略和最大生成長度等。

實驗結果顯示,在不使用任何人類標注的長上下文數據的情況下,70B的chat模型在10項任務中的7項都優于gpt-3.5-turbo-16k

如果使用更多不同的數據進行微調,研究人員預計其性能還會進一步提高。

值得一提的是,評估長上下文LLM是一項比較困難的任務,基準中使用的自動指標在很多方面都有局限性,例如只有單個參考的文本摘要,n-gram也不一定符合人類偏好。

3、人類評估

作為自動評估基準結果的補充,通過詢問標注人在有用性、誠實性和無害性等方面,更喜歡來自文中提出的指令微調模型,還是來自MPT-30B-chat、GPT-4、GPT-3.5-turbo-16k和Claude-2等專有模型的生成來進行人工評估。

與自動度量不同,人類更擅長評估長上下文模型的模型響應質量,因為可接受答案的空間很大。

研究人員主要關注兩個應用場景,評估模型利用信息(檢索到的文檔)來回答給定查詢的能力。

1)多回合對話數據,每個提示都是聊天歷史,模型需要基于聊天歷史生成一致的響應;

2)多文檔搜索查詢應答應用,該模型提供了從搜索會話中檢索到的幾個最相關的文檔以及相應的搜索查詢。

總共2352個樣本,其中每個樣本由3個不同的人類標注人員進行評估,模型相對于其他模型的標準勝率是通過平均每個比較示例的結果來計算的。

可以看到,Llama 2 Long只需要很少的指令數據就可以實現與MPT-30B-chat、GPT-3.5-turbo-16k和Claude-2相近的性能。

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-03-25 00:05:00

開源模型AI

2023-08-29 12:45:32

2025-01-14 12:22:06

2023-06-30 09:49:23

模型Meta

2023-06-28 18:10:27

羊駝家族大模型集體進化

2023-08-24 15:57:41

模型文檔檢索

2024-04-19 08:01:01

Llama 3 8BMeta

2025-04-07 09:35:00

Meta模型開源

2023-08-25 13:27:00

模型開源

2023-10-13 19:58:33

Mistral7B模型

2025-07-09 09:23:19

2024-06-05 08:33:29

2024-06-03 14:24:00

2025-01-08 09:30:00

Meta大模型訓練

2023-06-27 13:48:00

清華開源

2023-05-14 14:15:00

GPT-4AI

2025-06-03 00:00:09

AI長上下文推理 RL大模型

2023-11-22 16:51:53

2024-07-02 09:20:59

點贊
收藏

51CTO技術棧公眾號

亚洲日本国产精品| 91在线看视频| av成人app永久免费| 欧美性极品xxxx娇小| 日韩理论片在线观看| a在线观看视频| 亚洲女人av| 久久久91精品国产| 中国黄色a级片| 国内不卡的一区二区三区中文字幕 | 欧美俄罗斯乱妇| 受虐m奴xxx在线观看| 日韩三级久久| 欧美日韩你懂得| 欧美深夜福利视频| 国产在线高潮| 久久亚洲综合av| 成人免费看片网址| 中文字幕av在线免费观看| 亚洲手机在线| 久久久97精品| 91成人在线免费视频| 波多野结衣一区二区三区免费视频| 欧美视频三区在线播放| 日本a在线免费观看| 黄色成年人视频在线观看| 久久人人爽爽爽人久久久| 69堂成人精品视频免费| 五月天中文字幕| 夜夜精品视频| 欧美精品videosex极品1| 国产老头老太做爰视频| 波多野结衣一区| 日韩精品日韩在线观看| www.四虎在线| 日韩第一区第二区| 欧美日韩一区小说| 国产熟人av一二三区| 狠狠操一区二区三区| 一区二区三区成人| 亚洲成年人专区| 91在线不卡| 国产亚洲1区2区3区| 狼狼综合久久久久综合网| 丰满少妇高潮在线观看| 国产成人综合亚洲网站| 91亚洲精华国产精华| 在线免费看91| 美女一区二区视频| 国产精品久久久久久久app| 天天干天天操天天爱| 999在线观看精品免费不卡网站| 欧美成在线视频| 国产日韩欧美在线观看视频| 欧美日韩高清| 中文字幕在线亚洲| 欧美日韩色视频| 午夜日韩av| 欧美精品亚州精品| 久久精品国产亚洲av高清色欲| 你懂的国产精品| 欧美肥婆姓交大片| 国产精品自拍视频一区| 亚洲人成高清| 日本久久久久久久| 中国a一片一级一片| 美女视频黄 久久| 国产日韩欧美视频| aaa国产视频| 成人夜色视频网站在线观看| 久久久久久久久久久久久久久久av| 日本私人网站在线观看| 国产欧美精品一区二区色综合朱莉| 亚洲欧洲久久| 青春草视频在线观看| 精品久久久久久久大神国产| 青青在线视频免费| 成人在线日韩| 亚洲国产成人精品一区二区| 亚洲国产av一区| 忘忧草精品久久久久久久高清| 欧美黑人一区二区三区| 可以免费在线观看的av| 久久精品国产一区二区三区免费看| 91在线高清免费观看| 黄色小视频免费在线观看| xnxx国产精品| 在线视频91| 国产免费拔擦拔擦8x在线播放| 色999日韩国产欧美一区二区| 日韩av一卡二卡三卡| 国产欧美三级电影| 中文国产亚洲喷潮| 精品少妇一二三区| 日韩黄色免费电影| αv一区二区三区| 邻居大乳一区二区三区| 亚洲色图欧美激情| 亚洲精品无码久久久久久| 中文成人在线| 亚洲美女喷白浆| 欧美成人综合色| 日本视频中文字幕一区二区三区| 亚洲自拍偷拍色图| 精品欧美不卡一区二区在线观看| 亚洲欧美日本在线| 欧美aⅴ在线观看| 视频成人永久免费视频| 亚洲天堂2020| 亚洲综合一二三| 国模娜娜一区二区三区| 欧美日韩一区在线播放| 欧美激情成人动漫| 欧美日韩国产精选| 久久久久久国产精品无码| 欧美日本一区二区高清播放视频| 国产脚交av在线一区二区| 亚洲成人77777| 中国av一区二区三区| 两根大肉大捧一进一出好爽视频| 精品一区二区三区四区五区| 一区二区三区四区在线观看视频| 国产精品6666| 国产成人av在线影院| 亚洲欧洲久久| 福利视频亚洲| 国产一区二区黄| 日本中文在线播放| av不卡免费在线观看| 欧美一二三不卡| 亚洲天堂网站| 日韩视频亚洲视频| 中文字幕永久在线| 久久久99精品久久| 99精品视频在线看| 亚欧日韩另类中文欧美| 韩国三级电影久久久久久| www.看毛片| 一区二区三区精品视频| 制服.丝袜.亚洲.中文.综合懂| 国产精品久久久久一区二区三区厕所 | 日本成人精品视频| 人人狠狠综合久久亚洲| 日本欧美精品久久久| 2022成人影院| 亚洲无av在线中文字幕| 中文字幕亚洲乱码熟女1区2区| 99精品久久99久久久久| 国产二级片在线观看| 精品欧美午夜寂寞影院| 隔壁老王国产在线精品| 人妻精品一区二区三区| 欧美日韩黄色大片| 偷拍女澡堂一区二区三区| 国产一区二区高清| 麻豆一区区三区四区产品精品蜜桃| av资源新版天堂在线| 亚洲精品国产欧美| 亚洲图片在线视频| 国产色一区二区| 国产区二区三区| 国产精品久久久久无码av| 91在线观看免费高清完整版在线观看| 18网站在线观看| 亚洲福利视频免费观看| 免费看日批视频| 国产女同性恋一区二区| 午夜免费看毛片| 欧美激情一级片一区二区| 国产福利久久| 黄色综合网址| www.久久久久久.com| 亚洲高清视频网站| 欧美日韩国产在线看| 亚洲综合欧美综合| 国内精品免费**视频| 日本一本中文字幕| 国产91久久精品一区二区| 国产精品你懂得| 九色porny丨首页在线| 精品国产亚洲一区二区三区在线观看| 日韩成人免费在线视频| 国产欧美日韩另类视频免费观看| 8x8x成人免费视频| 最新成人av网站| 亚洲国产精品毛片| 97se亚洲国产一区二区三区| 日本久久久久久久久| 久草中文在线| 亚洲精品小视频| av中文字幕第一页| 欧美性xxxx极品hd欧美风情| 911国产在线| 99久久精品国产精品久久 | 国产黄人亚洲片| 丰满少妇被猛烈进入高清播放| 99国产**精品****| 久草热久草热线频97精品| 日韩欧美专区| 2021久久精品国产99国产精品| 欧美三级黄网| 亚洲毛片在线观看.| 国产aⅴ爽av久久久久成人| 欧美日韩一区二区在线| 综合五月激情网| 国产日韩亚洲欧美综合| av电影在线播放| 老鸭窝一区二区久久精品| 97国产在线播放| 欧美日韩国产一区精品一区| 亚洲高清视频一区| 最近国产精品视频| 官网99热精品| 国产精品欧美一区二区三区不卡| 国产精品爱久久久久久久| 成人免费图片免费观看| 久久成人精品视频| 97超碰人人在线| 亚洲深夜福利视频| 色网站免费观看| 日韩美女在线视频| 97人妻人人澡人人爽人人精品| 色综合天天综合| 中文字幕一区二区三区精品| 亚洲综合自拍偷拍| 精品国产视频在线观看| 国产精品理论在线观看| 国产美女免费网站| www激情久久| 懂色av粉嫩av蜜乳av| 成人免费av资源| 三大队在线观看| 国产高清一区日本| 亚洲精品在线网址| 国产一区二区0| 中文 日韩 欧美| 国产精品自在在线| 亚洲国产午夜精品| 国产一区欧美一区| 91丝袜超薄交口足| 国产真实乱对白精彩久久| 成人日韩在线视频| 久久99精品国产.久久久久久| 天堂一区在线观看| 九色综合国产一区二区三区| 手机免费av片| 国产精品一区三区| 少妇伦子伦精品无吗| 成人一二三区视频| 加勒比精品视频| 99久久伊人网影院| 中国黄色a级片| 日本一区二区三区四区| 亚洲色图100p| 一区二区视频在线| 日本一区二区免费在线观看| 调教+趴+乳夹+国产+精品| 国产精品999在线观看| 欧美日韩一区二区在线| 最近中文字幕在线观看| 在线成人免费观看| www.看毛片| 精品亚洲国产成av人片传媒 | 国产精品一区二区三区美女| 国产一区二区不卡视频在线观看| 先锋影音国产精品| 三区精品视频| 欧美三级不卡| 欧美aⅴ在线观看| 久久精品国产99| jjzz黄色片| 久久色.com| 青青操在线播放| 亚洲一区二区三区影院| 青青青国产在线 | 欧美综合在线视频观看| 影音先锋欧美在线| 一区在线视频| 午夜宅男在线视频| 国产成a人亚洲| 国产精品揄拍100视频| 国产精品夫妻自拍| 精品小视频在线观看| 色偷偷一区二区三区| 国产露脸91国语对白| 日韩激情第一页| 免费的黄网站在线观看| 欧美精品激情在线观看| 午夜无码国产理论在线| 444亚洲人体| 深夜福利久久| 久久在线中文字幕| 另类小说一区二区三区| 亚洲香蕉中文网| 亚洲欧洲美洲综合色网| 毛片基地在线观看| 日韩三级av在线播放| 久久久资源网| 久久久久久久久久久网站| 国产精品传媒麻豆hd| 久久精品国产精品国产精品污| 五月开心六月丁香综合色啪| 国产最新免费视频| 国产精品88888| 手机av在线不卡| 欧美性猛交xxxx黑人| 午夜精品久久久久久久99热黄桃| 中文字幕av一区中文字幕天堂| 国产美女高潮在线| 91中文字精品一区二区| 欧美电影一区| 亚洲精品一二三四五区| 95精品视频在线| 精品处破女学生| 欧美一区二区三区色| avtt亚洲| 国产精品18久久久久久麻辣| 国产成人精品福利| av影院在线播放| 狠狠狠色丁香婷婷综合激情| 欧美性受xxxx黑人| 日本韩国欧美三级| 欧洲综合视频| 69久久夜色精品国产7777| 日韩在线视频一区二区三区| 一区二区在线观| 蜜臀久久99精品久久久画质超高清| 短视频在线观看| 精品久久久久久久久久久久| 天堂网在线资源| 久久久久久综合网天天| 69精品国产久热在线观看| www.亚洲成人网| 国产成人av一区二区三区在线| 精品人妻伦九区久久aaa片| 欧美精品在欧美一区二区少妇| 精品电影在线| 国产aaa精品| 狠狠综合久久av一区二区蜜桃| 男人的天堂99| 国产欧美日韩麻豆91| 一级片在线免费播放| 国产一区二区三区在线观看视频 | 欧美视频一区在线观看| 精品资源在线看| 国产精品久久久久国产a级| 欧洲激情视频| 亚洲精品性视频| 亚洲欧美另类小说视频| 精品人妻一区二区三区蜜桃| 欧美日韩成人在线视频| 亚洲小说春色综合另类电影| 久青草视频在线播放| av欧美精品.com| 久久久久久在线观看| 最近2019中文字幕mv免费看 | 51精品久久久久久久蜜臀| 精品176二区| 丁香婷婷久久久综合精品国产| 亚洲福利精品| 亚洲熟妇一区二区三区| 欧美性色黄大片| 国精产品一区| 国产精选在线观看91| 亚洲欧美卡通另类91av| jizz18女人高潮| 日韩亚洲欧美中文三级| www在线观看黄色| 色一情一乱一伦一区二区三欧美| 麻豆免费精品视频| 欧美精品一级片| 日韩麻豆第一页| 欧美黑粗硬大| 91丨porny丨探花| 国产丝袜欧美中文另类| 国产美女永久免费| 97视频在线免费观看| 色琪琪久久se色| 亚洲日本久久久| 欧美性大战久久| 久久久久黄久久免费漫画| 日韩久久不卡| 成人中文字幕合集| 免费av中文字幕| 欧美黑人一区二区三区| 成人vr资源| 青青草视频网站| 欧美三级韩国三级日本三斤| 青春草视频在线| 亚洲毛片aa| 99国产精品一区| 91在线视频国产| 8x海外华人永久免费日韩内陆视频| 91视频一区| 女尊高h男高潮呻吟| 91精品在线麻豆| 最新中文字幕在线播放| 六月婷婷激情网| 日本一区二区三区在线观看| 蜜桃av中文字幕|