精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

LLM上下文窗口突破200萬!無需架構變化+復雜微調,輕松擴展8倍

發布于 2024-4-29 13:12
瀏覽
0收藏

大型語言模型(LLM)往往會追求更長的「上下文窗口」,但由于微調成本高、長文本稀缺以及新token位置引入的災難值(catastrophic values)等問題,目前模型的上下文窗口大多不超過128k個token


最近,Microsoft Research的研究人員提出了一個新模型LongRoPE,首次將預訓練 LLM 的上下文窗口擴展到了2048k個token,在256k的訓練長度下只需要1000個微調步驟即可,同時還能保持原始短上下文窗口的性能。


LLM上下文窗口突破200萬!無需架構變化+復雜微調,輕松擴展8倍-AI.x社區

論文鏈接:??https://arxiv.org/abs/2402.13753??

代碼鏈接:https: //github.com/microsoft/LongRoPE


LongRoPE主要包含了三個關鍵創新點:


1. 通過高效搜索識別并利用了位置插值中的兩種非均勻性,為微調提供了更好的初始化,并在非微調情況下實現了 8 倍擴展;


2. 引入了漸進擴展策略,首先微調 256k 長度的 LLM,然后在微調擴展的LLM上進行第二次位置插值,以實現 2048k 上下文窗口;


3. 在8k長度上重新調整 LongRoPE以恢復短上下文窗口性能。


在 LLaMA2 和 Mistral 上對各種任務進行的大量實驗證明了該方法的有效性。

通過 LongRoPE 擴展的模型保留了原始架構,只對位置嵌入稍作修改,并且可以重復使用大部分已有的優化。

位置插值的不均勻性

Transformer模型需要明確的位置信息,通常以位置嵌入(position embedding)的形式來表示輸入token的順序。


本文中的位置嵌入表示方法主要來自于RoPE, 對于位置索引為 n 的標記,其相應的 RoPE 編碼可簡化如下:


LLM上下文窗口突破200萬!無需架構變化+復雜微調,輕松擴展8倍-AI.x社區


其中,d 是嵌入維度,nθi 是標記在位置 n 上的旋轉角度,θi = θ -2i/d 表示旋轉頻率。在 RoPE 中,θ 的默認基準值為 10000。


受 NTK 和 YaRN 的啟發,研究人員注意到這兩個模型可以從非線性嵌入中獲得性能提升,特別是在考慮 RoPE 各維度的不同頻率以進行專門的內插法和外推法時。


然而,當前的非線性在很大程度上依賴于人為設計的規則。


這也自然引出了兩個問題:


1. 當前的位置插值是否是最佳的?

2. 是否存在尚未探索的非線性?


LLM上下文窗口突破200萬!無需架構變化+復雜微調,輕松擴展8倍-AI.x社區


為了回答這些問題,研究人員使用進化搜索(evolution search)為LLaMA2-7B發現更好的非均勻位置插值。搜索以易錯性為指導,使用來自PG19驗證集的5個隨機樣本。


通過實證分析,研究人員總結了幾個主要發現。


發現1:RoPE維度表現出很大的不均勻性,目前的位置插值方法無法有效處理這些不均勻性;


在公式 2 中為每個 RoPE 維度搜索最佳 λ。


LLM上下文窗口突破200萬!無需架構變化+復雜微調,輕松擴展8倍-AI.x社區


研究人員對比了PG19和Proof-pile測試集上使用不同方法的 LLaMA2-7B 在不進行微調的情況下的復雜度。


LLM上下文窗口突破200萬!無需架構變化+復雜微調,輕松擴展8倍-AI.x社區


從結果來看,搜索到的解決方案有明顯改善,表明當前的線性(PI,positional interpolation)和非均勻(Dynamic-NTK 和 YaRN)插值方法都不是最佳的。


值得注意的是,YaRN 在 PG19 上的表現不如 PI 和 NTK,因為其達不到非微調 LLM 的目標上下文窗口長度。


例如,在 8k 上下文大小的情況下,YaRN 的困惑度在 7k 后達到峰值。


通過搜索,公式 2 中的重標度(rescaled)因子λ變得不均勻,與PI、NTK的公式計算和YaRN的分組計算中的固定標度s有所不同。


在8k和16k上下文窗口中,這些非均勻因子大大提高了LLaMA2的語言建模性能(即復雜度),而無需進行微調,主要是因為由此產生的位置嵌入有效地保留了原始的RoPE,尤其是關鍵維度,從而降低了LLM區分近似token位置的難度。


發現2:輸入序列中初始詞塊的RoPE推斷應減少插值;


對于輸入序列中的初始n個token,假設RoPE應該做較少的插值,這是因為會獲得較大的注意力分數,從而對注意力層至關重要,正如在Streaming LLM和 LM-Infinite 中觀察到的那樣。


為了驗證這一點,研究人員使用PI和NTK將上下文窗口擴展到 8k 和 16k,保留前 n(0,2, ..., 256)個token,不進行插值。當n=0 時,則恢復到原來的 PI 和 NTK


LLM上下文窗口突破200萬!無需架構變化+復雜微調,輕松擴展8倍-AI.x社區


上表中可以觀察到兩個結果:


1. 保留起始token而不進行位置插值確實能提高性能。

2. 最佳起始token數n取決于目標擴展長度。


發現3:在微調和非微調設置中,非均勻位置插值都能有效擴展 LLM 上下文窗口。


雖然已經證明,在不進行微調的情況下,搜索到的非均勻位置插值能顯著提高8k和16k擴展性能,但更長的擴展需要微調。


因此使用搜索到的RoPE對LLaMA2-7B的64k上下文窗口大小進行了微調。


LLM上下文窗口突破200萬!無需架構變化+復雜微調,輕松擴展8倍-AI.x社區


從結果中可以看到,在微調LLaMA2-7B之前和之后,該方法都明顯優于PI和YaRN,主要原因是有效地使用了非均勻位置插值、最小化信息損失,以及為微調提供了更好的初始化。


受上述發現的啟發,研究人員提出了LongRoPE,首先引入了一種高效的搜索算法,以充分利用這兩種不均勻性,并將LLM上下文窗口擴展到 200 萬個token


LLM上下文窗口突破200萬!無需架構變化+復雜微調,輕松擴展8倍-AI.x社區


具體形式化算法參見原文。


實驗結果

研究人員將LongRoPE應用于LLaMA2-7B和Mistral-7B模型上,并從三個方面對其性能進行了評估:


1. 長文檔中擴展上下文 LLM 的困惑度;


2. 密鑰(passkey)檢索任務,該任務衡量模型從大量無關文本中檢索簡單密鑰的能力;


3. 4096上下文窗口的標準LLM基準;


在256k范圍內進行長序列語言建模


在Proof-pile和PG19上通過不同插值方法擴展的 LLaMA2 和 Mistral 的困惑度。


從實驗結果中可以得出兩個關鍵的結論:


1. 從 4k 到 256k 的評估長度來看,擴展模型展現出整體困惑度下降的趨勢,表明模型有能力利用更長的上下文;


2. 即使在上下文窗口長度為 16 倍的情況下(這通常是在較短上下文長度下保持性能所面臨的挑戰),我們的 LongRoPE-2048k 模型在 256k 上下文長度內的性能仍優于最先進的基線模型。


LLM上下文窗口突破200萬!無需架構變化+復雜微調,輕松擴展8倍-AI.x社區


LLM上下文窗口突破200萬!無需架構變化+復雜微調,輕松擴展8倍-AI.x社區

超過2000k的長序列語言建模


為了評估超長文檔的有效性,研究人員使用了Books3數據集。


為了評估效率,隨機選擇20本書,每本長度超過2048k個token,并使用256k的滑動窗口。


LLM上下文窗口突破200萬!無需架構變化+復雜微調,輕松擴展8倍-AI.x社區


從結果中可以看出,LongRoPE成功地將LLaMA2-7B和Mistral-7B的上下文窗口擴展到2048k,同時還在8k-128k的較短長度內實現了與基線相當或更好的困惑度。


還可以觀察到2048k LLaMA2和Mistral之間的顯著性能差異:Mistral在較短的長度上優于基線,但困惑度在超過256k長度時達到7


LLaMA2的性能與預期一致:隨著時間的延長,困惑感會有所減少,在1024k和2048k時略有增加。


此外,在LLaMA2上,LongRoPE-2048k在256k比128k的微調長度下表現更好,主要是由于次級延伸比(secondary extension ratio)更小(即8倍對16倍)。


相比之下,Mistral在微調128k的窗口大小方面表現更好,主要原因是對于Mistral的128k和256k微調,研究人員遵循YaRN的設置使用16k訓練長度,影響了Mistral在微調后進一步擴展上下文窗口的能力。


本文轉自新智元 ,作者:新智元


原文鏈接:??https://mp.weixin.qq.com/s/8V4yGzXBsFfGwCZ4VJDE1g??

標簽
收藏
回復
舉報
回復
相關推薦
三级在线观看| 免费在线视频一区二区| 97精品国产99久久久久久免费| 国产欧美一区二区精品性色| 成人免费在线网址| 国产一级片免费| 自拍自偷一区二区三区| 欧美三级视频在线| 精品人妻大屁股白浆无码| 色视频免费在线观看| 麻豆成人免费电影| 欧美高跟鞋交xxxxhd| 日本一区二区三区网站| av在线国产精品| 婷婷成人综合网| 永久久久久久| 无码国精品一区二区免费蜜桃| 日韩vs国产vs欧美| 久久久久中文字幕2018| 欧美另类z0zx974| 一区视频网站| 欧美午夜精品一区二区三区| 大伊香蕉精品视频在线| 国产98在线| 不卡的av在线| 成人免费福利在线| 69xxxx国产| 一区在线播放| 蜜臀久久99精品久久久久久宅男| 蜜桃av免费看| 久久精品亚洲成在人线av网址| 欧美日本在线播放| 成年人网站大全| 成入视频在线观看| 亚洲嫩草精品久久| 亚洲欧洲免费无码| 全部免费毛片在线播放网站| 国产综合色视频| 国产精品久久久久久一区二区| 国产成人在线观看网站| 国语精品一区| 久久天天躁狠狠躁夜夜av| www久久久久久久| 夜夜春成人影院| 亚洲国产欧美在线成人app| 午夜影院免费版| 国产日韩在线观看视频| 欧美情侣在线播放| 国产一伦一伦一伦| 欧美aaaaaaaa| 色婷婷久久久综合中文字幕 | 国产刺激高潮av| 国产在线精品一区二区| 成人字幕网zmw| 一道本无吗一区| 九九九久久久精品| 成人网在线视频| 国产精品高潮呻吟AV无码| 久久伊人亚洲| 国产精品草莓在线免费观看| 亚洲 欧美 日韩 在线| 小嫩嫩精品导航| 欧美在线性视频| 日韩熟女一区二区| 日韩精品福利网| 国产精品丝袜久久久久久高清| 免费黄色小视频在线观看| 三级不卡在线观看| 国产精品免费视频久久久| 亚洲视频中文字幕在线观看| 精品制服美女久久| 99久久99| 天堂中文资源在线| 久久综合久久鬼色中文字| 日本免费高清不卡| 男人在线资源站| 亚洲欧洲综合另类| 久久成人福利视频| 三级成人在线| 欧美日韩中字一区| 国产精品19p| 精品国产导航| 中文字幕国产日韩| 超碰手机在线观看| 国产美女精品| 国产精品中文字幕在线观看| 99这里有精品视频| 99re这里只有精品6| 日韩久久久久久久久久久久久| av在线首页| 一区二区三区精品在线| 毛片在线播放视频| 国产一区高清| 亚洲成色777777在线观看影院| 日韩精品无码一区二区三区久久久| 欧美一级精品| 欧美国产乱视频| 日本免费在线观看视频| 美美哒免费高清在线观看视频一区二区 | 手机在线观看国产精品| 手机在线免费看av| 在线观看免费视频综合| 中文字幕1区2区| 成人vr资源| 91爱视频在线| 国产欧美一级片| 国产婷婷精品av在线| 亚洲精品天堂成人片av在线播放| 成人美女视频| 日韩精品一区二区三区在线 | 99九九热只有国产精品| 欧美中在线观看| 亚洲高清视频网站| 国产精品成人一区二区艾草| 欧美女人性生活视频| 久久国产精品美女| 中文字幕一精品亚洲无线一区 | 国产高清自产拍av在线| 欧美日韩中文国产| 亚洲av网址在线| 97视频热人人精品免费| 日韩女在线观看| 国产高潮流白浆喷水视频| 久久日韩粉嫩一区二区三区| 人人妻人人澡人人爽精品欧美一区| 电影在线观看一区| 在线观看av一区二区| 亚洲av成人片色在线观看高潮| 色综合狠狠操| 欧美最猛性xxxxx亚洲精品| 国产伦精品一区二区三区视频痴汉 | 少妇高潮喷水久久久久久久久久| 亚洲一区二区三区久久久| 亚洲国产欧美日韩精品| 懂色av懂色av粉嫩av| 强制捆绑调教一区二区| 狠狠爱一区二区三区| 九七久久人人| 欧洲生活片亚洲生活在线观看| 成年网站免费在线观看| 91欧美在线| 日本久久亚洲电影| 色婷婷av一区二区三区之红樱桃| 亚洲精品第1页| 在线观看免费的av| 日日狠狠久久偷偷综合色| 国内精久久久久久久久久人| 99久久久久久久| 国产精品家庭影院| 在线观看av日韩| 国产成人久久| 97**国产露脸精品国产| 亚洲区小说区图片区| 亚洲午夜精品在线| 中文字幕1区2区| 欧美~级网站不卡| 7777奇米亚洲综合久久| av网站在线播放| 欧亚洲嫩模精品一区三区| 爱爱的免费视频| 久久精品一区二区三区中文字幕| 美女一区视频| 男人皇宫亚洲男人2020| 亚洲精品自在久久| 手机在线看片1024| 中文字幕一区二区三| 天天综合网日韩| 成人一区而且| 国产日本欧美一区二区三区| 在线观看完整版免费| 欧美一区二区高清| 欧美日韩免费一区二区| 成人一区二区视频| 每日在线观看av| 天美av一区二区三区久久| 韩国三级日本三级少妇99| 日韩私人影院| 在线免费亚洲电影| а天堂中文在线资源| 久99久精品视频免费观看| 在线无限看免费粉色视频| 亚洲超碰在线观看| 国模精品视频一区二区| 日韩av高清在线| 欧美亚洲图片小说| 国产精品综合激情| 美女视频黄 久久| www.亚洲视频.com| 国产欧美日韩精品一区二区免费 | 激情综合网av| 日本大片免费看| 美女呻吟一区| 国产成人在线视频| 国产激情在线视频| 亚洲第一页在线| 国产精品午夜一区二区| 中文字幕欧美区| 四虎永久免费观看| 视频一区二区不卡| 久久久久久久免费视频| 粉嫩久久久久久久极品| 国外视频精品毛片| 欧美私人网站| 亚洲国产精品免费| 国产日韩久久久| 一区二区免费在线| 一区二区精品免费| 成人小视频在线| 国产在线青青草| 久久麻豆精品| 国产伦精品一区二区三区免费视频 | 久久先锋资源网| 日本黄色一级网站| 久久精品五月| 欧洲精品在线播放| 禁断一区二区三区在线| 成人永久免费| av成人在线观看| 久久久之久亚州精品露出| 国产综合在线观看| 欧美一区二区在线观看| 无码人妻丰满熟妇区bbbbxxxx| 亚洲天堂精品在线观看| 成人免费av片| 国产精品99久久久久久久vr| 国产成a人亚洲精v品在线观看| 色综合久久网| 免费亚洲精品视频| 亚洲网址在线观看| 国产精品自拍视频| 天堂√中文最新版在线| 韩剧1988免费观看全集| 制服丝袜在线播放| 亚洲欧美日韩中文视频| 欧日韩在线视频| 欧美亚洲综合色| 波多野结衣日韩| 性做久久久久久免费观看欧美| 香蕉成人在线视频| 久久久久久99精品| 精品人妻一区二区免费| 国产麻豆91精品| 亚洲天堂国产视频| 秋霞午夜av一区二区三区| 成人毛片视频网站| 99热在线精品观看| 轻点好疼好大好爽视频| 午夜精品视频一区二区三区在线看| 日韩欧美精品在线不卡| 天堂综合网久久| 岛国视频一区| 99re8这里有精品热视频8在线| 成人在线精品视频| 欧美成人家庭影院| 国产精品美女在线| 久久青草免费| 成人国产精品久久久| 中文字幕视频在线播放| 一区二区在线观看免费| 蜜桃传媒一区二区亚洲| 国产精品理论片| 97超碰人人爱| 99精品视频在线观看播放| 免费观看成人高| 成人高清电影网站| 国内精品小视频在线观看| 丝袜中文在线| 欧美尺度大的性做爰视频| 中文在线观看免费| 666欧美在线视频| 天天爱天天做天天爽| 国产一区欧美日韩| 日韩在线激情视频| 天天操天天干天天爱| 精品国产区一区| 特级西西人体高清大胆| 久久嫩草精品久久久久| 极品尤物一区二区| 鲁大师成人一区二区三区| 欧美大黑帍在线播放| 欧美国产高潮xxxx1819| 欧美高清在线视频观看不卡| av免费不卡国产观看| 欧美日韩电影在线观看| 最近中文字幕在线观看视频| 黑人巨大精品欧美一区二区| 丰满岳乱妇一区二区| 精品系列免费在线观看| 日本成人黄色免费看| 日本少妇精品亚洲第一区| 亚洲福利影片在线| 538精品在线视频| 亚洲一区二区毛片| 欧美肥臀大乳一区二区免费视频| aaa人片在线| 国产原创一区二区三区| 亚洲一级片免费观看| 久久影院100000精品| 色播久久人人爽人人爽人人片视av| 国产一级做a爱免费视频| 成人看片黄a免费看在线| 日本少妇色视频| 国产欧美日韩另类视频免费观看| 精品国产精品国产精品| 国产精品三级在线观看| 国产情侣在线视频| 欧美福利电影网| 亚洲色图欧美视频| 日韩国产高清视频在线| 色视频在线观看免费| 久久视频在线看| 樱花草涩涩www在线播放| 国产日韩换脸av一区在线观看| 成人黄色理论片| 久久亚洲综合网| 欧美日韩三级| 亚洲综合20p| 久久一区二区三区国产精品| 久久久久久久麻豆| 一本久道中文字幕精品亚洲嫩| 亚洲精品第五页| 中文字幕欧美精品在线| 欧亚在线中文字幕免费| 亚洲va久久久噜噜噜| 热久久天天拍国产| a在线视频观看| 国产精品资源站在线| 国产精品毛片一区二区| 精品久久久久久久中文字幕| 国产尤物在线观看| 亚洲欧美日韩直播| 午夜伦理在线视频| 亚洲www在线| 成人三级视频| 欧美a在线视频| 国产另类ts人妖一区二区| 亚洲视频重口味| 欧美亚洲自拍偷拍| 欧美成人片在线| 国产成人在线一区| 神马久久av| 久久成人福利视频| 国产高清成人在线| 久久久久久久久久久久久久久久久| 欧美三级韩国三级日本一级| 日韩资源在线| 久久久之久亚州精品露出| 国产成人一二片| 日韩成人三级视频| 国产麻豆日韩欧美久久| www.色小姐com| 欧美一区二区三区视频在线| 97超碰人人在线| 国产精品高清网站| 日韩电影免费网站| 美女黄色片视频| 国产日产亚洲精品系列| 日韩不卡视频在线| 亚洲日韩中文字幕| 国产超碰精品| 欧美一区二区三区四区在线观看地址| 羞羞答答国产精品www一本| bl动漫在线观看| 精品成人在线视频| 熟妇人妻av无码一区二区三区| 国产91|九色| 国产精品密蕾丝视频下载| 人妻有码中文字幕| 久久无码av三级| 成人一二三四区| 中文字幕国产亚洲| 亚洲高清影院| 日本丰满少妇xxxx| 91色综合久久久久婷婷| 天天操天天操天天操天天| 日日摸夜夜添一区| 国产午夜久久av| 日韩一区二区高清视频| 高清国产一区二区| 伊人中文字幕在线观看 | 青青草观看免费视频在线 | 欧美日韩亚洲免费| 青青草原综合久久大伊人精品优势| 国产1区2区在线观看| 日韩视频一区二区三区| 国产精品蜜臀| 欧美日韩国产精品一区二区| 国产欧美69| 国产成人av免费在线观看| 欧美精品一区二区蜜臀亚洲| 欧美极品videos大乳护士| 尤物国产精品| 丁香六月综合激情| 极品国产91在线网站| 九九视频这里只有精品| 日韩欧美中文字幕电影| 不卡的av中文字幕| 亚洲一区二区三区四区不卡| 国产精品影院在线| 97se国产在线视频|