精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

直接擴(kuò)展到無限長,谷歌Infini-Transformer終結(jié)上下文長度之爭 精華

發(fā)布于 2024-4-15 08:51
瀏覽
0收藏

谷歌又放大招了,發(fā)布下一代 Transformer 模型 Infini-Transformer。


Infini-Transformer 引入了一種有效的方法,可以將基于 Transformer 的大型語言模型 (LLM) 擴(kuò)展到無限長輸入,而不增加內(nèi)存和計算需求。使用該技術(shù),研究者成功將一個 1B 的模型上下文長度提高到 100 萬;應(yīng)用到 8B 模型上,模型能處理 500K 的書籍摘要任務(wù)。


自 2017 年開創(chuàng)性研究論文《Attention is All You Need》問世以來,Transformer 架構(gòu)就一直主導(dǎo)著生成式人工智能領(lǐng)域。而谷歌對 Transformer 的優(yōu)化設(shè)計最近比較頻繁,幾天前,他們更新了 Transformer 架構(gòu),發(fā)布 Mixture-of-Depths(MoD),改變了以往 Transformer 計算模式。沒過幾天,谷歌又放出了這項新研究。


專注 AI 領(lǐng)域的研究者都了解內(nèi)存的重要性,它是智能的基石,可以為 LLM 提供高效的計算。然而,Transformer 和基于 Transformer 的 LLM 由于注意力機(jī)制的固有特性,即 Transformer 中的注意力機(jī)制在內(nèi)存占用和計算時間上都表現(xiàn)出二次復(fù)雜性。例如,對于批大小為 512、上下文長度為 2048 的 500B 模型,注意力鍵 - 值 (KV) 狀態(tài)的內(nèi)存占用為 3TB。但事實上,標(biāo)準(zhǔn) Transformer 架構(gòu)有時需要將 LLM 擴(kuò)展到更長的序列(如 100 萬 token),這就帶來巨大的內(nèi)存開銷,并且隨著上下文長度的增加,部署成本也在增加。


基于此,谷歌引入了一種有效的方法,其關(guān)鍵組成部分是一種稱為 Infini-attention(無限注意力)的新注意力技術(shù)。不同于傳統(tǒng)的 Transformer 使用局部注意力丟棄舊片段,為新片段釋放內(nèi)存空間。Infini-attention 增加了壓縮內(nèi)存(compressive memory),可以將使用后的舊片段存儲到壓縮內(nèi)存中,輸出時會聚合當(dāng)前上下文信息以及壓縮內(nèi)存中的信息,因而模型可以檢索完整的上下文歷史。


該方法使 Transformer LLM 在有限內(nèi)存的情況下擴(kuò)展到無限長上下文,并以流的方式處理極長的輸入進(jìn)行計算。


實驗表明,該方法在長上下文語言建?;鶞?zhǔn)測試中的性能優(yōu)于基線,同時內(nèi)存參數(shù)減少了 100 倍以上。當(dāng)使用 100K 序列長度進(jìn)行訓(xùn)練時,該模型實現(xiàn)了更好的困惑度。此外該研究發(fā)現(xiàn),1B 模型在 5K 序列長度的密鑰實例上進(jìn)行了微調(diào),解決了 1M 長度的問題。最后,論文展示了具有 Infini-attention 的 8B 模型經(jīng)過持續(xù)的預(yù)訓(xùn)練和任務(wù)微調(diào),在 500K 長度的書籍摘要任務(wù)上達(dá)到了新的 SOTA 結(jié)果。


本文貢獻(xiàn)總結(jié)如下:


  • 引入了一種實用且強大的注意力機(jī)制 Infini-attention—— 具有長期壓縮內(nèi)存和局部因果注意力,可用于有效地建模長期和短期上下文依賴關(guān)系;
  • Infini-attention 對標(biāo)準(zhǔn)縮放點積注意力( standard scaled dot-product attention)進(jìn)行了最小的改變,并通過設(shè)計支持即插即用的持續(xù)預(yù)訓(xùn)練和長上下文自適應(yīng);
  • 該方法使 Transformer LLM 能夠通過流的方式處理極長的輸入,在有限的內(nèi)存和計算資源下擴(kuò)展到無限長的上下文。


直接擴(kuò)展到無限長,谷歌Infini-Transformer終結(jié)上下文長度之爭-AI.x社區(qū)


  • 論文鏈接:https://arxiv.org/pdf/2404.07143.pdf
  • 論文標(biāo)題:Leave No Context Behind: Efficient Infinite Context Transformers with Infini-attention?


方法介紹


Infini-attention 使 Transformer LLM 能夠通過有限的內(nèi)存占用和計算有效地處理無限長的輸入。如下圖 1 所示,Infini-attention 將壓縮記憶融入到普通的注意力機(jī)制中,并在單個 Transformer 塊中構(gòu)建了掩碼局部注意力和長期線性注意力機(jī)制。

直接擴(kuò)展到無限長,谷歌Infini-Transformer終結(jié)上下文長度之爭-AI.x社區(qū)

對 Transformer 注意力層進(jìn)行這種微妙但關(guān)鍵的修改可以通過持續(xù)的預(yù)訓(xùn)練和微調(diào)將現(xiàn)有 LLM 的上下文窗口擴(kuò)展到無限長。


Infini-attention 采用標(biāo)準(zhǔn)注意力計算的所有鍵、值和查詢狀態(tài),以進(jìn)行長期記憶鞏固(memory consolidation)和檢索,并將注意力的舊 KV 狀態(tài)存儲在壓縮內(nèi)存中,而不是像標(biāo)準(zhǔn)注意力機(jī)制那樣丟棄它們。在處理后續(xù)序列時,Infini-attention 使用注意查詢狀態(tài)從內(nèi)存中檢索值。為了計算最終的上下文輸出,Infini-attention 聚合了長期記憶檢索值和局部注意力上下文。


如下圖 2 所示,研究團(tuán)隊比較了基于 Infini-attention 的 Infini-Transformer 和 Transformer-XL。與 Transformer-XL 類似,Infini-Transformer 對 segment 序列進(jìn)行操作,并計算每個 segment 中的標(biāo)準(zhǔn)因果點積注意力上下文。因此,點積注意力計算在某種意義上是局部的。


直接擴(kuò)展到無限長,谷歌Infini-Transformer終結(jié)上下文長度之爭-AI.x社區(qū)


然而,局部注意力在處理下一個 segment 時會丟棄前一個 segment 的注意力狀態(tài),但 Infini-Transformer 復(fù)用舊的 KV 注意力狀態(tài),以通過壓縮存儲來維護(hù)整個上下文歷史。因此,Infini-Transformer 的每個注意力層都具有全局壓縮狀態(tài)和局部細(xì)粒度狀態(tài)。


與多頭注意力(MHA)類似,除了點積注意力之外,Infini-attention 還為每個注意力層維護(hù) H 個并行壓縮內(nèi)存(H 是注意力頭的數(shù)量)。


直接擴(kuò)展到無限長,谷歌Infini-Transformer終結(jié)上下文長度之爭-AI.x社區(qū)

下表 1 列出了幾種模型根據(jù)模型參數(shù)和輸入 segment 長度,定義的上下文內(nèi)存占用和有效上下文長度。Infini-Transformer 支持具有有限內(nèi)存占用的無限上下文窗口。


直接擴(kuò)展到無限長,谷歌Infini-Transformer終結(jié)上下文長度之爭-AI.x社區(qū)


實驗


該研究在長上下文語言建模、長度為 1M 的密鑰上下文塊檢索和 500K 長度的書籍摘要任務(wù)上評估了 Infini-Transformer 模型,這些任務(wù)具有極長的輸入序列。對于語言建模,研究者選擇從頭開始訓(xùn)練模型,而對于密鑰和書籍摘要任務(wù),研究者采用不斷預(yù)訓(xùn)練 LLM 的方式,以證明 Infini-attention 即插即用的長上下文適應(yīng)能力。


長上下文語言建模。表 2 結(jié)果表明 Infini-Transformer 優(yōu)于 Transformer-XL 和 Memorizing Transformers 基線,并且與 Memorizing Transformer 模型相比,存儲參數(shù)減少了 114 倍。


直接擴(kuò)展到無限長,谷歌Infini-Transformer終結(jié)上下文長度之爭-AI.x社區(qū)


密鑰任務(wù)。表 3 為 Infini-Transformer 在 5K 長度輸入上進(jìn)行微調(diào)后,解決了高達(dá) 1M 上下文長度的密鑰任務(wù)。實驗中輸入 token 的范圍從 32K 到 1M,對于每個測試子集,研究者控制密鑰的位置,使其位于輸入序列的開頭、中間或結(jié)尾附近。實驗報告了零樣本準(zhǔn)確率和微調(diào)準(zhǔn)確率。在對 5K 長度輸入進(jìn)行 400 個步驟的微調(diào)后,Infini-Transformer 解決了高達(dá) 1M 上下文長度的任務(wù)。


直接擴(kuò)展到無限長,谷歌Infini-Transformer終結(jié)上下文長度之爭-AI.x社區(qū)

摘要任務(wù)。表 4 將 Infini-Transformer 與專門為摘要任務(wù)構(gòu)建的編碼器 - 解碼器模型進(jìn)行了比較。結(jié)果表明 Infini-Transformer 超越了之前最佳結(jié)果,并且通過處理書中的整個文本在 BookSum 上實現(xiàn)了新的 SOTA。 

直接擴(kuò)展到無限長,谷歌Infini-Transformer終結(jié)上下文長度之爭-AI.x社區(qū)

研究者還在圖 4 中繪制了 BookSum 數(shù)據(jù)驗證分割的總體 Rouge 分?jǐn)?shù)。根據(jù)折線趨勢表明,隨著輸入長度的增加,Infini-Transformers 提高了摘要性能指標(biāo)。

直接擴(kuò)展到無限長,谷歌Infini-Transformer終結(jié)上下文長度之爭-AI.x社區(qū)


本文轉(zhuǎn)自 機(jī)器之心 ,作者:機(jī)器之心


原文鏈接:??https://mp.weixin.qq.com/s/4cOsPWWDLSMpnQcbUc8Wxg??

收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦
午夜视频网站在线观看| 欧美性猛交xx| 午夜伦全在线观看| 国产一区二区免费视频| 欧美极品少妇xxxxⅹ喷水| 欧美久久久久久久久久久| 中文字幕在线直播| 日韩电影大全网站| 激情成人午夜视频| 国产黄色一区二区| 欧美黄色精品| 亚洲欧美国产日韩天堂区| 国产福利精品一区二区三区| 福利在线免费视频| 国产精品毛片久久久久久| 99理论电影网| 国产精品无码一区| 亚洲美女黄色| 精品久久久av| 国产精品密蕾丝袜| 99ri日韩精品视频| 欧美日韩卡一卡二| 内射国产内射夫妻免费频道| 黄色视屏免费在线观看| 久久天天做天天爱综合色| 99久热re在线精品996热视频| а中文在线天堂| 99riav1国产精品视频| 久久在线观看视频| 国产精品www爽爽爽| 久久资源综合| 精品国产乱子伦一区| 国内国产精品天干天干| 午夜欧美巨大性欧美巨大 | 日本精品视频一区二区| 亚洲色欲久久久综合网东京热| av在线收看| 久久品道一品道久久精品| 国产精品国产精品国产专区不卡| 国产三级精品在线观看| 蜜桃传媒麻豆第一区在线观看| 欧美亚洲国产另类| 国产成人在线免费观看视频| 欧美精品一卡| 欧美大尺度激情区在线播放 | 日韩久久视频| 亚洲网在线观看| www.色天使| 欧美一级全黄| 亚洲精品丝袜日韩| 中文在线一区二区三区| av成人资源网| 精品国产乱码久久久久久图片 | 欧美久久在线观看| 日本三级在线观看网站| 亚洲男同1069视频| 妞干网这里只有精品| 黄色片网站在线| 亚洲天堂福利av| www.黄色网址.com| 午夜小视频福利在线观看| 尤物在线观看一区| 久久久天堂国产精品| 2021国产在线| 亚洲一区二区三区视频在线| 欧美男女爱爱视频| 亚洲精品中文字幕| 欧美在线免费观看视频| 中文字幕第88页| 国产激情综合| 亚洲精品在线免费播放| 亚洲精品女人久久久| 欧美猛男做受videos| 色七七影院综合| 全网免费在线播放视频入口| 国内视频精品| 欧美专区中文字幕| 在线免费一级片| 国产精品一级二级三级| 国产伦理久久久| 久久久久国产精品嫩草影院| 国产精品久久久久久久久快鸭 | 丝袜亚洲精品中文字幕一区| 国产精品视频1区| 国产偷人妻精品一区二区在线| 国产成人av影院| 久久亚洲国产精品日日av夜夜| 国产一二在线观看| 亚洲精品欧美激情| 毛片在线视频播放| 国产激情久久| 精品国产一区二区三区av性色| 亚洲综合自拍网| av一区二区高清| 欧美肥婆姓交大片| 中文字幕在线观看视频免费| 国内精品视频666| 精品高清视频| 麻豆视频免费在线观看| 性感美女久久精品| 美女在线视频一区二区| 久久影院资源站| 久久久精品网站| 在线天堂中文字幕| 国产一区激情在线| 久中文字幕一区| 成年视频在线观看| 91国产丝袜在线播放| 国产一精品一aⅴ一免费| 精品72久久久久中文字幕| 免费不卡在线观看av| 午夜精品一区二| 大美女一区二区三区| 亚洲天堂电影网| 中文字幕色婷婷在线视频| 日韩你懂的在线观看| 国产传媒在线看| 亚洲在线播放| 国产精品美女久久久久av福利| av资源种子在线观看| 黑人精品xxx一区一二区| 亚洲精品乱码久久久久久9色| 精品国产一级毛片| 97在线免费观看视频| www.国产三级| 亚洲男人都懂的| 国产精品久久久毛片| 亚州国产精品| 97精品在线视频| 成人av无码一区二区三区| 国产精品不卡一区二区三区| www黄色在线| 亚洲8888| 国内外成人免费激情在线视频| av老司机久久| 1024精品合集| 国产三级生活片| 国产一区二区三区四区大秀| 日本成人免费在线| 天堂a中文在线| 一区二区三区在线免费播放| 亚洲精品成人在线播放| 91亚洲人成网污www| 国产精品视频色| 中文字幕在线视频区| 欧美性猛片aaaaaaa做受| 一色道久久88加勒比一| 日韩av一区二区在线影视| 欧美日韩一区在线观看视频| 激情国产在线| 日韩精品视频三区| www.com国产| 久久久另类综合| 亚洲精品中文字幕无码蜜桃| 国产成人3p视频免费观看| 国产成人精品视频在线观看| 国产在线视频福利| 欧美日韩一区不卡| 国产精品精品软件男同| 欧美一级在线免费观看| 欧美xxxx做受欧美护士| 精品国产乱码久久久久久蜜臀| 久久婷婷国产麻豆91| 老司机免费视频一区二区 | 噜噜噜在线观看播放视频| 懂色av中文一区二区三区天美| 在线免费观看污视频| 国产免费成人| 亚欧洲精品在线视频免费观看| 午夜欧美巨大性欧美巨大 | 久久99精品久久久久久久久久| av在线资源| 精品呦交小u女在线| 黄色av网站免费| 国产精品麻豆久久久| 亚洲欧美一区二区三区不卡| 狠狠88综合久久久久综合网| 国严精品久久久久久亚洲影视| 中文在线资源| 最近更新的2019中文字幕| 在线观看国产黄| 亚洲人成小说网站色在线| 成年女人免费视频| 丝袜亚洲另类欧美| 成年人黄色在线观看| www.国产精品一区| 国产mv免费观看入口亚洲| yw193.com尤物在线| 欧美美女一区二区在线观看| 久久精品国产av一区二区三区| 91视视频在线观看入口直接观看www| 中文久久久久久| 欧美日本一区| 欧美一区免费视频| 国产精品一区二区三区av| 欧美国产视频日韩| 国产区视频在线| 欧美变态口味重另类| 蜜臀尤物一区二区三区直播| 一区二区三区在线影院| 成人精品999| 国产成人福利片| 日本熟妇人妻中出| 精品成人国产| 在线亚洲美日韩| 亚洲人挤奶视频| 91啪国产在线| 欧美三级精品| 性色av一区二区三区| 日韩免费网站| 亚洲男人天堂2024| www.亚洲欧美| 欧美精品亚洲一区二区在线播放| 91美女免费看| 亚洲午夜一区二区| 国产黄色录像片| 久久亚洲捆绑美女| 91传媒理伦片在线观看| 精品亚洲aⅴ乱码一区二区三区| 日韩免费一级视频| 樱桃成人精品视频在线播放| 中文字幕久久综合| 日韩三区视频| 国产伦精品一区二区三毛| 亚洲午夜国产成人| 国产精品美女免费看| 一区二区电影免费观看| 久久久视频在线| 五月婷婷视频在线观看| 精品国产一区二区三区久久久| 精品美女视频在线观看免费软件| 亚洲激情久久久| 亚洲男人天堂久久| 日韩欧美一卡二卡| 国产免费视频一区二区三区| 欧美午夜影院一区| 欧美一级做a爰片免费视频| 天天影视色香欲综合网老头| 黄网站免费在线| 亚洲一区二区美女| 久久久久无码精品国产| 一区二区三区自拍| 欧美色图一区二区| 亚洲激情综合网| 麻豆亚洲av成人无码久久精品| 亚洲啪啪综合av一区二区三区| 国产wwwwxxxx| 综合激情成人伊人| 亚洲人与黑人屁股眼交| 一色桃子久久精品亚洲| 九九热视频在线免费观看| 最新高清无码专区| 黑鬼狂亚洲人videos| 亚洲婷婷在线视频| 久久久一区二区三区四区| 亚洲综合区在线| 日韩激情在线播放| 疯狂做受xxxx欧美肥白少妇| 欧美 日韩 精品| 日本黄色一区二区| 一区二区视频网站| 91精品国产综合久久久蜜臀粉嫩| 国产女18毛片多18精品| 欧美草草影院在线视频| 日韩一级片免费看| 国产丝袜一区二区三区免费视频 | 久久亚洲私人国产精品va| 超碰最新在线| 97国产在线视频| 婷婷激情一区| 91亚洲国产成人久久精品网站 | 日韩欧美精品一区二区三区经典| 成人免费看片39| 国产三级中文字幕| 在线成人h网| 丁香婷婷激情网| 国产精品99久久久久久久vr| 国产精品扒开腿做爽爽爽a片唱戏| ww亚洲ww在线观看国产| 国产极品视频在线观看| 一个色综合网站| 亚洲国产av一区二区三区| 欧美精品vⅰdeose4hd| 成人乱码一区二区三区| 亚洲人成欧美中文字幕| 国产精品久久麻豆| 国内伊人久久久久久网站视频| 性欧美freehd18| 丁香婷婷久久久综合精品国产| 免费av一区| www.激情网| 日韩黄色在线观看| 无套白嫩进入乌克兰美女| 久久久精品天堂| 精品无码久久久久| 欧美日韩精品电影| 色丁香婷婷综合久久| 精品国内自产拍在线观看| 一区二区精品伦理...| 7777奇米亚洲综合久久| 精品国产中文字幕第一页| 中文精品无码中文字幕无码专区| 日韩精品一卡二卡三卡四卡无卡| 国产又粗又猛又爽又黄| 欧美高清在线一区| 欧美日韩乱国产| 欧美一级片在线看| porn亚洲| 日本伊人精品一区二区三区介绍| 亚洲2区在线| 一区二区av| 日韩精品一二区| 国产精品探花一区二区在线观看| 亚洲女与黑人做爰| 在线观看毛片视频| 亚洲区中文字幕| 国产资源在线观看入口av| 亚洲最大av网站| 欧美激情偷拍自拍| 无码日韩人妻精品久久蜜桃| 不卡av免费在线观看| 日本一级二级视频| 欧美美女一区二区三区| 最近高清中文在线字幕在线观看| 热久久这里只有| 嫩草国产精品入口| 免费在线看黄色片| 国产精品一区在线| 秋霞欧美一区二区三区视频免费 | 国产欧美一区二区三区视频在线观看| 亚洲免费精彩视频| 欧美久久天堂| 国产视色精品亚洲一区二区| 韩日精品视频| 四虎国产精品永久免费观看视频| 成人免费在线播放视频| 中文在线资源天堂| 亚洲人成绝费网站色www| 欧美magnet| 日本电影一区二区三区| 美女久久一区| 能免费看av的网站| 日本韩国一区二区三区| 成人精品一区二区三区免费 | 香港久久久电影| 国产激情在线看| 国产91精品久久久久久久网曝门| 日韩a级片在线观看 | 日本不卡视频一区| 午夜精品一区在线观看| 亚洲日本香蕉视频| 欧美怡红院视频一区二区三区| 农村少妇一区二区三区四区五区| 日本人体一区二区| 91香蕉视频mp4| 黄色污污视频软件| 色阁综合伊人av| 国产精品亚洲欧美一级在线| avav在线播放| 99精品热视频| 波多野结衣日韩| 久久黄色av网站| 中文字幕一区二区三区中文字幕 | 亚洲福利在线看| 一个人看的www视频在线免费观看| 欧美激情导航| 久久精品国产99国产| 在线免费观看亚洲视频| 精品久久一区二区| 亚洲精品日产| 亚洲一一在线| 国产91对白在线观看九色| 久草视频在线观| 中文综合在线观看| 视频一区视频二区欧美| 欧美 日韩 国产一区| 国产精品欧美久久久久无广告| 精品国产99久久久久久宅男i| 久久久久一本一区二区青青蜜月| 你微笑时很美电视剧整集高清不卡| 性猛交ⅹ×××乱大交| 一区二区三区加勒比av| 欧美挠脚心网站| 亚洲a中文字幕| 性欧美videos另类喷潮| 国产男女猛烈无遮挡在线喷水| 亚洲福利视频久久| julia一区二区三区中文字幕| 日韩中文在线字幕| 久久先锋资源网| 国产日韩免费视频| 日本91av在线播放| 综合久久婷婷| 91精品人妻一区二区三区| 欧美一级一区二区| 91精品国产66| 黄色网页免费在线观看| 亚洲三级电影网站| 国产精品一区在线看| 国产伦精品一区二区三区高清|