精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Bert重大創新,RAG突破512長度限制

發布于 2024-12-31 13:03
瀏覽
0收藏

當前RAG的檢索、召回模塊,受到了傳統BERT模型只支持512長度的極大限制。導致文檔切分后的chunksize,極大影響RAG的性能。

本文介紹的ModernBERT,在BERT的基礎上進行了重大改進,以提高下游任務的性能和效率,尤其是在更長序列長度上的表現。

ModernBERT在2萬億個token上進行訓練,原生支持8192序列長度,展現了在多樣化分類任務和單向、多向檢索任務上的卓越性能。

ModernBERT解決的問題 

  • 問題1:傳統Bert序列長度512的限制

ModernBERT通過增加序列長度到8192個token,顯著提高了模型處理長文本的能力。

  • 問題2:傳統BERT注意力機制效率低下

為了提高模型的運行速度和內存效率,ModernBERT引入了一系列現代模型優化技術,包括交替的全局和局部注意力機制、無填充(unpadding)策略以及Flash Attention技術。

  • 問題3:傳統Bert架構陳舊

ModernBERT采用了最新的模型架構改進,例如GeGLU激活函數、RoPE位置編碼和預標準化(pre-normalization)技術

突破性能的關鍵技術 

  • 在相同的參數數量下,具有更多窄層的模型(深而窄)與具有較少寬層的模型(淺而寬)具有不同的學習模式。
  • 深而窄的語言模型比其較淺的對應模型具有更好的下游性能,但代價是推理速度較慢。
  • 為了獲得更好的下游性能,ModernBERT設計的目標是盡可能深而窄。
  • ModernBERT的基礎模型和大型模型分別具有22層和28層,參數總數分別為1.49億和3.95億,在后續性能和硬件效率之間取得了平衡。
  • ModernBERT基礎模型的隱藏層大小為768,GLU擴展為2304;大型模型的隱藏層大小為1024a,GLU擴展為5248。 這些比例允許跨張量核心的最佳平鋪。

transformer架構的改進

  1. GeGLU激活函數:替代原有的GeLU激活函數,提供更好的非線性表達能力。
  2. RoPE位置編碼:使用旋轉位置編碼(RoPE)代替絕對位置編碼,以提高模型對序列順序的理解能力。
  3. 預標準化(pre-normalization):在每個Transfaormer塊中使用預標準化技術,有助于穩定訓練過程。
  • 在嵌入層之后添加了一個層歸一化。 為避免重復,去除了第一個注意力層中的第一個層歸一化。
  1. 交替注意力機制:在模型中交替使用全局和局部注意力,以平衡計算效率和性能。
  • 全局注意力:序列中的每個token都關注其他每個token
  • 局部注意力:token僅關注一個小滑動窗口內的token。
  • 在ModernBERT中,每三層使用RoPE theta為160,000的全局注意力,其余層使用具有128個token、RoPE theta為10,000的局部滑動窗口注意力。

模型訓練的改進

  1. 在2萬億個token上進行訓練,數據來源包括網頁文檔、代碼和科學文獻。模型采用了現代的BPE分詞器,并設置了50,368的詞匯量,以優化GPU利用率。
  2. 訓練采用了Masked Language Modeling(MLM),并去除了Next-Sentence Prediction(NSP)目標,因為后者并未帶來性能上的提升。
  3. 模型使用了StableAdamW優化器,并采用了改進的梯形學習率計劃
  4. 采用去除填充策略,去除填充token,減少計算資源的浪費
  • encoder-only語言模型通常使用填充符元來確保批次中統一的序列長度,從而浪費在語義上為空的符元上的計算資源。
  • 去除填充通過移除填充token、將小批量中的所有序列連接成單個序列并將其作為單個批次進行處理來避免這種低效。
  • 之前的去除填充實現會在不同的模型層內部去除填充并重新填充序列,從而浪費計算資源和內存帶寬。
  • 使用Flash Attention的可變長度注意力和RoPE實現,允許在單個未填充序列上使用不規則的注意力掩碼和RoPE應用。
  • ModernBERT在嵌入層之前去除輸入的填充,并可以選擇性地重新填充模型輸出,這使得其性能比其他去除填充方法提高了10%到20%。
  1. 使用Flash Attention技術,提高了注意力計算的內存和計算效率。
  • ModernBERT結合使用Flash Attention 3進行全局注意力層
  • 使用Flash Attention 2進行局部注意力
  1. 利用PyTorch的torch.compile編譯功能,提高了訓練的吞吐量10%。
  2. 通過增加全局注意力層的RoPE theta值,將原生上下文長度512擴展到8192個token,并在額外的3000億個token上進行訓練,以優化長文本處理能力。

訓練參數的配置 

  • MLM:

a.使用30%的掩碼率,原始的15%掩碼率再次被證明是次優的

  • StableAdamW優化器:

a.StableAdamW的學習率裁剪在下游任務中優于標準梯度裁剪,并導致更穩定的訓練。

  • 梯形學習率 (LR) :

a.在預訓練期間,我們使用改進的梯形學習率 (LR) schedule,也稱為預熱-穩定-衰減 (WSD)。

b.在短暫的LR預熱之后,梯形schedule在大部分訓練中保持LR不變,然后進行短暫的LR衰減。

c.此schedule已被證明可以匹配余弦schedule的性能。

d.并且可以對任何檢查點進行持續訓練而不會出現冷啟動問題。

e.使用1-sqrt的LR衰減,要優于線性衰減和余弦衰減

f.ModernBERT-base 以8e-4的恒定LR訓練了1.7萬億個token,預熱了30億個token

g.預熱20億個token后,以5e-4的LR訓練了ModernBERT-large,訓練了9000億個符元。

h.在large的損失在5e-4下保持穩定了幾百億個token后,將學習率回滾到5e-5,并重新訓練剩余的8000億個token。

  • 批量大小調度:

a.批量大小調度從較小的梯度累積批量開始,隨著時間的推移逐漸增加到完整的批量大小,能加快訓練進度

b.ModernBERT-base和-large的批量大小分別在500億個token內從768增加到4608,在100億個token內從448增加到4928,采用不均勻的token調度,以便每個批量大小具有相同數量的更新步驟。

  • 權重初始化和平鋪:

a.使用中心平鋪和Gopher層縮放,直接從ModernBERT-base的預訓練權重初始化ModernBERT-large

b.由于Base的權重矩陣小于Large的權重矩陣,對Base的權重進行了中心化處理,考慮了每個token嵌入和注意力頭,然后使用環繞填充其余權重。

  • 上下文長度擴展:

a.以1024個序列長度和10,000的RoPE theta對1.7萬億個token進行訓練后,通過將全局注意力層的RoPE theta增加到160,000并將額外訓練3000億個token來擴展ModernBERT的原生上下文長度到8192個token。

b.首先,以3e-4的恒定較低學習率對8192個token的原始預訓練數據集混合體進行2500億個token的訓練

c.接下來,對更高質量的來源進行上采樣,并在500億個token上進行具有1-sqrt學習率調度的衰減階段。

??https://github.com/AnswerDotAI/ModernBERT??

??https://arxiv.org/pdf/2412.13663??

本文轉載自??CourseAI??,作者: CourseAI 

已于2024-12-31 14:27:13修改
收藏
回復
舉報
回復
相關推薦
www.欧美精品一二区| 亚洲精彩视频| 欧美少妇xxx| a级网站在线观看| 黄色av免费观看| 亚洲永久免费| 久久久精品久久久| 91黄色免费视频| 欧美一级做一级爱a做片性| 夜夜夜精品看看| 日本在线观看一区| 国产视频手机在线观看| 国产亚洲在线观看| 色哟哟亚洲精品一区二区| 欧美久久久久久久久久久| 欧美日韩精品一区二区三区视频| 一区二区三区毛片| 亚洲国产欧美一区二区三区不卡| 亚洲av无码国产精品久久不卡| 狂野欧美性猛交xxxx巴西| 久久99青青精品免费观看| 欧美另类z0zx974| 成人台湾亚洲精品一区二区 | 91啦中文在线观看| 亚洲一区亚洲二区亚洲三区| 久久久久亚洲视频| 日韩一级大片| 欧美激情第三页| 日韩在线一卡二卡| 精品国产精品| 亚洲精品资源美女情侣酒店 | 一区二区三区在线免费看| 欧美曰成人黄网| 日韩免费一级视频| 高清电影在线观看免费| 亚洲欧洲国产日本综合| 天堂va久久久噜噜噜久久va| 男人天堂综合| 99久久精品费精品国产一区二区| 999视频在线观看| 国产精品色综合| 美女免费视频一区| 国产精品成人播放| 国语对白做受69按摩| 久久久久网站| 国产成人精品在线| 毛片在线免费视频| 日韩一级精品| 97色在线播放视频| 日韩欧美一级视频| 一区二区国产精品| 性色av一区二区三区免费 | 色女孩综合影院| 欧美日韩在线视频一区二区三区| 超碰资源在线| 激情成人中文字幕| 日日摸日日碰夜夜爽无码| heyzo在线欧美播放| 香蕉久久一区二区不卡无毒影院| 男人添女人下部视频免费| 日本在线视频www鲁啊鲁| 一区二区成人在线| 日韩网站在线免费观看| 激情视频网站在线播放色| 无码av免费一区二区三区试看| 加勒比成人在线| 特黄毛片在线观看| 欧美综合一区二区| 99九九精品视频| 91精品国产自产精品男人的天堂| 欧美精品一区在线观看| 北岛玲一区二区| 国产成人高清| 精品激情国产视频| 久青草视频在线观看| 国产欧美一区二区色老头 | 亚洲无码精品在线播放| 国产在线不卡一区| 国产一区二区三区无遮挡 | 精品资源在线| 亚洲午夜av久久乱码| 国产精品18在线| 一区二区日韩欧美| 91国偷自产一区二区三区的观看方式| 色屁屁影院www国产高清麻豆| 日韩成人dvd| 91一区二区三区| 日韩亚洲视频在线观看| 国产精品久久久久久久久免费相片| 超碰在线免费观看97| 国产中文在线播放| 欧美日韩午夜在线视频| 亚洲精品鲁一鲁一区二区三区| 日韩在线你懂的| www国产精品视频| 精品少妇theporn| 青青草国产成人99久久| 翡翠波斯猫1977年美国| 玖玖综合伊人| 一区二区三区日本| 亚洲人成无码www久久久| 国产精品99久久免费| 精品夜色国产国偷在线| 在线看的片片片免费| 雨宫琴音一区二区在线| 国产主播喷水一区二区| 手机福利小视频在线播放| 亚洲色图20p| 37pao成人国产永久免费视频| 国产高清亚洲| 中文字幕免费精品一区高清| 日韩成人免费在线观看| 激情av综合网| 日本免费高清一区二区| heyzo高清中文字幕在线| 欧美男女性生活在线直播观看| 国产免费一区二区三区最新6| 日韩一区自拍| 国产成人短视频| 人妻无码中文字幕| 亚洲精品国产精华液| www.com操| 精品中文字幕一区二区三区av| 欧美精品videosex性欧美| 91肉色超薄丝袜脚交一区二区| 久久精品人人爽人人爽| 少妇无码av无码专区在线观看| 日韩中文在线| 久久亚洲综合国产精品99麻豆精品福利| 国产一级淫片a视频免费观看| 国产99久久久国产精品潘金网站| 成年人免费观看的视频| 91成人抖音| 亚洲欧美第一页| 亚洲免费激情视频| 97精品视频在线观看自产线路二| 18视频在线观看娇喘| 亚洲狼人综合| www.亚洲免费视频| 国产又粗又猛又爽又黄的视频一| 国产欧美日韩视频在线观看| 成人在线免费播放视频| 亚洲婷婷伊人| 日韩av免费在线播放| 青青草av免费在线观看| 高潮白浆女日韩av免费看| 亚洲av无码一区二区三区网址| 亚洲激情二区| 久久精品久久精品国产大片| 国产激情在线播放| 国产丝袜一区二区三区| 日韩电影在线观看一区二区| 国产日韩av一区| 久久人人爽av| 综合久久综合| 国产一区二区无遮挡| 女人高潮被爽到呻吟在线观看| 日韩成人免费视频| 无码人妻精品一区二| 国产精品嫩草99a| 中文字幕线观看| 亚洲欧美一级二级三级| 国产精品久久国产三级国电话系列| 6699嫩草久久久精品影院| 日韩电影大全免费观看2023年上| 四虎成人在线观看| 中文字幕国产一区| 国产精品探花在线播放| 亚洲视频一区| 九色91国产| 久久久成人av毛片免费观看| 日韩视频在线免费观看| av无码精品一区二区三区宅噜噜| 亚洲综合成人网| 日韩av一二区| 美女视频免费一区| 国产免费一区二区视频| 蜜臀久久99精品久久一区二区| 国产精品免费电影| 人人超在线公开视频| 亚洲美女激情视频| 国产精品国产三级国产普通话对白| 亚洲午夜电影在线观看| 男人的天堂av网| 国产91丝袜在线18| 日本爱爱免费视频| 欧美精品91| 欧美日韩另类丝袜其他| 中文成人激情娱乐网| 性欧美亚洲xxxx乳在线观看| 瑟瑟视频在线| 日韩成人性视频| 国产农村妇女毛片精品久久| 五月综合激情婷婷六月色窝| 91社区视频在线观看| 国产.欧美.日韩| 男人的天堂日韩| 国产精品av一区二区| 日本一区二区三不卡| 91综合久久爱com| 国产精品网站视频| 超碰在线cao| 久久伊人精品天天| 黑人与亚洲人色ⅹvideos| 欧美v亚洲v综合ⅴ国产v| 久久精品国产亚洲av麻豆蜜芽| 亚洲国产一二三| 美女福利视频网| 久久综合视频网| 五月天婷婷在线观看视频| 丝袜美腿亚洲色图| 东北少妇不带套对白| 午夜精品一区二区三区国产| 欧美日韩一区二区视频在线观看| 午夜免费欧美电影| 国产精品啪视频| 老司机2019福利精品视频导航| 欧美丰满片xxx777| 麻豆影视国产在线观看| 伊人亚洲福利一区二区三区| 日韩三级电影网| 精品福利av导航| 国产草草影院ccyycom| 欧美唯美清纯偷拍| 亚洲国产av一区二区三区| 亚洲成av人片在www色猫咪| 亚洲一级生活片| 国产精品久久久久影院亚瑟| 制服 丝袜 综合 日韩 欧美| 91香蕉国产在线观看软件| 中文字幕人妻一区| 国产成人精品综合在线观看 | avtt综合网| 91在线直播亚洲| 另类一区二区| 国产精品久久久久91| 色豆豆成人网| 国产成人精品综合久久久| 亚洲欧洲高清| 欧洲成人性视频| 亚洲国产成人二区| 欧美一级黑人aaaaaaa做受| 美女扒开腿让男人桶爽久久软| 欧美激情一级二级| 韩国精品一区| 欧美在线一区二区视频| 日韩电影免费看| 日韩av成人在线| 厕沟全景美女厕沟精品| 国产aⅴ夜夜欢一区二区三区 | 欧美日韩在线看| 日韩久久中文字幕| 欧美性色19p| 成人h动漫精品一区二区下载 | 一区二区三区免费播放| 蜜桃免费网站一区二区三区| 中文字幕66页| 国产精品小仙女| 性农村xxxxx小树林| 99久久免费精品高清特色大片| 亚洲欧美色图视频| 中文幕一区二区三区久久蜜桃| 国产jizz18女人高潮| 亚洲黄色性网站| 在线观看黄网站| 欧美视频一区二区在线观看| 一级久久久久久久| 欧美成人a在线| 天堂а在线中文在线无限看推荐| 亚洲欧洲美洲在线综合| 777电影在线观看| 欧美黑人国产人伦爽爽爽| 超碰高清在线| 国产精品久久久一区| 欧美经典影片视频网站| 国产在线精品日韩| 日韩精品免费| 蜜臀av色欲a片无码精品一区 | 你懂的免费在线观看| 色99之美女主播在线视频| 亚洲色图美国十次| 日本亚洲欧洲色α| 精品国产亚洲一区二区三区在线| 国产伦精品一区二区三毛| 精品国产一区二区三区久久久蜜臀| 最新中文字幕久久| 亚洲一区日韩在线| 日韩精品aaa| 97精品久久久久中文字幕| 自拍偷拍你懂的| 亚洲一区二区三区在线| 免费又黄又爽又猛大片午夜| 欧美一区二区福利视频| 欧美套图亚洲一区| 欧美伦理91i| 成人涩涩视频| 好看的日韩精品视频在线| 久久精品99久久无色码中文字幕| 隔壁人妻偷人bd中字| 蜜臀91精品一区二区三区| 在线免费看黄色片| 国产精品久久久久久久久久久免费看| 精品深夜av无码一区二区老年| 欧美日韩国产系列| 青青草免费在线| 欧美精品videosex牲欧美| 日本国产一区| 欧美主播一区二区三区美女 久久精品人 | 蜜桃网站成人| 欧美精品国产一区二区| 久久99999| 久久久久久一二三区| 国产性生活网站| 欧美人与z0zoxxxx视频| 免费观看成年在线视频网站| 久久久久久有精品国产| 国产精品久久久久久av公交车| 欧美日本国产精品| 亚洲国产精品一区制服丝袜| 特级黄色片视频| 国产精品系列在线| 蜜臀尤物一区二区三区直播| 亚洲精品乱码久久久久久金桔影视| 色呦呦在线播放| 成人激情电影一区二区| 成人aaaa| 成人性生生活性生交12| 久久久www成人免费无遮挡大片| 国产精品50页| 精品久久久久久久久久久久久久久 | 成人高清伦理免费影院在线观看| 91视频青青草| 91精品一区二区三区久久久久久| 北条麻妃在线| 国产精品第1页| jvid福利在线一区二区| 欧美三级午夜理伦三级| 91麻豆文化传媒在线观看| 人人干人人干人人干| 欧美大片拔萝卜| 激情网站在线| 国产女主播一区二区三区| 国产综合色产| 中文字幕在线视频播放| 精品久久久久久久久久久久久久| 日韩一级片免费看| 久久露脸国产精品| 台湾佬综合网| 热久久精品免费视频| 欧美激情一区二区三区在线| 中文有码在线播放| 色噜噜狠狠色综合网图区| 96视频在线观看欧美| 黄色一级片国产| 成人永久看片免费视频天堂| 日韩精品国产一区二区| 精品亚洲aⅴ在线观看| 外国电影一区二区| 亚洲综合五月天| 国产麻豆午夜三级精品| 久久免费在线观看视频| 日韩av在线免费播放| 日韩三区免费| 警花观音坐莲激情销魂小说| 国产成人av资源| 狠狠人妻久久久久久| 亚洲人成电影网站| 亚洲成人毛片| 精品少妇人欧美激情在线观看| 91亚洲精品久久久蜜桃网站 | 美国三级日本三级久久99 | 91青青在线视频| 亚洲va欧美va国产综合久久| 在线观看日韩av电影| 成人免费毛片糖心| 91精品婷婷国产综合久久| 免费不卡av| 日本一区高清不卡| 国产精品888| 在线精品免费视| 日韩在线观看免费| 精品视频高潮| 亚洲18在线看污www麻豆| 亚州成人在线电影| 在线观看国产原创自拍视频| 91精品黄色| 久久字幕精品一区| 免费在线视频观看| 亚洲最新av在线| 国产精品男女| 午夜免费看视频| 舔着乳尖日韩一区| 免费观看在线午夜影视| 精品国产一二| 精品一二三四区| 美女又爽又黄免费视频| 久久成年人视频| 精品国内自产拍在线观看视频| 两女双腿交缠激烈磨豆腐| 色欧美日韩亚洲|