精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

拯救被「掰彎」的GPT-4!西交微軟北大聯合提出IN2訓練治療LLM「中間迷失」

發布于 2024-5-22 08:49
瀏覽
0收藏

辛辛苦苦給大語言模型輸入了一大堆提示,它卻只記住了開頭和結尾?


這個現象叫做LLM的中間迷失(Lost in the Middle),是大模型當前仍面臨的最大挑戰之一。


畢竟,LLM現在的上下文長度已經沖到了百萬級別,而難以處理中間的信息,會使得LLM在評估大量數據時不再可靠。

拯救被「掰彎」的GPT-4!西交微軟北大聯合提出IN2訓練治療LLM「中間迷失」-AI.x社區

Midjourney對于Lost in the Middle的理解

其實,我們人類也有類似「中間迷失」的毛病,心理學上叫「Primacy/recency effect」,感興趣的讀者可以參見:

??https://www.sciencedirect.com/topics/psychology/recency-effect??


「我怕零點的鐘聲太響......后面忘了」


不過就在不久前,來自西交、微軟和北大的研究人員,開發了一種純粹的數據驅動解決方案,來治療LLM丟失中間信息的癥狀:

拯救被「掰彎」的GPT-4!西交微軟北大聯合提出IN2訓練治療LLM「中間迷失」-AI.x社區

論文地址:https://arxiv.org/pdf/2404.16811


研究人員認為,Lost in the Middle的原因是訓練數據中的無意偏差。


因為LLM的預訓練側重于根據最近的一些token預測下一個token,而在微調過程中,真正的指令又往往位于上下文開始的位置。


這在不知不覺中引入了一種立場偏見,讓LLM認為重要信息總是位于上下文的開頭和結尾。


基于這樣的見解,研究人員提出了信息密集型(INformation-INtensive,IN2)訓練方法,來建立數據之間的橋梁。

拯救被「掰彎」的GPT-4!西交微軟北大聯合提出IN2訓練治療LLM「中間迷失」-AI.x社區

既然是訓練過程造成的偏見,那么就用訓練數據來解決。


IN2訓練使用合成問答數據,向模型顯式指出重要信息可以位于上下文中的任何位置。


整個上下文長度(4K-32K個token),被分為許多128個token的片段,而答案所對應的信息位于隨機位置的片段中。

拯救被「掰彎」的GPT-4!西交微軟北大聯合提出IN2訓練治療LLM「中間迷失」-AI.x社區

研究人員使用了兩種類型的訓練問題:一種是要求在一個片段中提供細節,另一種是需要整合和推斷來自多個片段的信息。


IN2訓練到底效果如何?使用明星模型Mistral-7B來試試。


將IN2訓練應用于Mistral-7B,得到了新模型FILM-7B(FILl-in-the-Middle),然后測試為長上下文設計的三個新的提取任務。


測試任務涵蓋不同的上下文類型(文檔、代碼、結構化數據)和搜索模式(向前、向后、雙向)。

拯救被「掰彎」的GPT-4!西交微軟北大聯合提出IN2訓練治療LLM「中間迷失」-AI.x社區

結果表明,IN2顯著降低了原始Mistral模型的「中間丟失」問題。更厲害的是,作為只有7B的模型,FILM的性能在很多情況下甚至超越了GPT-4 Turbo。


在保持自己執行短上下文任務能力的同時,FILM-7B在各種長上下文任務中也表現出色,例如總結長文本,回答有關長文檔的問題,以及對多個文檔的推理。

拯救被「掰彎」的GPT-4!西交微軟北大聯合提出IN2訓練治療LLM「中間迷失」-AI.x社區

上表是不同模型在現實的長上下文任務中的表現。與本體Mistral-7B 相比,INformation-INtensive (IN2) 訓練帶來的提升很明顯,FILM-7B的綜合成績僅次于GPT-4 Turbo。


不過有一說一,Lost in the Middle的問題并沒有完全解決,而且在長上下文存在問題的情況下,GPT-4 Turbo也仍然是上下文基準中最強的模型。

Lost in the Middle

LLM丟失中間信息的問題最早由斯坦福、UC伯克利和Samaya AI的研究人員在去年發現。

拯救被「掰彎」的GPT-4!西交微軟北大聯合提出IN2訓練治療LLM「中間迷失」-AI.x社區

論文地址:https://arxiv.org/pdf/2307.03172


當面對較長的信息流時,人類傾向于記住開頭和結尾,中間的內容更容易被忽視。

沒想到LLM也學會了這個套路:對于從輸入中檢索信息的任務,當信息位于輸入的開頭或結尾時,模型的表現最好。


但是,當相關信息位于輸入的中間時,性能會顯著下降。尤其是在回答需要從多個文檔中提取信息的問題時,性能下降尤為明顯。


——真是干啥啥不行,偷懶第一名。


模型必須同時處理的輸入越多,其性能往往越差。——而在實際得應用場景中,往往就是需要LLM同時均勻地處理大量信息。


另外,研究結果還表明,大型語言模型使用額外信息的效率是有限的,具有特別詳細指令的「大型提示」可能弊大于利。

拯救被「掰彎」的GPT-4!西交微軟北大聯合提出IN2訓練治療LLM「中間迷失」-AI.x社區

對于許多長上下文LLM,中間信息丟失的現象普遍存在。上表測試了當時市面上流行的各種款式LLM,包括GPT-4,一共是七種。


可以看出,不論是開源還是閉源模型的強者,測試結果都顯示出明顯的U形曲線,說明都是在兩頭效果好,而中間就拉跨了。

拯救被「掰彎」的GPT-4!西交微軟北大聯合提出IN2訓練治療LLM「中間迷失」-AI.x社區

即使強如GPT-4,也難逃被「掰彎」的命運。


這也不禁讓人質疑:你們這些卷超長上下文的模型到底有沒有用啊?不但吃得多,中間信息也記不住。

信息密集型訓練大法

為了明確教導模型,在長上下文中的任何位置都可以包含關鍵信息。研究人員構建了一個長上下文問答訓練數據集 D = {L,q,a},其中問題q的答案a,來自長上下文L中的隨機位置。


下圖展示了整個數據構建過程。具體來說,訓練數據D基于通用自然語言語料庫C。給定一個原始文本,首先使用LLM(GPT-4-Turbo)生成一個問答對 (q,a),然后合成一個長上下文 L,其中包括來自C的其他隨機抽樣文本的必要信息。

拯救被「掰彎」的GPT-4!西交微軟北大聯合提出IN2訓練治療LLM「中間迷失」-AI.x社區

上圖包含兩種類型的問答對:(1)對長上下文中細粒度信息的掌握;(2)對長上下文中不同位置出現的信息進行整合和推理。

細粒度信息感知

將包含128個token的段視為上下文的最小信息單元。給定一個原始文本C,首先從中隨機提取一個128個token的段s,然后生成q、a和 L:

拯救被「掰彎」的GPT-4!西交微軟北大聯合提出IN2訓練治療LLM「中間迷失」-AI.x社區

信息整合和推理

除了利用每個片段之外,研究人員還考慮為兩個或多個片段中包含的信息生成問答對。

按照上面最小信息單元的設置,同樣將全文拆分為一組128個token的段 [s],然后相應地生成 q、a和L:

拯救被「掰彎」的GPT-4!西交微軟北大聯合提出IN2訓練治療LLM「中間迷失」-AI.x社區

使用LLM生成多跳問答對,保證每個問題對應的答案至少需要兩個段內的信息。

訓練

整個訓練數據集包含:1.1M用于細粒度信息感知的長上下文數據(~63%)、300K用于信息整合和推理的長上下文數據(~17%)、150K短上下文問答數據(~9%)和200K通用指令調整數據(~11%)。


使用上面構建的訓練數據,研究人員對Mistral-7B-Instruct-v0.2執行 IN2訓練:將長上下文和問題作為指令,并使用答案部分的損失來更新模型。


超參數:將全局批處理大小設置為128,使用余弦學習率衰減,最大值為1e-6。

拯救被「掰彎」的GPT-4!西交微軟北大聯合提出IN2訓練治療LLM「中間迷失」-AI.x社區

模型訓練在16個80G A100 GPU上進行,采用由pytorch FSDP實現的完整分片策略和cpu卸載策略,整個訓練過程耗時大約18天。

VAL 探測

研究人員提出了VAL探測方法,作為評估語言模型上下文性能的更合適的方法,涵蓋了不同的上下文風格和檢索模式,以進行更徹底的評估。


下圖表示VAL探測中的三個任務。檢索模式由檢索關鍵字與要檢索的信息之間的相對位置決定。

拯救被「掰彎」的GPT-4!西交微軟北大聯合提出IN2訓練治療LLM「中間迷失」-AI.x社區

這里考慮了三種上下文樣式(文檔、代碼和結構化數據上下文)和三種檢索模式(前向、后向和雙向檢索)。


VAL探測中的每個上下文都包含約32K個token,每個任務包含約3K個示例。


文檔句子檢索(雙向):上下文由許多自然語言句子組成,目的是檢索包含給定片段的單個句子。這些句子是從arXiv上的論文摘要中抽取的。


此任務遵循雙向檢索模式,因為預期的檢索結果包含上下文中給定片段之前和之后的單詞。評估指標是單詞級別的召回率分數。


代碼函數檢索(向后):上下文由Python函數組成,目的是檢索函數定義中給定代碼行的函數名稱。原始代碼函數是從StarCoder數據集中采樣的,并為每個函數隨機選擇三行定義。


此任務遵循向后檢索模式,因為函數名稱始終位于定義之前。評估指標是匹配精度。


數據庫實體檢索(向前):上下文包含結構化實體列表,每個實體都有三個字段:ID、label和description,目的是檢索給定ID的標簽和說明。這些實體是從維基百科數據中采樣的。


此任務遵循正向檢索模式,因為標簽和說明跟隨ID。以寬松的匹配準確性作為衡量標準:如果響應中的標簽或描述完全匹配,則給出 1 分,否則為0分。


本文轉自 新智元 ,作者:新智元


原文鏈接:??https://mp.weixin.qq.com/s/O0GXiaa3aypMWLJcvyboYA??


收藏
回復
舉報
回復
相關推薦
亚洲激情视频网| 国产亚洲人成网站| 欧美激情日韩图片| 粉嫩av懂色av蜜臀av分享| 韩国美女久久| 国产精品久久久久久久裸模| 91久久国产综合久久蜜月精品| 国产真实乱人偷精品视频| 国产成人三级| 日韩视频一区二区三区 | 亚洲色图21p| 免费成人av在线| 国精产品一区一区三区有限在线| 男人的天堂av网| 粉嫩的18在线观看极品精品| 欧美在线视频你懂得| 隔壁人妻偷人bd中字| wwwww在线观看免费视频| 国产精品888| 国产不卡一区二区在线播放| 欧美日韩偷拍视频| 日韩欧美中字| 亚洲精品自产拍| 精品国产午夜福利在线观看| 欧美黑人疯狂性受xxxxx野外| 一区二区三区四区中文字幕| 亚洲精品中字| 激情在线视频| heyzo一本久久综合| 成人免费看吃奶视频网站| 成年人视频在线免费看| 国产精品videosex极品| 日韩中文在线中文网在线观看| 国产制服丝袜在线| 超碰成人福利| 日韩一级视频免费观看在线| 一级在线免费视频| 日韩伦理三区| 懂色av中文一区二区三区天美| 400部精品国偷自产在线观看| 99青草视频在线播放视| 久久五月婷婷丁香社区| 国产精品一区二区三区不卡| 99精品国产99久久久久久97| 久久99国产精品免费网站| 日韩美女在线观看| 亚洲 欧美 成人| 国产偷自视频区视频一区二区| 欧美大片在线影院| 色先锋资源久久综合5566| 久久精品视频在线观看免费| 欧美v亚洲v综合v国产v仙踪林| 一本久久综合亚洲鲁鲁五月天| 奇米精品一区二区三区| av在线小说| 亚洲欧美成aⅴ人在线观看| 亚洲欧洲日韩精品| 91社区在线高清| 欧美极品少妇xxxxⅹ高跟鞋| 欧洲国产精品| 阿v免费在线观看| 欧美激情中文字幕| 亚洲不卡1区| 国产视频网址在线| 久久久电影一区二区三区| 欧美精品一区二区三区在线四季 | 亚洲制服中文| 色综合久久影院| 亚洲欧洲另类国产综合| 免费国产成人看片在线| 手机在线免费av| 亚洲一区二区3| 久在线观看视频| 欧美性suv| 欧美视频第二页| 中文字幕第22页| 2021年精品国产福利在线| 亚洲国产成人久久| 韩国无码一区二区三区精品| 久久最新网址| 久久视频在线免费观看| 欧美精品久久久久性色| 日韩午夜av| 国产成人精品免高潮在线观看| 中文无码av一区二区三区| 精品一区二区免费在线观看| 91在线观看网站| 亚洲色图 校园春色| 欧美国产在线观看| 日韩不卡一二区| 97天天综合网| 欧美午夜片在线观看| 亚洲欧美日本一区二区三区| 中文无码日韩欧| 亚洲人成电影网站色xx| 四虎免费在线视频| 新67194成人永久网站| 国产精品久久久久久久久| 精品国产无码AV| 久久一二三国产| 91麻豆天美传媒在线| 成人免费观看在线观看| 欧美日韩成人在线一区| 国产又粗又长又爽| 国产精品99久久精品| 欧美黑人一级爽快片淫片高清| 男人天堂视频网| 粉嫩久久99精品久久久久久夜| 欧美一区二区视频17c| 99在线播放| 91国内精品野花午夜精品| 韩国三级与黑人| 欧美码中文字幕在线| 久久久久久国产精品久久| 伊人网综合在线| 久久综合精品国产一区二区三区 | 在线精品观看国产| 久久久久久久穴| 91精品国产91久久久久久黑人| 欧美中文字幕在线观看| 成人av免费播放| 国产精品亲子伦对白| 国产在线播放观看| 精品一区二区三区免费看| 一区国产精品视频| 五月天激情国产综合婷婷婷| 国产99久久久国产精品潘金| 一区二区三区在线视频111 | 国产精品亚洲美女av网站| 五月天丁香视频| 亚洲一区二区精品3399| 无套内谢丰满少妇中文字幕| 欧美三级情趣内衣| 777午夜精品福利在线观看| 亚洲国产精品欧美久久| 亚洲人亚洲人成电影网站色| 蜜臀av免费观看| 国产伦一区二区三区| 97免费中文视频在线观看| 亚洲美女综合网| 一区二区三区四区乱视频| 天天综合成人网| 欧美aaaa视频| 国产日韩精品电影| 日本高清在线观看wwwww色| 欧美最猛黑人xxxxx猛交| 一区二区不卡免费视频| 中文日韩在线| 黑人巨大精品欧美一区二区小视频| 在线免费观看污| 日韩欧美电影一二三| 一区二区视频免费看| 国产老妇另类xxxxx| 日本久久高清视频| 亚洲精品一区二区三区中文字幕| 久久成人人人人精品欧| 亚洲xxx在线| 亚洲午夜国产一区99re久久| 69亚洲乱人伦| 国产精品五区| 日韩精品电影网站| 国产成人a视频高清在线观看| 中文国产成人精品久久一| 中文字幕人妻色偷偷久久| 综合分类小说区另类春色亚洲小说欧美| 91福利国产成人精品播放| 爽成人777777婷婷| 91影院在线免费观看视频| 18+激情视频在线| 精品久久久久久久人人人人传媒| 国产在线视频第一页| 97久久久精品综合88久久| 97在线免费公开视频| 国产最新精品| 91久久精品国产91性色| 色av手机在线| 精品在线小视频| 亚洲毛片一区二区三区| ●精品国产综合乱码久久久久| 青娱乐国产精品视频| 亚洲国产影院| 日韩久久久久久久| 2019中文亚洲字幕| 久久久免费在线观看| 激情小视频在线观看| 7777精品久久久大香线蕉| 日韩av一二三区| 国产精品女同互慰在线看| 日韩av成人网| 久久黄色网页| 免费极品av一视觉盛宴| 亚洲va久久久噜噜噜久久| 国产精品一区二区久久精品| 欧美xxxx做受欧美88bbw| 亚洲女人天堂视频| www.黄色片| 色爱区综合激月婷婷| 欧美日韩中文字幕在线观看| 久久综合狠狠综合久久综合88| 日韩成人av免费| 久久av在线| 蜜臀av性久久久久蜜臀av| 亚洲综合小说图片| eeuss一区二区三区| ww久久综合久中文字幕| 久久久久久国产三级电影| av在线中文| 亚洲精品91美女久久久久久久| 中文字幕精品在线观看| 亚洲 欧美综合在线网络| 美女网站视频色| 99久久精品国产一区二区三区| 中文字幕第88页| 午夜亚洲一区| 日韩五码在线观看| 亚洲天堂免费| 五月天国产一区| 欧美人体视频| 国产精品sss| 国产精品久久久久久久久久辛辛 | 一区二区成人精品| 欧美一区二区三区成人片在线| 欧美日韩三级一区| 亚洲精品中文字幕乱码三区91| 亚洲美女淫视频| 亚洲精品国产精品国自| 91首页免费视频| 年下总裁被打光屁股sp| 久久成人精品无人区| 污污视频网站免费观看| 国产农村妇女精品一区二区| 欧美国产视频一区| 欧美一区激情| 午夜在线视频免费观看| 水蜜桃久久夜色精品一区| 日本精品一区二区三区视频| 秋霞在线一区| 精品国产一区二区三区麻豆小说| 51精品国产| 99国精产品一二二线| 欧美一区一区| 亚洲自拍偷拍色图| 国产一区二区三区视频在线| 成人黄色av播放免费| 久久爱.com| 国产一区私人高清影院| 成人a在线观看高清电影| 国产精品av在线播放| 人人鲁人人莫人人爱精品| 日本韩国在线不卡| 一区一区三区| 日本欧美一级片| 欧洲亚洲两性| 国产精品r级在线| 成人做爰免费视频免费看| 国产精品老女人精品视频| 97人人做人人爽香蕉精品| 国产精品视频一| 国产福利一区二区三区在线播放| 国产精品一区二区久久国产| 成人综合日日夜夜| 97超碰人人模人人爽人人看| 看亚洲a级一级毛片| 成人免费看片网站| 免费萌白酱国产一区二区三区| 久久久久久国产精品免费免费| 一本色道久久综合狠狠躁的番外| 你懂的网址一区二区三区| 国产一区二区欧美| 亚洲国产欧美日韩| 亚洲天天影视网| 欧美乱做爰xxxⅹ久久久| 亚洲久久成人| 欧美黑人又粗又大又爽免费| 久久99精品久久久久久国产越南| 亚洲一区二区三区观看| 国产99久久久精品| av黄色免费网站| 最好看的中文字幕久久| 国产亚洲小视频| 色久优优欧美色久优优| 中文字幕第2页| 日韩久久精品一区| 免费人成在线观看网站| 久久精品视频导航| 国产精品一区二区日韩| 国产精品视频区1| 风间由美中文字幕在线看视频国产欧美| 精品在线不卡| 91视频精品| 亚洲熟妇av一区二区三区| 国产最新精品精品你懂的| 北岛玲一区二区| 国产精品不卡在线观看| 日本在线播放视频| 欧美日韩亚洲综合在线 | 欧美日韩视频免费看| aaa级精品久久久国产片| 亚洲aaa级| 国产91在线亚洲| 免费在线观看成人| 久久久老熟女一区二区三区91| 国产精品久久久久三级| 中国一级免费毛片| 欧美一区二区三区四区五区| 日韩美女一级视频| 欧美成年人在线观看| 日韩欧美一区二区三区免费观看 | 国产99精品| 欧美黑人在线观看| 免费在线观看不卡| 亚洲成人日韩在线| 亚洲高清不卡在线观看| 国产一区二区三区四区视频| 日韩毛片中文字幕| 国内小视频在线看| 成人黄色大片在线免费观看| 国产精品亚洲人成在99www| 成人免费性视频| 国模一区二区三区白浆| 精品伦精品一区二区三区视频密桃 | 午夜影院免费在线| 国产精品视频区| 成人午夜av| 熟女人妇 成熟妇女系列视频| gogogo免费视频观看亚洲一| 精品97人妻无码中文永久在线| 欧美日韩亚州综合| 成人性生交大片免费看午夜| 奇米成人av国产一区二区三区| 爱高潮www亚洲精品| 大地资源网在线观看免费官网| 国内精品伊人久久久久av一坑| 亚洲av毛片基地| 色婷婷久久99综合精品jk白丝| 四虎影视2018在线播放alocalhost| 欧美大片在线看| 91精品尤物| 国产91在线亚洲| 国产黄人亚洲片| 精品99久久久久成人网站免费 | 亚洲经典一区| 日韩av片专区| 中文字幕色av一区二区三区| 中国一级片黄色一级片黄| 中文字幕在线看视频国产欧美在线看完整 | 可以看的av网址| 亚洲女人小视频在线观看| 国产精品一级视频| 久久天天躁狠狠躁夜夜躁2014| 国产精品亚洲欧美日韩一区在线| 制服国产精品| 国产美女在线观看一区| 小泽玛利亚一区二区免费| 7799精品视频| 蜜乳av一区| 九色综合婷婷综合| 美女被久久久| 丰满的亚洲女人毛茸茸| 欧美精品自拍偷拍动漫精品| 黄色小网站在线观看| 97免费资源站| 亚洲精品影院在线观看| 四虎永久免费影院| 欧美性一二三区| 成人黄色网址| 国产精品久久国产精品| 亚洲永久在线| 国产精品酒店视频| 欧美一区二区三区视频免费| 久久99亚洲网美利坚合众国| 国产综合av一区二区三区| 日韩一区精品视频| 91杏吧porn蝌蚪| 亚洲福利精品在线| 你懂得影院夜精品a| 国产精品jizz在线观看老狼| 丁香亚洲综合激情啪啪综合| 国产一区二区三区影院| 曰本色欧美视频在线| 成人黄色91| 免费看国产一级片| 中文欧美字幕免费| 亚洲黄色小说网址| 人体精品一二三区| 围产精品久久久久久久| 天天躁日日躁狠狠躁av麻豆男男| 91国偷自产一区二区开放时间 | 特级丰满少妇一级aaaa爱毛片| 国产精品高潮粉嫩av| 欧美+日本+国产+在线a∨观看| 日韩人妻一区二区三区| 91精品国产一区二区三区| 国产在线看片免费视频在线观看| 亚洲黄色一区二区三区| 成人福利视频网站| 中文字幕一区二区三区人妻四季| 色在人av网站天堂精品| 激情五月色综合国产精品| 极品白嫩少妇无套内谢|