精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

斯坦福大學:大模型“卷”錯方向了?上下文窗口越長,模型越笨!

人工智能
模型難以利用更長的上下文。僅僅通過增加上下文長度可能無法有效提升語言模型的性能。要真正改善模型處理長上下文的能力,可能需要從模型本身進行改進,例如改進模型的架構或者訓練策略。

在語言模型中,上下文窗口對于理解和生成與特定上下文相關的文本至關重要。

一般而言較大的上下文窗口可以提供更豐富的語義信息、消除歧義。

由于硬件和算法的最新進步,大模型的上下文窗口的長度也越來越“卷”。

其中的卷王當屬Anthropic 公司,其五月份就將 Claude 的上下文窗口從 9k token擴展到了 100k。

最近更新的Claude 2 更是讓其100K的上下文能力“常駐”模型。

圖片圖片

有大模型“風向標”之稱ChatGPT也在三月份將GPT-4模型最大上下文窗口達擴至32K;六月份將GPT-3.5-Turbo增加了16k的上下文長度(此前是4k)。

圖片圖片

而斯坦福大學聯合加州伯克利大學以及Samaya的研究員,在一篇題為“中途迷失:語言模型的長·上下文利用之道”中提出:在多文檔問題回答和鍵值檢索,這兩種都需要從輸入的上下文中識別相關信息的任務中,大語言模型會隨著輸入上下文的長度增加,性能會顯著下降。

具體而言,作者指出當相關信息出現在輸入上下文的開頭或結尾時,性能通常最好,但當模型需要在長篇上下文的中間獲取相關信息時,性能明顯降低。

換句話說:當帶有答案的文字,被放在文章的中間時候,大語言模型可能無法準確識別、理解該答案。

因此,大模型目前越來越卷的上下文窗口長度,可能并不能增加模型的理解能力。

圖片圖片

值得一提的是,知名科技媒體網站VentureBeat也報道了這篇論文,并咨詢了一些專家,表示,向量數據庫可能是破局的關鍵。

Vector databases like Pinecone help developers increase LLM memory by searching for relevant information to pull into the context window.

這一說法也得到了上述論文的關鍵作者“Nelson Liu”的認可,他表示:如果將整個 PDF 放到語言模型上下文窗口中,然后詢問有關該文檔的問題,那么使用向量數據庫搜索通常會更有效。

同時Nelson Liu也提到這篇論文并不是在說將整篇文檔塞進大模型的上下文窗口,就一定表現不好。其實,結果取決于文檔所包含的具體內容,大模型在區分“關系密切的內容”時,表現不佳。當各部分內容不相關(相互獨立)的時候,大模型非常擅長“準確定位”。

編者注:向量數據庫的核心思想是將文本轉換成向量,然后將向量存儲在數據庫中,當用戶輸入問題時,將問題轉換成向量,然后在數據庫中搜索最相似的向量和上下文,最后將文本返回給用戶。

論文細節

論文對開源和非開源的模型都進行了測驗,前者包括MPT-30B-Instruct,LongChat-13B(16K);后者包括OpenAI的GPT-3.5-Turbo和Anthropic的Claude。

首先進行了多文檔問題回答的實驗。該任務的目標是讓模型對文檔進行推理,找到并使用相關信息來回答給定的問題。

在實驗中,對輸入上下文的大小以及輸入上下文中的相關信息位置進行了有控制的調整。

圖片圖片

如上圖所示,當改變相關信息在文檔中的位置時,模型性能呈現獨特的U形趨勢,即當相關信息出現在輸入上下文的開頭或結尾時,性能通常最好;當模型需要在長篇上下文的中間獲取相關信息時,性能明顯最低。

甚至,在相關信息被放在輸入上下文的中間位置時,GPT-3.5-Turbo在多文檔問題回答任務上的表現不如別提供文檔。

此外,一些號稱專門處理長文本的大模型,在這方面表現也不好。

那么,語言模型有多大程度上能從輸入上下文中檢索信息呢?論文作者指定了一個合成的鍵值檢索任務來探索該問題。

在這個任務中,模型需要處理一組JSON格式的鍵值對,并必須返回與特定鍵相關聯的值。類似于多文檔問題回答任務,鍵值檢索任務在操作過程中,也對輸入上下文的大小以及輸入上下文中的相關信息位置進行了有控制的調整。

結果顯示:仍然是U形性能曲線。

多文檔問答

多文檔問答任務在很大程度上類似于商業搜索和問答應用(例如,Bing Chat)所采用的檢索增強生成模式。

在這些實驗中,模型的輸入是一個需要回答的問題,以及k篇文檔(例如,來自維基百科的段落),其中一篇文檔包含了問題的答案,而剩下的k-1篇“干擾”文檔則沒有。

圖片圖片

如上圖所示,要執行多文檔問答任務,模型需要在輸入的上下文中獲取包含答案的文檔,并用它來回答問題。

具體測驗中,作者利用NaturalQuestions基準測試的數據,創建了這一任務的實例。其中,使用的查詢來自于NaturalQuestions-Open,并從維基百科抽取段落(即不超過100個Token的文本塊)作為輸入上下文中的文檔。

對于所有這些查詢,需要找到一份包含答案的文檔,并找到k - 1份沒有答案的文檔作為干擾項。前者作者采用NaturalQuestions注釋中含有答案的維基百科段落;后者采用了Contriever檢索系統找出那些最與問題相關,但并未包含任何NaturalQuestions標注答案的k - 1個維基百科片段。

最后,將準確度作為主要的評價標準,以此來判斷預測輸出中是否出現了正確的答案。

圖片圖片

前期準備工作完畢,作者對當前幾個“最能打”的大模型進行了測驗。從上圖可以看出,這些模型都展示出了U形性能。

圖片圖片

如上圖所示,隨著輸入上下文的增長,模型的表現有明顯的下滑。無論哪一個任務,隨著上下文擴展,模型的功能都會表現出退化。

鍵值檢索任務

鍵值檢索任務能夠測驗大模型從輸入上下文直接獲取信息的能力。鍵值檢索任務中,輸入是含k對鍵值的JSON對象及一特定鍵,目標是返回該鍵關聯的值。

圖片圖片

因此,每個JSON對象都包含一個關聯的鍵值對(需要檢索的值),和k-1個不相關的“干擾”鍵值對。上圖展示了鍵值檢索任務輸入內容和其對應的預期輸出。

該任務中,可通過增加或減少隨機鍵來改變JSON鍵值對的數量,這樣就改變了輸入的長度;同時也會調整輸入中相關的正確信息的位置。

圖片圖片

含有75、140和300個鍵值對的測試

上圖展示了鍵值檢索的表現。結果顯示雖然鍵值找回任務僅需找到輸入上下文中的精確匹配,但并非所有模型都表現優秀。claude模型在各種長度上都接近完美,但其他模型在檢索大量鍵值對時遇到了困難。

在鍵值檢索和多文檔問答任務中,表現出類似的U型曲線。唯一的例外是在鍵值檢索任務中表現出色的模型(claude)。值得一提的是,LongChat-13B在140鍵值環境下的表現非常獨特,它會生成代碼來提取鍵值,而非直接輸出值。

為什么會出現這種問題?

為深入洞察其原因,作者初步研究了模型構架,答案在上下文中位置,和指令調優起到的作用。

圖片圖片

在模型架構層面,論文比較了only解碼器和編碼-解碼兩類模型,結論是:相比于only解碼器的語言模型,編碼器-解碼器結構的語言模型在上下文窗口方面較為穩健。但當模型處理超過其在訓練時使用的最大序列長度時,編碼器-解碼器模型也會出現U形曲線。

另外,更改答案在上下文中的位置,可以完美地提高關鍵-值檢索任務的性能,但對多文檔問答任務的性能趨勢影響不大。

最后,作者發現基礎語言模型在沒有指令調優的情況下也表現出U形曲線,這表明指令調優過程本身可能不是造成這一性能模式的原因。

換句話說,語言模型在利用中間信息上的困難,其根本原因可能不在于指令調優,這需要我們更深入地研究模型本身的結構及訓練過程。

論文結論

提供更多上下文信息并非總是有益的。盡管在某些情況下,向語言模型提供更多的上下文信息可以提高其性能,但是在一定點之后,增加更多的上下文信息可能無法帶來顯著的性能改進。

模型優先使用開頭和末尾信息。語言模型更容易處理輸入信息的開頭和末尾部分,所以把關鍵信息放在這些位置或縮短文檔長度可能有助于提升性能。

模型難以利用更長的上下文。僅僅通過增加上下文長度可能無法有效提升語言模型的性能。要真正改善模型處理長上下文的能力,可能需要從模型本身進行改進,例如改進模型的架構或者訓練策略。

參考文獻:

https://venturebeat.com/ai/stanford-study-challenges-assumptions-about-language-models-larger-context-doesnt-mean-better-understanding/

https://arxiv.org/abs/2307.03172

https://guangzhengli.com/blog/zh/vector-database/

責任編輯:武曉燕 來源: 大數據文摘
相關推薦

2023-07-24 12:27:08

論文斯坦福

2025-10-11 08:52:06

2025-10-13 09:03:00

2018-01-22 16:16:28

AI發展新趨勢機器學習

2023-07-21 14:16:15

2025-10-11 18:05:23

AI智能體模型

2011-11-17 09:53:18

斯坦福大學iOS應用開發

2021-03-18 11:30:15

人工智能AI機器學習

2023-05-08 10:29:17

模型論文

2022-10-13 16:01:38

技術大腦

2023-04-12 15:45:56

人工智能ChatGPT

2009-05-07 08:49:11

鮑爾默斯坦福大學巴茨

2025-10-14 09:54:28

2025-07-28 07:45:36

Anthropic大推理模型LRM

2024-03-14 08:11:45

模型RoPELlama

2020-07-08 16:46:46

人工智能病毒技術

2023-10-22 07:01:29

AI

2025-05-28 11:43:48

多模態大模型RBench-V

2025-02-17 08:25:00

模型數據訓練

2024-12-18 15:02:48

點贊
收藏

51CTO技術棧公眾號

蜜桃av噜噜一区| 免费不卡中文字幕在线| 亚洲一区二区三区小说| 精品欧美一区二区在线观看视频| 中文字幕一区在线播放| 日韩欧美三级| 亚洲高清色综合| 日本超碰在线观看| 久草免费在线视频| 国产精品乱子久久久久| 国产伦理久久久| 在线观看中文字幕网站| 亚洲高清激情| xxx一区二区| 人妻少妇精品视频一区二区三区| 亚洲免费看片| 色婷婷国产精品| 青春草在线视频免费观看| 欧美高清电影在线| 国产高清在线观看免费不卡| 国产精品久久久久aaaa九色| 久久9999久久免费精品国产| 日韩欧美视频| 亚洲欧美日韩中文在线| 人妻 丝袜美腿 中文字幕| 国产一区高清| 色婷婷久久久综合中文字幕| 久久99中文字幕| 九色porny丨首页在线| 国产日韩亚洲欧美综合| 国产另类自拍| av免费在线观看不卡| 日韩精品色哟哟| 青草青草久热精品视频在线观看| 天堂资源在线播放| 欧美在线视屏| 久久精品中文字幕一区| 美国精品一区二区| 久久不见久久见免费视频7| 日韩av一区在线| 午夜男人的天堂| 日韩高清在线观看一区二区| 欧美高清你懂得| 三级a在线观看| 成人激情综合| 色婷婷亚洲一区二区三区| 久久久免费视频网站| av岛国在线| 亚洲成人一区在线| 日韩xxxx视频| 超级白嫩亚洲国产第一| 精品久久久一区二区| 久久久性生活视频| av电影在线免费| 亚洲二区在线观看| 日韩五码在线观看| 黄色激情在线播放| 欧美日韩亚洲网| 欧美视频第一区| 三上悠亚激情av一区二区三区| 色悠久久久久综合欧美99| 男人天堂999| 日韩成人高清| 欧美猛男gaygay网站| 天堂av手机在线| 香蕉成人app| 精品国产乱码久久久久久图片| 蜜桃色一区二区三区| 国产精品极品在线观看| 精品亚洲一区二区三区在线播放| 欧美多人猛交狂配| 青草国产精品| 欧美成人激情视频| 日韩欧美三级在线观看| 另类亚洲自拍| 国产日韩精品视频| www.日本在线观看| 99国产精品久久久久久久久久久| 欧美激情专区| 日本高清视频在线观看| 亚洲精品成人精品456| 人妻无码久久一区二区三区免费 | 中文字幕日本不卡| 男女裸体影院高潮| 小视频免费在线观看| 精品视频资源站| 免费在线观看日韩av| 亚洲电影一级片| 北条麻妃久久精品| 日韩aaaaaa| 老汉av免费一区二区三区| 99久久精品免费看国产四区| 久久99久久| 一区二区三区中文在线观看| 久久久久久久久久久久久久国产| 国产精品一区免费在线| 亚洲精品成人av| 亚洲区一区二区三| 亚洲美女一区| 成人久久久久久| 日本私人网站在线观看| 亚洲人xxxx| 97xxxxx| 青草伊人久久| 国产一区二区三区视频免费| 久久久久亚洲AV| 麻豆国产精品官网| 久久伦理网站| 日本片在线观看| 欧美视频一区二区| 精品人妻一区二区免费视频| 性欧美69xoxoxoxo| 日本在线精品视频| 亚洲精品久久久久avwww潮水| 中日韩av电影| 97超碰青青草| 丁香婷婷成人| 美女久久久久久久久久久| 亚洲视频 欧美视频| 成人在线视频一区二区| 三级在线免费观看| 四虎4545www精品视频| 日韩精品视频在线免费观看 | 欧美成人首页| 国产精品久久久久久久久久新婚 | 日韩专区视频网站| 精品无人国产偷自产在线| 毛片a片免费观看| 韩国成人在线视频| 日韩免费av电影| 中文字幕高清在线播放| 亚洲国产成人久久综合| 青青草手机在线视频| 国产真实乱偷精品视频免| 日韩高清三级| 欧美自拍电影| 亚洲欧美日韩久久久久久| 国产成人啪精品午夜在线观看| 国产一区二区不卡在线| 国产系列第一页| 亚洲成人1区| 日韩日本欧美亚洲| 中文字幕在线播出| 亚洲国产电影在线观看| 亚洲综合色在线观看| 欧美老女人另类| 国产精品久久一| 99视频在线观看地址| 欧美日韩在线观看一区二区| 91动漫免费网站| 精品亚洲成av人在线观看| 在线免费观看一区二区三区| 图片一区二区| 久久久精品久久久| 国产精品久久影视| 一区二区三区四区不卡视频| 性生交大片免费看l| 国产一区二区中文| 国产亚洲精品美女久久久m| 白浆在线视频| 亚洲欧洲黄色网| 中文字幕在线观看精品| 中文字幕五月欧美| 永久免费看片在线观看| 在线国产日韩| 日韩精品第一页| 日韩在线电影| 欧美黄色性视频| 青春草在线观看| 精品视频1区2区3区| 色欲人妻综合网| 成人午夜精品在线| 黄色国产精品视频| 成久久久网站| 91久久偷偷做嫩草影院| 深夜福利视频一区二区| 中文字幕亚洲欧美日韩在线不卡 | 精品福利一二区| 少妇太紧太爽又黄又硬又爽| 国产精品福利影院| 91精品国产高清91久久久久久| 99re国产精品| 亚洲国内在线| jizz性欧美23| 日韩av电影在线网| av超碰免费在线| 精品无人国产偷自产在线| 中文天堂在线播放| 亚洲午夜一区二区三区| 精品人妻一区二区三区蜜桃视频| 国产一区二区中文字幕| 99热在线这里只有精品| 婷婷综合伊人| 免费亚洲精品视频| 日本免费一区二区三区视频| 欧美又大又硬又粗bbbbb| 精品美女在线观看视频在线观看| 亚洲成人精品视频| 一级片一区二区三区| 午夜精品一区二区三区电影天堂| 呻吟揉丰满对白91乃国产区| 9色porny自拍视频一区二区| 制服丝袜中文字幕第一页| 亚洲精选成人| 777久久精品一区二区三区无码 | 欧美aaaaaa| 97超级碰碰人国产在线观看| 国内外激情在线| 亚洲天堂av在线免费| 黄色av中文字幕| 7777精品伊人久久久大香线蕉的| 日韩人妻精品中文字幕| 亚洲乱码一区二区三区在线观看| 国产精品国产三级国产专业不 | 性猛交娇小69hd| 99久精品国产| 韩国三级与黑人| 老色鬼精品视频在线观看播放| 免费观看日韩毛片| 亚洲视频观看| 91嫩草国产丨精品入口麻豆| 久久伦理在线| 日产国产精品精品a∨ | 在线观看成人av电影| 猛男gaygay欧美视频| 国产美女在线精品免费观看| 精品久久久久久久久久岛国gif| 国产精品美女视频网站| sis001欧美| 欧美在线视频一区二区| av伦理在线| 97久久精品在线| 国产黄色大片在线观看| 欧美国产亚洲精品久久久8v| av在线网址观看| 久久久91精品国产一区不卡| 天堂地址在线www| 中文亚洲视频在线| www.91在线| 日韩在线欧美在线| 幼a在线观看| 日韩在线观看你懂的| 免费观看在线黄色网| 日韩中文av在线| 午夜在线小视频| 久久久99免费视频| 污网站在线免费看| 久久久中精品2020中文| 91丝袜在线| 69视频在线免费观看| 小早川怜子影音先锋在线观看| 欧美一级电影在线| 日本美女一区| 国产美女精彩久久| 欧美9999| 国产麻豆一区二区三区在线观看| 理论片一区二区在线| 开心色怡人综合网站| 亚洲欧洲av| 亚洲精品一区二| 亚洲精品小说| 欧美日韩福利在线| 人妻丰满熟妇av无码久久洗澡| 国产精品中文字幕亚洲欧美| 日韩性感在线| 99久久精品费精品国产风间由美| 妞干网这里只有精品| 国产综合婷婷| 91猫先生在线| 奇米在线7777在线精品| 两性午夜免费视频| 北条麻妃国产九九精品视频| 中国毛片在线观看| 国产精品久久久久一区二区三区共| 希岛爱理中文字幕| 亚洲一区二区三区免费视频| 日韩精品在线观看免费| 在线观看亚洲成人| 国产白浆在线观看| 亚洲成人a**站| www.黄在线观看| 欧美激情欧美激情在线五月| 校园春色亚洲| 92福利视频午夜1000合集在线观看| 国产精品tv| 亚洲高清资源综合久久精品| 欧美日韩a区| 777久久久精品一区二区三区| 日本不卡在线视频| 中文字幕无人区二| 久久精品网站免费观看| 免费在线观看h片| 欧美日韩免费观看中文| 91精品国产色综合久久不8| 精品久久久久久亚洲综合网 | 99久久久精品视频| 午夜宅男久久久| 69久久精品无码一区二区| 91在线精品一区二区三区| 午夜国产小视频| 欧美日韩在线视频一区| 99久久久久久久| 亚洲欧美日韩中文在线| 伦理av在线| 成人午夜黄色影院| 免费观看久久av| 国产精品国三级国产av| 久久精品国产网站| 一级性生活毛片| 亚洲一区二区三区四区五区黄| 在线播放亚洲精品| 亚洲国产精品福利| 在线观看三级视频| 国产日韩精品在线| 久久99久久人婷婷精品综合| 国产自产在线视频| 国产原创一区二区| 国产三级短视频| 欧美性猛交xxxx乱大交3| www.爱爱.com| 日韩视频永久免费观看| 国产日韩另类视频一区| 久久96国产精品久久99软件| 欧美午夜不卡| www.国产福利| 国产精品麻豆网站| 一级特黄免费视频| 精品一区二区三区四区| 七七成人影院| 97中文在线| 国产在线成人| 天天色天天干天天色| 一区在线中文字幕| 亚洲中文字幕一区二区| 视频直播国产精品| 久久xxx视频| 色女孩综合网| 麻豆freexxxx性91精品| 少妇av片在线观看| 91福利视频网站| 国产精品秘入口| 国产成人av网| 不卡一区综合视频| 性生活免费在线观看| 国产精品人妖ts系列视频| 97人妻精品视频一区| 在线成人激情视频| 91p九色成人| 亚洲欧美综合一区| 精油按摩中文字幕久久| 手机在线免费看片| 日韩视频一区二区| 丁香高清在线观看完整电影视频| 不卡视频一区二区| 亚洲人人精品| 欧美 日本 国产| 日本高清不卡一区| 成人在线观看一区| 国产欧美日韩免费看aⅴ视频| 天天综合精品| 91精品又粗又猛又爽| 黑丝美女久久久| 国产一级在线观看| 成人免费网站在线| 亚洲无吗在线| 国产成人无码精品久久二区三| 在线免费观看日本一区| 三级外国片在线观看视频| 成人黄色网免费| 国产综合婷婷| a级大片在线观看| 欧美日本不卡视频| 波多野结衣在线播放| 欧美主播一区二区三区美女 久久精品人 | 中文字幕在线亚洲| 日韩第一区第二区| 久久久噜噜噜www成人网| 国产精品入口麻豆九色| av中文字幕免费在线观看| 69av成年福利视频| 日韩精品网站| 一级黄色电影片| 91精品福利视频| 2024最新电影免费在线观看| 久久偷窥视频| 极品少妇xxxx偷拍精品少妇| 国产一级片免费看| 夜夜嗨av一区二区三区四区| 欧美黄色一级| 无遮挡又爽又刺激的视频| 日韩美女视频19| 亚洲色偷精品一区二区三区| 国产免费一区视频观看免费| 国产精品地址| 久久精品色妇熟妇丰满人妻| 精品国偷自产国产一区| 欧美国产视频| a在线视频观看| 亚洲嫩草精品久久| 成人精品一区|