精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

別再信「百萬 token」了,我們扒了 18 個大模型,發現長文本的驚天秘密 精華

發布于 2025-7-22 06:51
瀏覽
0收藏

近些年,大模型圈子最火的詞莫過于「百萬 token 上下文」。

從 Google Gemini 1.5 Pro 到 GPT-4.1,再到 Llama 4,各大廠商仿佛在一場技術軍備競賽中,瘋狂地把模型的「內存」撐大。這讓你我這樣的普通用戶興奮不已:這不就意味著,我可以直接把一整本書、幾百頁的財報、甚至是整個項目代碼庫扔給 AI,讓它瞬間消化,然后對答如流嗎?

理論上是這樣。而且,在經典的 NIAH (Needle in a Haystack,即「大海撈針」) 測試中,這些模型也確實表現得像個超級學霸,幾乎每次都能精準地從海量文本中找到那根「針」。

但是,先別急著開香檳。 ??

最近,一篇“魔鬼級”的深度研究報告,把市面上 18 個主流大模型(包括你熟悉的所有明星產品)拉過來,進行了一場前所未有的長文本「極限施壓測試」。

結論非常顛覆:所謂「長文本能力」,遠比我們想象的要脆弱。

簡單來說,當任務稍微變得復雜一點,這些 AI 天才們的表現,就像是坐上了過山車,一路往下掉。??

「大海撈針」測試,其實是個「偽學霸」鑒定器?

你可能要問,經典的「大海撈針」測試不是證明它們很強嗎?

沒錯,NIAH 測試就是在一大堆無關文字(草堆)里,藏一句關鍵信息(針),然后讓 AI 找出來。

這就像是開卷考試,讓你在書里找原話,AI 當然能拿滿分。但這篇研究一針見血地指出:真實世界的問題,從來都不是找原話那么簡單。

于是,研究團隊設計了一系列“進階版”測試,只為了回答一個問題:當輸入的文本越來越長,AI 的“智商”到底會不會下降?

四場極限挑戰,AI 的“人設”崩了

研究者們設計了四種極其巧妙的玩法,把 AI 的長文本能力扒了個底朝天。

1. 問題越繞,模型越懵 

如果問題和答案不是簡單的「復制粘貼」,而是需要 AI 稍微“拐個彎”去理解呢?

研究團隊設計了不同語義相似度的問題和「針」。結果發現,當問題和答案的字面意思差別越大,AI 的表現就越差。上下文越長,這種性能衰退就越嚴重。

A 君說:這就像你讓朋友去書架上幫你拿「那本藍色的書」,他很容易找到。但如果你說「幫我拿那本講星際旅行的科幻經典」,他可能就要在書架前懵圈半天了。

2. 扔幾個「煙霧彈」,AI 立刻“叛變”

真實世界里,信息往往不是非黑即白,總有很多模棱兩可的“干擾項”。

研究者在「草堆」里,除了藏著真正的「針」,還放了幾個和「針」長得很像,但卻是錯誤的「煙霧彈」(Distractors)。

結果你猜怎么著?

哪怕只放一個「煙霧彈」,AI 的準確率就開始下降。放四個,性能直接“跳水”。而且,文本越長,AI 就越容易被帶跑偏。

更有趣的是,不同模型的“性格”也暴露無遺:

  • 保守派 Claude遇到不確定的情況,它會非常誠實地說:「對不起,信息太模糊,我找不到答案。」(雖然沒答對,但至少沒騙你)
  • 頭鐵幻覺派 GPT它總是那么自信,哪怕是被「煙霧彈」騙了,也會理直氣壯地給出一個錯誤答案。(最怕的就是這種)

3. 文本太“和諧”,反而找不到重點?

如果「針」的內容和「草堆」的背景文章主題非常相似,AI 是更容易找到,還是更難?

實驗結果有點出乎意料,沒有統一的規律。有時候,「針」和背景文章格格不入(比如在技術論文里藏一句寫詩的技巧),AI 反而更容易發現它。

A 君說:這說明 AI 處理的上下文并非“中性填充物”,內容本身會影響它的判斷力。

4. 最反直覺的發現來了:打亂順序,成績反而更好?!

這是整篇報告中最騷,也最讓人大跌眼鏡的發現。

研究者把「草堆」文章的句子全部打亂,破壞了原文的邏輯和連貫性。按理說,這應該會加大 AI 的處理難度吧?

結果恰恰相反!

幾乎所有模型,在處理這些“被打亂的、不講邏輯”的文本時,表現都比處理原文時更好。

為什么?研究者推測,可能是連貫的文本結構以某種方式“催眠”了 AI 的注意力機制,讓它順著邏輯流“飄”了過去,反而忽略了插入其中的「針」。而混亂的文本,則迫使 AI 對每一句話都進行獨立審查,更容易發現異常。

真實世界模擬:AI 的記憶力只有七秒?

除了「大海撈針」,研究者還模擬了兩個真實場景。

場景一:長對話聊天

讓 AI 記住長達十幾萬字的聊天記錄,然后回答一個關于其中細節的問題。同時設置了一個對比組,只給 AI 看了包含答案的那一小段話。

結果毫無懸念:所有模型在只看“重點摘要”時都是學霸,但一旦面對完整的“聊天史”,成績立刻一落千丈。

場景二:「復讀機」任務

這是一個看似無腦的任務:讓 AI 精確地復制一段超長的、由同一個詞組成的文本,比如「蘋果 蘋果 蘋果...」,其中只有一個詞被換成了「香蕉」。

這考驗的是 AI 在長輸入、長輸出任務下的穩定性和精確性。

結果,AI 們的表現簡直是大型翻車現場:

  • 有的直接罷工,拒絕回答。
  • 有的復讀到一半,就開始胡言亂語。
  • 還有的干脆把那個唯一的「香蕉」給忘了,或者放錯了位置。

▲ 隨著文本變長,Gemini 的表現越來越不穩定

A 君說:這說明,別說讓 AI 理解長文本了,有時候,讓它原封不動地“搬運”長文本都做不到。

寫在最后:別迷信參數,要敬畏「上下文」

這項研究給我們所有 AI 用戶和開發者敲響了警鐘。

「百萬 token」的上下文窗口固然是了不起的技術進步,但它絕不等于模型就能完美地利用這些信息。AI 的長文本能力,目前還是一個脆弱、不穩定且充滿未知的領域。

這給我們帶來了最重要的啟示——「上下文工程」 (Context Engineering) 的時代來了。


對于開發者和重度用戶來說,成功的關鍵不再是簡單粗暴地把所有信息都「喂」給 AI。而是要像一位高明的導演,精心設計信息在上下文中的呈現方式

  • 關鍵信息應該放在哪里?(研究表明開頭和結尾效果最好)
  • 如何減少干擾信息?
  • 如何構建提示詞(Prompt)才能讓 AI 更容易理解?

下一次,當你發現你的 AI 在處理長文檔時胡說八道,別急著罵它“人工智障”。

想想看,是不是你給它的“劇本”,還不夠好???

原文地址:???https://research.trychroma.com/context-rot??

本文轉載自???????草臺AI???????,作者:RangerEX

收藏
回復
舉報
回復
相關推薦
精品国产免费视频| 亚洲黄色片在线观看| 国产精品国产自产拍高清av水多| 少妇愉情理伦三级| 欧美日韩中出| 丰满岳妇乱一区二区三区| 天天人人精品| 丰满少妇被猛烈进入| 久久性色av| 欧美成人小视频| 丰满圆润老女人hd| 青草伊人久久| 欧美写真视频网站| 日韩xxxx视频| 久草免费在线观看| 91美女蜜桃在线| 91精品美女在线| √资源天堂中文在线| 亚洲精品va| 亚洲天堂网在线观看| 中文字幕制服丝袜| 91在线成人| 午夜精品一区二区三区免费视频| 在线视频福利一区| 九色视频在线观看免费播放| 国产精品乡下勾搭老头1| 国产精品a久久久久久| 免费在线视频一区二区| 欧美国产一区二区三区激情无套| 日韩国产一区三区| 26uuu国产| 国产一区一区| 欧美日韩中文精品| 国产极品粉嫩福利姬萌白酱 | 91在线码无精品| 成人www视频在线观看| 无码aⅴ精品一区二区三区| 在线欧美日韩| 久久91精品国产91久久跳| 亚洲自拍偷拍图| 欧美成a人免费观看久久| 日韩精品一区二区在线观看| 天堂中文av在线| 国产成人精选| 欧美视频三区在线播放| caopor在线视频| 成人午夜视屏| 色综合欧美在线视频区| 国产黄视频在线| 高潮在线视频| 午夜不卡av在线| 加勒比成人在线| 2021中文字幕在线| 亚洲成av人片一区二区三区| 久久艹国产精品| 国产后进白嫩翘臀在线观看视频| 洋洋av久久久久久久一区| 特级西西444| 亚洲91av| 午夜伊人狠狠久久| 久久国产成人精品国产成人亚洲| 国产99在线观看| 狠狠干狠狠久久| 男人亚洲天堂网| 97欧美成人| 精品视频色一区| 国产又粗又长又爽又黄的视频| 欧美性生活一级| 欧美一区二区三区在线电影| 精品人妻一区二区三| 亚洲综合网站| 亚洲精品99999| 精品无码一区二区三区| 欧美激情在线精品一区二区三区| 伊人久久五月天| 老司机精品免费视频| 国产精品久久久久久影院8一贰佰| 日韩三级影视基地| 久久网免费视频| 久久国产精品99国产| 国产精品精品久久久| 国产女人18毛片18精品| 国产盗摄精品一区二区三区在线| 国产亚洲精品自在久久| 精彩国产在线| 亚洲日本丝袜连裤袜办公室| 国产精品一线二线三线| 日韩一区二区三区在线免费观看 | 久久av导航| 日韩一区二区精品视频| 久久久久久久久久久久久久久久久 | 国产精品白丝jk白祙喷水网站| 国产99午夜精品一区二区三区| 性插视频在线观看| 中文字幕 久热精品 视频在线| 麻豆传媒网站在线观看| 中文字幕乱码在线播放| 欧美精品乱码久久久久久按摩| 亚洲av成人精品一区二区三区| 国产欧美一区二区三区精品观看 | 欧美一级精品在线| 91av在线免费| 亚洲五月综合| 日韩av色综合| 国产高清免费在线观看| 久久久国产精品不卡| 亚洲欧洲一区二区福利| xxx在线免费观看| 欧美午夜电影一区| 艳妇乳肉亭妇荡乳av| 999国产精品永久免费视频app| 午夜精品久久久久久99热| 91精品国自产| 久久精品欧美日韩精品| 中国丰满熟妇xxxx性| 日韩专区视频网站| 亚洲欧美制服综合另类| 久久高清无码视频| 精彩视频一区二区| 日本精品一区二区三区高清 久久 日本精品一区二区三区不卡无字幕 | 麻豆91蜜桃| 色爱综合区网| 制服丝袜激情欧洲亚洲| 人妻av无码一区二区三区| 亚洲激情网址| ts人妖另类在线| 黄色网页在线免费观看| 欧美午夜理伦三级在线观看| 国产艳俗歌舞表演hd| 亚洲午夜av| 97免费资源站| 好了av在线| 欧美日韩mp4| av电影在线不卡| 久久资源在线| 欧美日韩国产不卡在线看| 182在线播放| 亚洲高清在线观看| 久久久久久激情| 成人综合在线观看| 欧美一区二区三区综合| 国产精品日本一区二区三区在线 | av免费播放网站| 日韩在线播放一区二区| 欧美日本国产精品| 婷婷激情一区| 在线视频中文亚洲| 中文字幕乱码人妻无码久久| 国产欧美精品区一区二区三区| 国产无套内射久久久国产| 香蕉久久精品日日躁夜夜躁| 91精品成人久久| 五月天婷婷激情网| 高跟丝袜一区二区三区| 亚洲成人av免费在线观看| 国产日韩亚洲| 欧美亚洲一级二级| 日本一区免费网站| 波霸ol色综合久久| 国产偷拍一区二区| 亚洲国产精品久久久久婷婷884| 性生活在线视频| 亚洲精品影视| 欧美日韩大片一区二区三区| 成人国产一区| 九九综合九九综合| 色香蕉在线视频| 一本久道久久综合中文字幕 | 九九热99视频| 亚洲二区三区不卡| 国产99在线免费| 中文字幕在线看片| 在线亚洲午夜片av大片| 97成人在线观看| 亚洲国产精品一区二区www| 中文字幕在线免费看线人 | 亚欧美一区二区三区| 合欧美一区二区三区| 精品高清视频| 97成人超碰| 久久久久久久久久久人体| 亚洲欧洲精品视频| 欧美日韩另类一区| 久久久久黄色片| 欧美国产精品久久| 丰满少妇一区二区三区专区| 99视频精品免费观看| 亚洲精品一区二区毛豆| 亚洲午夜免费| 国产精品久久二区| 激情影院在线| 一区二区三区四区在线观看视频| 国产美女www爽爽爽视频| 午夜av电影一区| 欧美风情第一页| 久久综合狠狠综合久久激情 | 国产成人a v| 亚洲激情成人在线| 久久国产柳州莫菁门| 国产成人精品影视| 手机看片一级片| 亚洲一区区二区| 久久天天东北熟女毛茸茸| 九九久久精品| 国产精品xxxx| 日韩成人综合网站| 欧美在线激情网| 污污的网站在线免费观看| 亚洲色图综合久久| 成人久久久精品国产乱码一区二区 | 亚洲精品一二三**| 国产精品久久97| 蜜桃av.网站在线观看| 欧美成人精品不卡视频在线观看| 精品三级久久久久久久电影聊斋| 欧美videossexotv100| 一二三区中文字幕| 在线观看视频欧美| 精品久久免费视频| 亚洲免费色视频| 免费在线观看a视频| 91麻豆文化传媒在线观看| 色诱av手机版| 国产美女久久久久| 超碰超碰在线观看| 久久婷婷av| 香港三级韩国三级日本三级| 国产精品porn| 毛片在线视频观看| 91成人网在线观看| 一区二区三区久久网| 不卡av一区二区| 日本欧美精品久久久| 欧美一区 二区| 久久66热这里只有精品| 林ゆな中文字幕一区二区| 国产精品视频在线免费观看| 免费观看在线一区二区三区| 成人免费福利视频| 日日夜夜亚洲| 成人综合国产精品| 国产精选久久| 亚洲精品日韩激情在线电影| 亚洲a成人v| 亚洲综合精品一区二区| 超碰国产精品一区二页| 91久久久亚洲精品| 欧美三电影在线| 57pao国产成永久免费视频| 免费在线视频一区| 久久综合伊人77777麻豆最新章节| 久久久精品午夜少妇| av动漫免费看| 日韩av电影天堂| 日本人69视频| 国产精品911| 欧美成人精品一区二区综合免费| 盗摄精品av一区二区三区| 黄色国产在线视频| 99国产精品久久久久| 九色porny自拍视频| 国产日韩v精品一区二区| 亚洲理论片在线观看| 国产精品午夜在线| 中文字幕五月天| 亚洲国产一区二区视频| 国产手机在线视频| 欧美日韩亚洲一区二区| 69视频免费看| 56国语精品自产拍在线观看| 午夜精品久久久久久久91蜜桃| 精品国产成人在线影院| 爽爽视频在线观看| 在线电影中文日韩| 国产超级va在线视频| 韩国日本不卡在线| 国产精品久久久久av电视剧| 国产一区二区色| 成人高潮视频| 欧洲一区二区日韩在线视频观看免费 | 青青草华人在线视频| 亚洲精品高清在线| 成人毛片18女人毛片| 欧美日韩一级二级三级| www.蜜桃av.com| 亚洲人在线观看| 动漫一区在线| 日本高清视频一区| 久久av偷拍| 秋霞久久久久久一区二区| 91精品国偷自产在线电影| 搞av.com| 久久精品国产一区二区三| 亚洲国产精品自拍视频| 中文字幕欧美三区| 日本一级淫片免费放| 欧美视频精品在线观看| 黄色三级网站在线观看| www.久久久久久.com| 免费一二一二在线视频| 国产在线视频一区| 亚洲自拍偷拍图| 99久久免费视频.com| 最新日韩免费视频| 午夜欧美一区二区三区在线播放| 中文字幕网址在线| 日韩精品999| 日本天码aⅴ片在线电影网站| 日韩av免费在线看| avtt综合网| 制服丝袜综合日韩欧美| 久久精品日韩欧美| 亚洲成a人无码| 亚洲欧洲制服丝袜| 中文字幕在线观看第二页| 亚洲国产精品小视频| 亚洲小说区图片| 国产综合色香蕉精品| 激情五月综合网| 国产在线观看福利| 成人av片在线观看| 日韩黄色免费观看| 欧美精品乱码久久久久久| 国产系列在线观看| 欧美在线播放视频| 91成人精品在线| 久久天天东北熟女毛茸茸| 卡一卡二国产精品| 影音先锋男人在线| 在线精品视频小说1| 日本亚洲欧美| 97在线精品视频| 久久综合另类图片小说| 成人免费在线视频播放| 国产在线一区二区综合免费视频| 五月天精品在线| 欧美最猛性xxxxx直播| 精品三级久久久久久久电影聊斋| 欧美一区二区.| 色婷婷综合久久久久久| 又粗又黑又大的吊av| 不卡的av网站| 中文字幕在线观看免费视频| 亚洲激情在线观看视频免费| wwwwxxxx在线观看| 国产亚洲欧美一区二区 | 亚洲欧洲日韩av| 正在播放木下凛凛xv99| 中文字幕日韩在线播放| 亚洲福利影视| 91社在线播放| 国产麻豆日韩欧美久久| 九九热国产精品视频| 精品国产青草久久久久福利| 国产乱码午夜在线视频 | 日本国产在线| 日本不卡视频在线播放| 国产一区二区三区日韩精品| 一区二区成人网| 亚洲女子a中天字幕| 亚洲国产成人在线观看| 91精品国产一区| 欧美色图一区| 亚洲欧美日韩一二三区| 一级中文字幕一区二区| 婷婷国产在线| 国产免费亚洲高清| 欧美日本一区二区高清播放视频| 77777少妇光屁股久久一区| 手机在线免费av| 国产精品嫩草在线观看| 亚洲欧美视频| 在线观看日本黄色| 日韩一卡二卡三卡| 涩涩视频在线| 在线看视频不卡| 成人18视频在线播放| 日本视频网站在线观看| 日韩中文字幕网址| 97一区二区国产好的精华液| 男女午夜激情视频| 亚洲天堂av一区| 深夜福利免费在线观看| 国产精品精品久久久| 欧美午夜视频| 在线国产视频一区| 日韩欧美的一区二区| 波多野结衣亚洲一二三| 99re99热| 久久久久久久久久久电影| 国产成人精品a视频| 青草热久免费精品视频| 亚洲深深色噜噜狠狠爱网站| 毛茸茸多毛bbb毛多视频| 777欧美精品| 澳门成人av网| av久久久久久| 国产精品不卡在线观看| 亚洲欧美自偷自拍| 91av一区二区三区|