精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大模型知道自己在瞎說,但是無法停下來!華人團隊研究發現:2000token以后,大模型就開始表演“詞語沙拉” 原創

發布于 2025-11-7 17:07
瀏覽
0收藏

編輯 | 聽雨

出品 | 51CTO技術棧(微信號:blog51cto)

推理型大語言模型(LRM),像 ChatGPT-5、Claude 3.5、Gemini 1.5 Pro 等模型,能生成長篇、結構化的推理文本來說明自己的思考過程,比傳統LLM的推理能力更強,這已經不是什么稀奇事了。

但一項來自明尼蘇達大學、萊斯大學、史蒂文斯理工學院和 Lambda Inc 的華人團隊最新研究指出,LRM在執行推理任務時,會“陷入語言循環”,生成大量無意義的廢話,并且迅速燒掉你的 token。

研究者為此起了一個很生動的名字,“詞語沙拉”(Word Salad)。顧名思義:模型把詞語像生菜一樣不斷攪拌、重復、堆疊,看起來很豐盛,其實沒什么營養。

而更震撼的發現是,模型也會意識到自己在瞎說,但依然無法控制自己停下來。

大模型知道自己在瞎說,但是無法停下來!華人團隊研究發現:2000token以后,大模型就開始表演“詞語沙拉”-AI.x社區

一、推理模型的隱形漏洞:詞語沙拉

研究團隊指出,LRM的“思維鏈”推理的代價極高。每一步內部生成的文本都要被再次解碼、存儲、預測,計算開銷遠超普通對話模型。而且,模型并非總在“思考”——很多時候,它只是在不停地說廢話。

“我們觀察到,LRM 在生成長鏈推理時,會出現一種‘幻覺式贅述’現象:重復先前的句子結構、枚舉無關情況、或在解釋中兜圈子。它們在形式上表現為推理,但在語義上是空洞的。”

以往的研究(如《Demystifying Long Chain-of-Thought Reasoning in LLMs》《Small Models Struggle to Learn from Strong Reasoners》)指出,大模型在 CoT 推理中容易出現“過度思考”現象:即輸出大量重復、松散的解釋句式,以掩蓋其邏輯不確定性。

而研究團隊在分析 DeepSeek-R1-Distill 系列模型時發現,在 GPQA-Diamond 數據集任務中:平均超過 55% 的生成 token 屬于“詞語沙拉”,即語義重復、無增量價值的內容。

大模型知道自己在瞎說,但是無法停下來!華人團隊研究發現:2000token以后,大模型就開始表演“詞語沙拉”-AI.x社區圖片

這意味著,用戶在每次推理調用中,有一半的費用都被浪費在模型的“語言循環”上。

更關鍵的是,研究者發現這種行為并非偶然隨機,而是可預測的模式:

  • 在模型陷入循環前后,隱藏狀態的分布發生明顯變化;
  • 某些 token(特別是 \n\n)后面的狀態信號能準確預示模型是否“失控”;
  • 模型在內部表現出一種“覺察到自己在重復”的信號。

二、AI的“去水”神器:WordSaladChopper

為了解決這個問題,研究者的想法非常簡單粗暴:

如果模型在內部“知道自己在胡說八道”,那么我們就可以直接監聽它的隱藏層信號,在它開始胡說時立刻把它打斷。

他們提出了一個框架,叫WordSaladChopper(詞語沙拉切斷器) 。它的原理非常直接:1?? 在模型生成推理時,監控每個段落(以雙換行符分割);2?? 如果連續兩個段落的隱藏狀態顯示“循環模式”,3?? 系統立刻切斷生成,并自動補上提示讓模型“從這里重新回答”。

大模型知道自己在瞎說,但是無法停下來!華人團隊研究發現:2000token以后,大模型就開始表演“詞語沙拉”-AI.x社區圖片

目前在github上已經開源:https://github.com/wenyaxie023/WordSaladChopper

實驗全部在單臺 NVIDIA H100 GPU 上進行。研究者主要在 o1-mini 模型(OpenAI 推理型模型) 上運行實驗,并將結果與 GPT-4o-mini 以及 Claude 3.5-sonnet 進行對比,以驗證問題的普遍性。

所有測試均使用 S1 benchmark(由 OpenAI 發布的 reasoning-focused 評測集),該數據集包含大量需要多步推理、算術運算或邏輯歸納的題目。對于每個模型,研究者共生成 1000 條推理軌跡(reasoning traces),每條軌跡約 1000–3000 token。

訓練用于檢測“詞語沙拉”的分類器時,他們將軌跡按雙換行符劃分為片段(chunk),每個 chunk 的最后一個 token 的隱藏狀態作為輸入特征。訓練目標是預測每個 chunk 是否屬于“詞語沙拉”循環。

為評估方法效果,研究者使用以下指標:

  1. Precision(精確率):被判定為“詞語沙拉”的片段中,實際為“詞語沙拉”的比例。
  2. Recall(召回率):所有真實“詞語沙拉”片段中,被正確檢測到的比例。
  3. F1 分數:精確率與召回率的調和平均。
  4. Token budget waste(Token 消耗浪費):重復循環所占的輸出 token 比例。

此外,他們還關注了兩個定性指標:

  • 模型是否在陷入循環后仍嘗試“自我修正”;
  • 在檢測到循環后手動終止生成并重新提示時,模型能否成功繼續回答。

大模型知道自己在瞎說,但是無法停下來!華人團隊研究發現:2000token以后,大模型就開始表演“詞語沙拉”-AI.x社區圖片

結果發現:

1. 詞語沙拉的廣泛存在性

“詞語沙拉循環”不僅存在于 o1-mini,也普遍出現在其他推理型模型中。Claude 3.5、GPT-4o-mini 在長推理任務中,都出現了明顯的自我重復現象。

尤其在數學推理 和多步邏輯任務中,模型常在 2000–4000 token 之后陷入無意義的長段自我解釋、重述、或對“自身思路”的重復反芻。

“在 1000 條推理軌跡中,約有 61% 的軌跡出現過至少一次詞語沙拉循環,平均浪費了 23% 的解碼預算。”

2. 分類器檢測效果

線性分類器在僅使用隱藏狀態(無需額外輸入或模型修改)的情況下,就能以較高精度檢測出這些重復片段:

大模型知道自己在瞎說,但是無法停下來!華人團隊研究發現:2000token以后,大模型就開始表演“詞語沙拉”-AI.x社區

研究者分析了模型的隱藏狀態,發現當模型陷入“詞語沙拉循環”時,內部激活信號會出現非常明顯的模式變化。

這也是論文最震撼的發現,不是模型啰嗦——而是它“知道自己在啰嗦”。

模型的神經層在“語義混亂”時,會呈現出特征性波動。換句話說,AI 自己知道自己開始胡說八道了。

只不過,它停不下來。就像一個講不出重點的發言人,只能不停補充、重復、重述,以維持表面的“邏輯連貫”。

3. 干預后的改進

在檢測器實時接入后,當系統監測到連續兩個片段被判定為“詞語沙拉”時,就會終止生成并發出固定再生成提示。結果表明:

  • 在不訓練模型本身的情況下,最多可縮短57%的輸出
  • 對整體正確率的影響可以忽略
  • 推理延遲顯著降低

大模型知道自己在瞎說,但是無法停下來!華人團隊研究發現:2000token以后,大模型就開始表演“詞語沙拉”-AI.x社區圖片

大模型知道自己在瞎說,但是無法停下來!華人團隊研究發現:2000token以后,大模型就開始表演“詞語沙拉”-AI.x社區圖片

三、為什么推理模型特別容易陷入“詞語沙拉”

作者提出了三種主要原因:

  1. 長上下文窗口模型能“記住”自己說過的廢話,從而把它再度引用、重組,形成自我循環。
  2. 高一致性偏好推理型模型被訓練成要維持語言流暢、思維連貫,即使已經偏題,也會強行“接著講完”。
  3. 缺乏顯式終止條件當前推理架構沒有“我想不出來了”的機制,因此在邏輯死胡同時,只能繼續生成表面合理的文字。

這三點共同導致模型在推理任務中,更容易“過度思考”,甚至產生語言幻覺。

四、“AI的幻覺”,其實也是算力幻覺

這篇論文還有另一個隱含觀點:

我們一直以為模型的“幻覺(hallucination)”是事實錯誤,但它也可能是算力層面的幻覺——模型把計算資源浪費在無意義的循環上,卻仍然“自信滿滿”。

研究者批評了目前業界和學界用于評估推理模型性能的標準(如 GSM8K、MATH、GPQA 等)本身存在缺陷。這些 benchmark 關注模型是否“答對”,但很少衡量模型是否高效、是否在浪費預算。

“我們認為,許多所謂的‘高效推理方法’之所以看起來有效,部分原因是評估基準本身過于寬松。一旦未來出現更全面的評測體系,許多被吹捧的高效推理方法可能會徹底失效,或表現與原生模型完全不同。”

這其實也是對整個“CoT(思維鏈)熱潮”的一次隱性反思:

當前模型的“推理能力”,有相當部分只是看起來在思考,而不是真正地在推理。

那么,評論區的各位大佬們:

你用 AI 時,有沒有遇到它“越解釋越離譜”的情況?如果 AI 能自己檢測到在胡說八道,并停下來,你會更信任它嗎?

參考鏈接:https://arxiv.org/pdf/2511.00536

本文轉載自??51CTO技術棧??,作者:聽雨

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏
回復
舉報
回復
相關推薦
91精品国产综合久久香蕉922| 亚洲免费精彩视频| a级免费在线观看| 性感美女视频一二三| 日韩成人精品在线观看| 久久久国产精品视频| 欧美肉大捧一进一出免费视频 | 日韩免费在线免费观看| 久久精品一区二区三区四区五区| 国内精品偷拍| 欧美日韩色综合| 波多野结衣乳巨码无在线| 在线观看免费网站黄| 成人免费毛片高清视频| 国产成人一区二区三区电影| 男女做暖暖视频| 禁断一区二区三区在线| 日韩欧美国产三级电影视频| 情侣黄网站免费看| 色呦呦呦在线观看| 国产精品视频在线看| 久久riav二区三区| jizz国产视频| 久久精品国产久精国产| 全球成人中文在线| 国产在线拍揄自揄拍| 欧美残忍xxxx极端| 亚洲图片制服诱惑| 99re久久精品国产| 日本在线视频一区二区三区| 欧美中文字幕一区| 日本一本二本在线观看| 国产三级伦理在线| 有坂深雪av一区二区精品| 日韩亚洲视频在线| 欧美精品少妇| 99精品视频一区二区三区| 亚洲在线视频福利| 91久久国语露脸精品国产高跟| 国产精品老牛| 亚洲91av视频| 国产稀缺真实呦乱在线| 综合日韩在线| 欧美久久精品一级黑人c片| 国产又黄又粗视频| 精品国产一区二区三区四区| 亚洲男人天堂久| 中文字幕一区二区人妻在线不卡| 久久亚洲道色| 欧美精品一区二区蜜臀亚洲| 五月天丁香花婷婷| 日韩一级视频| 91精品免费观看| 亚洲精品综合在线观看| 欧美视频免费看| 欧美另类一区二区三区| 欧美日韩精品区别| 麻豆国产一区| 欧美xxx久久| a级一a一级在线观看| 欧美精品中文| 亚洲桃花岛网站| 成人黄色a级片| 色97色成人| 美乳少妇欧美精品| 久久精品国产av一区二区三区| 亚洲一级影院| 国产91精品黑色丝袜高跟鞋| 国产无套丰满白嫩对白| 日日夜夜一区二区| 成人国产精品久久久久久亚洲| 国产农村妇女毛片精品| 国产a精品视频| 国产日韩欧美二区| 国产综合在线观看| 国产精品国产三级国产aⅴ中文| 热这里只有精品| 高清电影在线免费观看| 狠狠色香婷婷久久亚洲精品| 北条麻妃在线视频| 韩国一区二区三区视频| 亚洲韩国青草视频| 亚洲图片第一页| 欧美三级午夜理伦三级中文幕| 久久久久久国产| 夜夜躁日日躁狠狠久久av| 久久成人免费网| 国产日韩欧美二区| 一级日本在线| 亚洲成a天堂v人片| www.夜夜爽| 国产精品15p| 中文在线资源观看视频网站免费不卡| 2025国产精品自拍| 久久一区精品| 99热最新在线| 国产福利小视频在线观看| 一区二区三区免费网站| 不要播放器的av网站| 日韩中文字幕无砖| 夜夜嗨av色综合久久久综合网| 日韩福利小视频| 久久精品麻豆| 国产精品一区二区在线观看| yw193.com尤物在线| 亚洲一区二区偷拍精品| 国产精品一区二区小说| 欧美电影在线观看完整版| 色婷婷久久av| 国产三级精品三级在线观看| 国产成人午夜电影网| 日韩欧美视频一区二区| 黑人精品视频| 这里只有精品视频在线观看| 五月天综合视频| 亚洲美女黄色| 亚洲综合中文字幕68页| 91在线免费看| 色婷婷综合久色| 日本一级大毛片a一| 99精品视频在线观看播放| 国产精品igao视频| 日本护士...精品国| 亚洲国产精品精华液网站| 日本中文字幕精品—区二区| 色综合综合网| 欧美一级淫片播放口| 天堂av资源网| 亚洲国产视频网站| 亚洲区 欧美区| 亚洲一级淫片| 亚洲在线第一页| 欧美a在线看| 3d成人h动漫网站入口| 在线视频第一页| 久久久噜噜噜| 欧美日韩在线精品一区二区三区| av成人 com a| 亚洲精品久久7777777| www.av视频在线观看| 国产成人综合自拍| 999一区二区三区| gogo人体一区| 久久久免费在线观看| 黄色小视频免费观看| 亚洲午夜精品网| 国产乱国产乱老熟300部视频| 欧美人成在线| 国产精品大全| 蜜桃av在线播放| 国产视频久久网| 久久久精品毛片| 欧美激情一区三区| 91亚洲免费视频| 国产精品videosex性欧美| 成人天堂噜噜噜| www.久久ai| 亚洲成人黄色在线观看| 日韩精品成人在线| 2017欧美狠狠色| 婷婷激情四射五月天| 久久要要av| 91传媒视频免费| 91桃色在线观看| 亚洲男人天堂手机在线| 亚洲视频中文字幕在线观看| 亚洲欧洲日韩女同| 亚洲丝袜在线观看| 一区二区日本视频| 天堂√在线观看一区二区| 国产亚洲精品精品国产亚洲综合| 久久影院免费观看| 男人天堂网在线视频| 欧美性猛交xxxx乱大交蜜桃| 在线视频第一页| 国产乱码一区二区三区| 岛国大片在线播放| 欧美最新另类人妖| 91青青草免费在线看| 日韩深夜视频| 深夜成人在线观看| 免费看国产片在线观看| 在线亚洲一区二区| 国产波霸爆乳一区二区| 99精品热视频| 超碰人人草人人| 日韩午夜高潮| 一本—道久久a久久精品蜜桃| 成人看片黄a免费看视频| 国产精品第10页| 日本伦理一区二区| 国产午夜精品一区理论片飘花| 国产人妖一区二区| 色婷婷亚洲精品| 久久久久久久久久久久久久免费看| 久久综合久久综合亚洲| 中文字幕乱码在线人视频| 免费精品视频| 四虎4hu永久免费入口| 少妇精品久久久一区二区| 999在线免费观看视频| 国产v综合v| 韩国精品美女www爽爽爽视频| 日本福利专区在线观看| 日韩激情视频在线播放| 国产不卡av在线播放| 在线亚洲免费视频| av大片在线免费观看| 亚洲柠檬福利资源导航| 国产7777777| 久久久精品免费免费| 又黄又色的网站| 精品一区二区三区av| 男人亚洲天堂网| 最新亚洲视频| 97中文字幕在线| 91影院成人| 日韩欧美在线观看强乱免费| 激情小说一区| 高清不卡一区二区三区| 精品亚洲a∨一区二区三区18| 国产精品电影网| 少妇视频一区| 欧美亚洲另类制服自拍| av老司机在线观看| 欧美黑人又粗大| 日韩专区av| 久久香蕉国产线看观看av| 在线观看二区| 在线电影av不卡网址| 美女毛片在线看| 亚洲人成在线一二| 青青草在线免费观看| 日韩精品中文字幕视频在线| 日批视频免费播放| 亚洲成年网站在线观看| 黄色av网址在线| 精品国产一区二区国模嫣然| 国产夫妻性生活视频| 欧美一区日韩一区| 国产三级漂亮女教师| 538prom精品视频线放| 中文字字幕在线中文乱码| 欧美日免费三级在线| 中文字幕精品一区二| 欧美伊人久久久久久久久影院 | 97人人爽人人澡人人精品| 欧美激情精品久久久久久大尺度| 色爱综合区网| 97精品久久久| 国模套图日韩精品一区二区| 欧美做受高潮1| 日韩一区二区三区在线免费观看 | 萌白酱国产一区二区| 91网址在线观看| 欧美激情18p| 国产福利片在线观看| 欧美在线激情网| 欧美中文字幕精在线不卡| 国产精品久久久久久亚洲影视 | 久久久精品五月天| 激情网站五月天| 麻豆成人久久精品二区三区红 | 亚洲福利网站| 亚洲欧洲免费无码| 91成人精品视频| 欧美狂野激情性xxxx在线观| 亚洲看片免费| 好男人www社区| 国产一区二区三区久久久| 免费黄视频在线观看| 9人人澡人人爽人人精品| 公肉吊粗大爽色翁浪妇视频| 亚洲欧洲一区二区三区| 精品亚洲永久免费| 色诱视频网站一区| 99久久精品免费看国产交换| 亚洲二区中文字幕| 搞黄视频免费在线观看| 久久亚洲精品成人| 国产精品原创| 国产日韩欧美日韩| 久久99偷拍| 亚洲欧美影院| 国产日韩一区二区三区在线播放| 一区二区xxx| 成人美女视频在线观看| 亚洲一二三精品| 亚洲国产一区视频| 中文字幕精品一区二区精| 精品国产髙清在线看国产毛片 | 欧美情侣性视频| videos性欧美另类高清| 成人免费在线视频网站| 色天下一区二区三区| 正在播放91九色| 性欧美暴力猛交另类hd| 黄色a级三级三级三级| 久久亚洲综合色| 不卡的免费av| 在线播放一区二区三区| 日韩精品视频无播放器在线看| 久久色在线播放| 午夜av成人| 精品无码久久久久久久动漫| 亚洲女同一区| 国产三级三级三级看三级| 国产成人av福利| 午夜爽爽爽男女免费观看| 色域天天综合网| 天天干天天操av| 欧美超级免费视 在线| 91九色综合| 欧美久久久久久久| 亚洲韩日在线| 国产成人精品综合久久久久99| 国产精品欧美极品| 午夜一级黄色片| 亚洲欧美日韩爽爽影院| 久草在线视频资源| 91麻豆精品秘密入口| 欧美电影免费观看高清| 天堂av在线网站| 国产天堂亚洲国产碰碰| 性无码专区无码| 亚洲精品aⅴ中文字幕乱码| 怡红院在线播放| 91视频网页| 亚洲在线久久| 在线视频一二区| 亚洲视频中文字幕| 国产农村老头老太视频| 俺去亚洲欧洲欧美日韩| 台湾天天综合人成在线| 色之综合天天综合色天天棕色| 国产视频亚洲| 亚洲国产欧美视频| 欧美性videos高清精品| 欧美欧美欧美| 国产va免费精品高清在线观看 | 亚洲深夜福利在线| 一区二区精品伦理...| 中文字幕一区二区三区四区| 亚洲免费久久| 久久久噜噜噜| 日本少妇xxxxx| 欧美日韩一二三| 激情影院在线观看| 91在线视频精品| 欧美天天视频| 亚洲少妇中文字幕| 午夜伦欧美伦电影理论片| 亚洲aⅴ乱码精品成人区| 欧美亚洲成人xxx| 精品久久成人| 五月激情婷婷在线| 亚洲最色的网站| 日本激情视频网站| 91av视频在线播放| 欧美综合另类| 日本亚洲一区二区三区| 亚洲综合色在线| 五月婷婷丁香花| 国产精品久久久久999| 欧美韩国日本在线观看 | 国产一级一级国产| 国产亚洲欧洲黄色| 国产精品一区二区三区四区在线观看| a级网站在线观看| 波多野结衣中文字幕一区 | 美女av在线免费看| 日韩精品伦理第一区| 韩国三级在线一区| 日本在线免费观看| 在线观看日韩av| 免费观看亚洲天堂| 内射国产内射夫妻免费频道| 国产欧美精品国产国产专区| 国产女主播福利| 91国产一区在线| 欧美1级片网站| 亚洲一区二区三区无码久久| 欧美人妇做爰xxxⅹ性高电影| 日本在线视频www鲁啊鲁| 欧美高清一区二区| 国产美女主播视频一区| 欧美一二三区视频| www.亚洲天堂| 亚州国产精品| www.桃色.com| 欧美日韩中文字幕| av片在线观看免费| 日本高清一区| 成人动漫精品一区二区| 一二三区中文字幕| 欧洲亚洲女同hd| 欧美激情综合| 美国一级黄色录像| 亚洲精选在线观看| 2020国产精品极品色在线观看|