精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

推理越多,幻覺越重?多模態推理模型的「幻覺悖論」

人工智能 新聞
多模態推理模型真的「越想越明白」嗎?研究表明,R1系列模型在推理鏈條加長的過程中,其視覺感知能力出現下降趨勢,生成內容有時會偏離圖像本身,出現「看見」不存在事物的幻覺現象。

在多模態大模型的飛速發展中,R1 系列多模態推理模型憑借顯式的長鏈推理機制,在復雜任務中屢屢突破傳統「快思考」范式的性能瓶頸。

然而,研究發現,隨著推理鏈條的加長,這類模型的視覺感知能力卻呈現出明顯下滑的趨勢,逐漸轉而依賴語言先驗進行「腦補」,生成內容也越來越容易脫離圖像本身,甚至出現憑空捏造的幻覺現象。

這一「推理增強—感知削弱」的悖論,凸顯了當前多模態推理模型在推理能力與感知準確性之間面臨的平衡挑戰。

為進一步驗證這一現象,來自加州大學圣克魯茲分校、圣塔芭芭拉分校和斯坦福大學的研究團隊開展了系統性分析。

通過引入推理長度控制機制與可解釋性注意力可視化方法,研究者發現:隨著推理鏈的延長,模型對圖像內容的關注顯著下降,而對語言提示的依賴不斷增強,凸顯出語言主導下的視覺偏離趨勢。

圖片

論文鏈接:https://arxiv.org/pdf/2505.21523

項目鏈接:https://mlrm-halu.github.io

代碼鏈接:https://github.com/MLRM-Halu/MLRM-Halu 

在此基礎上,團隊提出了全新的評估指標RH-AUC,并構建了配套的診斷性基準集RH-Bench,首次系統量化了多模態推理模型在推理能力與視覺感知穩定性之間的平衡表現。

該工具不僅提升了模型幻覺風險的可測性,也為未來多模態系統的穩健性評估與改進提供了重要參考。

圖片

推理增強帶來的視覺幻覺放大效應

圖片

在當前多模態大模型的演進中,R1 類推理模型因引入顯式的長鏈語言推理過程(Reasoning Chain),在復雜任務上展現出強大的表達能力。

圖片

圖片

然而,研究人員系統性觀察到一個被廣泛忽視的現象:隨著推理鏈長度的加深,模型在感知任務中的視覺對齊能力顯著下降,幻覺風險隨之放大

這一趨勢在多組實證對比中被清晰觀察到。

例如,在圖 (b) 中,研究人員對比了多個 7B 規模的多模態模型在推理與感知兩類任務中的表現:盡管 R1-OneVision-7B 等模型在推理準確率上具備一定優勢,但其在感知任務中的準確率卻降至最低,顯著低于同規模的非推理模型(如Qwen2.5-VL-7B)。

這表明推理鏈的加深并非「無代價」的增強,而是以犧牲圖像感知能力為代價,放大了幻覺。

圖片

具體來說,當模型在圖文任務中逐步延展其語言鏈條時,原本應支撐答案的圖像證據信號卻被悄然邊緣化。

以典型視覺問答任務為例,在推理模型中生成的冗長輸出往往并未真正參考圖像內容,而是依賴語言常識「腦補」出一個聽上去合理、但圖像中并不存在的答案。這種現象在多個感知評測基準(如MMVP、MMHAL)中反復出現。

如圖所示,在多個視覺感知任務的綜合評估中,R1類模型普遍低于同規模的Base模型,尤其在需要細致圖像對齊能力的MMHAL和MMVP上,差距更為顯著。

這進一步印證了:推理鏈的增強不僅沒有提升感知質量,反而加劇了模型「脫圖而答」的幻覺傾向。

綜上,推理鏈的增強并非無代價,「更聰明」的推理模型在感知類任務上反而可能「看得更少」。

越「聰明」越容易出錯?

圖片

為了深入理解多模態推理模型為何更容易產生幻覺,研究團隊對模型內部的注意力分布進行了系統分析,揭示出一種結構性機制:推理增強并非免費午餐,它以犧牲視覺關注為代價換取語言推理能力的提升

具體來說,相較于非推理模型,R1類推理模型在生成過程中顯著減少了對視覺token的關注,取而代之的是將大量注意力分配給指令token與語言上下文(圖a)。

更為關鍵的是,這種「注意力遷移」并非固定偏差,而是隨著推理鏈條的延展而逐層加劇——越往后層,模型越傾向于忽略圖像輸入,而完全依賴語言信號進行推理。

如圖 (b) 所示,在視覺聚焦任務中,非推理模型(Qwen2.5-VL)在多層均展現出對圖中關鍵區域(如奶酪)的穩定關注;而R1模型(R1-OneVision)在同樣問題下,其注意力熱圖呈現出明顯的視覺退化,深層幾乎完全失焦。

這種結構性偏移使得模型即使面對明確依賴圖像的問題,也往往「憑語言猜」,最終生成與圖像嚴重脫節的幻覺答案。

圖片

不僅如此,研究發現這一現象在模型進入「過度思考」(Overthinking)階段時表現得尤為明顯。

隨著推理鏈的延長,模型對視覺token的關注持續減弱,而對指令等語言token的注意力則顯著增強,導致生成過程越來越依賴語言線索而非圖像內容。

圖片

推理鏈「長度悖論」:思考越多,幻覺越大?

圖片

模型推理鏈條的長短,真的越長越好嗎?研究團隊對比了三種不同的推理長度控制策略在多個基準測試中(Token Budget Forcing、Test-Time Scaling與Latent State Steering),首次系統揭示了一個關鍵現象:推理鏈條的長度與模型表現之間,呈現出非單調的「倒U型」關系

圖片

如圖所示,在以推理為主的任務中(左兩圖),模型準確率先隨推理鏈延長而提升,但當鏈條過長后反而回落,說明「過度思考」并不一定帶來更強的reasoning能力。

而在以感知為主的任務中(右兩圖),隨著推理長度的增加,幻覺率則持續上升,表明冗余語言生成會系統性干擾視覺對齊。

這一趨勢強調:合理控制推理長度,是提升模型穩健性與感知–推理平衡能力的關鍵。

RH-AUC等指標的引入,也為這一非線性關系提供了更具解釋力的定量刻畫。

RH-AUC:推理與幻覺的動態權衡評估

面對多模態模型中推理增強與幻覺放大的兩難局面,研究團隊提出了一項全新評估指標:RH-AUC(Reasoning-Hallucination Area Under Curve)

不同于傳統指標只在單一推理長度上評估準確率或幻覺率,RH-AUC從整體視角出發,衡量模型在不同推理深度下「思考力」與「看清力」的動態平衡水平

圖片

具體做法是:在新構建的RH-Bench數據集中(包含1000個跨感知與推理的樣本),分別統計模型在不同推理長度下的reasoning accuracy與hallucination risk,然后計算兩者構成曲線下的面積。

RH-AUC越高,說明模型在推理增強的同時,視覺對齊能力保持得越好——既能「想得深」,也能「看得清」。

圖片

實驗結果揭示出三個關鍵趨勢:

1. 更大規模模型更具穩健性:如圖 (a) 所示,7B 模型在不同思考深度下展現出更平滑的 RH-AUC 曲線,并在峰值處取得更高分數,說明其具備更強的推理–感知整合能力。

2. RL-only 訓練范式優于SFT+RL:如圖 (b) 所示,在不同訓練策略下,純RL訓練的模型平均 RH-AUC 均高于混合范式,尤其在長推理鏈條件下差距顯著(0.57vs0.50)。

這表明RL-only更傾向于自適應生成高質量的推理路徑,而SFT+RL更容易陷入冗余模仿,從而干擾感知判斷。

3. 數據「類型」比規模更重要:實驗發現,與其盲目擴展訓練集規模,不如引入少量具備領域感知特征的樣本(如數學推理或圖像感知任務),更有助于引導模型在「看圖」與「思考」之間實現平衡。

RH-AUC不僅填補了評估維度上的空白,也為未來多模態模型的訓練目標提供了更明確的參考方向:推理不是越多越好,保持在「看見圖像」與「想通問題」之間的張力,才是更優范式。

責任編輯:張燕妮 來源: 新智元
相關推薦

2025-06-10 03:30:00

2025-05-08 06:00:00

AI幻覺AI人工智能

2025-07-04 08:42:00

2025-02-27 10:08:19

2025-03-05 00:22:00

2025-06-13 01:00:00

人工智能大型推理模型推理模型

2025-09-15 09:43:33

分層推理模型循環網絡推理

2025-05-29 03:00:00

混合推理模型LHRMAI

2025-05-28 02:40:00

AdaptThink推理模型AI

2023-10-30 15:06:00

模型數據

2025-05-30 02:00:00

獎勵模型RRMAI

2024-12-30 12:39:29

2025-03-19 09:00:00

模型AI訓練

2025-06-11 14:39:50

AILLMMistral

2024-09-24 11:01:03

2024-12-25 09:30:00

2025-05-26 08:30:00

2023-10-29 13:30:16

多模態LLM架構
點贊
收藏

51CTO技術棧公眾號

欧美巨大丰满猛性社交| 国产精品熟女久久久久久| 欧美一区 二区| 欧美日韩午夜视频在线观看| 欧美日韩国产不卡在线看| 黄色片视频免费| 婷婷亚洲综合| 亚洲国模精品私拍| 亚洲欧美自拍另类日韩| 日本在线观看高清完整版| 91视频免费播放| 国产精品美女主播| 欧美三级免费看| 久久99久久人婷婷精品综合 | 99精品人妻国产毛片| 日本欧美肥老太交大片| 欧美成人一区二区| 成年人视频在线免费| 成人免费看片| 2024国产精品视频| 91夜夜揉人人捏人人添红杏| 毛片在线免费视频| 亚洲情侣在线| 亚洲一级免费视频| 丰满少妇xbxb毛片日本| 成人黄色视屏网站| 午夜伊人狠狠久久| 成人短视频在线看| 青青视频在线观| 国产精品一二一区| 国产精品网站视频| 欧美性猛交bbbbb精品| 欧美阿v一级看视频| 中文字幕国产精品| 强迫凌虐淫辱の牝奴在线观看| 亚洲精品777| 91福利在线导航| xxxx18hd亚洲hd捆绑| a毛片在线看免费观看| 国产亚洲一二三区| 国产在线精品一区二区中文| 精品国产999久久久免费| 日韩成人伦理电影在线观看| 欧美一区第一页| 国产系列精品av| 欧美久久99| 久热在线中文字幕色999舞| 日本精品久久久久中文| 嫩草一区二区三区| 精品久久久久久久一区二区蜜臀| 激情图片中文字幕| 欧美天堂一区二区| 欧美色国产精品| 天天操天天摸天天爽| 日韩伦理三区| 精品国产乱码久久久久久虫虫漫画| av动漫在线免费观看| 麻豆视频免费在线观看| 国产精品免费丝袜| 亚洲美女搞黄| 午夜视频在线观看网站| 中文天堂在线一区| 亚州欧美一区三区三区在线 | 久久天天躁狠狠躁老女人| 亚洲精品天堂网| 成人一区不卡| 色偷偷噜噜噜亚洲男人的天堂| 自拍偷拍你懂的| 久久中文亚洲字幕| 久久电影一区二区| 全网免费在线播放视频入口| 午夜久久福利| 久久免费视频网站| 九九热精品视频在线| 亚洲欧美视频一区二区三区| 日本乱人伦a精品| 成人黄色免费网| 久久爱另类一区二区小说| 91精品久久久久久久久久久久久| 国产又粗又猛又爽又黄91| 国产一区二区在线观看视频| 国产91精品入口17c| 人成网站在线观看| 久久久精品日韩欧美| 视频在线一区二区三区| 在线观看免费版| 一级精品视频在线观看宜春院| 欧美久久久久久久久久久久久| 亚洲优女在线| 欧美精品在线观看一区二区| 亚洲av无码久久精品色欲| 国产精品乱战久久久| 亚洲精品在线不卡| 日韩av手机在线免费观看| 黄色成人av网站| 青青草原成人在线视频| 亚洲视频在线观看一区二区| 国产成人99久久亚洲综合精品| 久久狠狠久久综合桃花| 午夜国产福利在线| 亚洲成人一二三| 亚洲第一狼人区| 精品中文在线| 一个人www欧美| 青青青在线视频| 久久中文在线| 99在线看视频| 高清在线观看av| 亚洲国产日韩一级| 杨幂毛片午夜性生毛片| 日韩成人久久| 宅男66日本亚洲欧美视频| 黄色一级视频免费观看| 日韩中文欧美在线| 国产精品美女黄网| 黄网站免费在线播放| 欧美午夜视频一区二区| 国产又粗又猛又爽又黄| 欧美三级三级| 91精品国产高清| www.成人免费视频| 中文字幕在线播放不卡一区| 美女日批免费视频| 天堂精品久久久久| 色偷偷偷综合中文字幕;dd| 亚州国产精品视频| 国产精品一区二区免费不卡| 亚洲精品日韩在线观看| 黄视频网站在线观看| 欧美一区二区性放荡片| 91视频免费看片| 久久久999| 麻豆av一区二区| 性国产高清在线观看| 欧美视频精品在线| 国产色视频一区二区三区qq号| 午夜日韩激情| 2019国产精品视频| 日本中文字幕电影在线免费观看| 欧洲色大大久久| 亚洲一区二区三区蜜桃| 国产精品呻吟| 九色91视频| 国产福利电影在线播放| 欧美成人a∨高清免费观看| 国产精品久久久免费看| 人禽交欧美网站| 亚洲精品国产系列| 欧美成人三级| www.日韩不卡电影av| 伊人亚洲综合网| 国产精品美女久久久久久久网站| 亚洲精品高清无码视频| 国产99久久精品一区二区300| 38少妇精品导航| 亚洲欧洲精品视频| 欧美午夜电影在线| 在线免费观看麻豆| 日韩专区一卡二卡| 视频在线一区二区三区| 久久久国产精品网站| 最近2019中文字幕大全第二页 | 亚洲第一在线综合在线| av在线一区不卡| 日韩中文字幕在线视频播放| 一本色道久久综合熟妇| 亚洲天堂免费在线观看视频| 青娱乐精品在线| 欧美激情一级片一区二区| av资源站久久亚洲| 国产精品13p| 亚洲精品一区久久久久久| 在线视频精品免费| 国产精品私人自拍| 一级黄色片在线免费观看| 午夜精品影院| 久久久久久久久久久久久久久久av| 亚洲最大网站| 日韩在线观看视频免费| 国产特级黄色片| 午夜精品一区在线观看| 西西444www无码大胆| 麻豆成人久久精品二区三区小说| 国产大尺度在线观看| 深夜福利一区二区三区| 欧美又大又粗又长| 欧美成年黄网站色视频| 精品免费国产一区二区三区四区| 精品欧美一区二区三区免费观看| 久久久电影一区二区三区| 天天干天天色天天干| 亚洲国产91| 亚洲毛片aa| 懂色av一区二区| 国产精品你懂得| 丝袜综合欧美| 亚洲性av网站| 欧美一区二不卡视频| 在线观看91视频| 日本午夜小视频| 国产精品嫩草99a| 亚洲男人在线天堂| 精品一区中文字幕| 热99这里只有精品| 天天色天天射综合网| 精品无人区一区二区三区竹菊| 丁香婷婷久久| 2019国产精品自在线拍国产不卡| 精品国产丝袜高跟鞋| 国产午夜精品久久久| 国产成人a人亚洲精品无码| 色婷婷综合激情| 九九视频在线观看| 国产免费成人在线视频| 一区二区免费在线观看视频| 精品午夜一区二区三区在线观看| 九色在线视频观看| 亚洲欧美一级二级三级| 亚洲乱码一区二区三区三上悠亚| 日韩高清电影免费| 国产传媒欧美日韩| 伊人久久大香伊蕉在人线观看热v 伊人久久大香线蕉综合影院首页 伊人久久大香 | 国产毛片aaa| 亚洲蜜桃精久久久久久久| 国产av自拍一区| 97成人超碰视| 国产a级片视频| 国产麻豆91精品| 天堂av在线8| 日本免费新一区视频| 久久国产成人精品国产成人亚洲| 欧美精品大片| 日韩视频在线观看视频| 欧美在线观看视频一区| 欧美亚洲免费在线| 里番精品3d一二三区| 成人91视频| 亚洲va欧美va人人爽成人影院| 成人国产精品一区| 久久91超碰青草在哪里看| 国产精品久久久久久av福利| 欧美片第1页| 欧美最猛性xxxx| 不卡av影片| 欧美一区二区三区免费观看| 国产夫妻在线| 欧洲成人免费视频| 中日韩脚交footjobhd| 97久久精品人人澡人人爽缅北| 爱情岛亚洲播放路线| 久久91精品国产91久久久| 在线午夜影院| 久久久久亚洲精品成人网小说| 黑人极品ⅴideos精品欧美棵| 欧美精品在线免费| 青春草免费在线视频| 欧美多人爱爱视频网站| 久草在线视频福利| 久久人91精品久久久久久不卡 | 国产精品吹潮在线观看| 欧美暴力调教| 国产又爽又黄的激情精品视频 | 成人国产电影在线观看| 性色av一区二区三区红粉影视| 黄色软件视频在线观看| 欧美在线视频在线播放完整版免费观看| 麻豆免费版在线观看| 热久久这里只有精品| 欧美色网在线| 91精品久久久久久久久久久久久久 | 性猛交富婆╳xxx乱大交天津| 欧美成人一区二区| 天天干天天爽天天操| 亚洲精品视频中文字幕| eeuss影院www在线播放| 俺去啦;欧美日韩| 日韩成人伦理| 欧美在线视频导航| 国产精品xxx| 91在线精品观看| 婷婷综合电影| 正在播放91九色| 伊人成人在线| 精品999在线| 成人一区二区视频| 亚洲国产日韩一区无码精品久久久| 国产精品视频第一区| 国内偷拍精品视频| 欧美日韩中文字幕在线| 亚洲天堂一二三| 精品国产sm最大网站免费看| 国产三级视频在线| 欧美日韩国产123| 欧美电影免费观看网站| 91精品在线观| 亚洲欧美日本伦理| 成人性做爰片免费视频| 亚洲美女黄色| 三上悠亚在线一区二区| 国产成人8x视频一区二区| 国产小视频自拍| 亚洲韩国一区二区三区| 久久久久久无码精品大片| 日韩欧美中文一区| 国产小视频免费在线观看| 插插插亚洲综合网| 国产精品极品美女在线观看| 懂色一区二区三区av片 | 黄色影视在线观看| 久久久久久久尹人综合网亚洲 | 337p粉嫩大胆噜噜噜噜噜91av| 欧美视频一区二区在线| 色哟哟亚洲精品| 搡老岳熟女国产熟妇| 久久久精品2019中文字幕神马| 日本不卡一二三| 国产亚洲精品久久飘花| 9191国语精品高清在线| 熟妇人妻无乱码中文字幕真矢织江 | 国产精品自产拍高潮在线观看| 久久99偷拍| 嫩草影院中文字幕| 国产综合久久久久久久久久久久| av男人的天堂av| 黄色成人在线播放| 亚洲精品人妻无码| 久久av在线看| 羞羞视频在线观看一区二区| 日韩欧美一区二区三区四区 | 国产精品视频一| 九九热爱视频精品视频| 欧美成人高潮一二区在线看| 国产999精品久久久久久绿帽| 国产精品 欧美激情| 欧美日韩在线免费视频| 国产高清一级毛片在线不卡| 日韩av色综合| 亚州综合一区| 免费成人午夜视频| 93久久精品日日躁夜夜躁欧美| 国产真实的和子乱拍在线观看| 欧美一区二区三区啪啪| 国产不卡在线| 91视频国产高清| 久久久久久久久99精品大| jizzzz日本| 国产精品久久久久一区二区三区共| 狠狠躁夜夜躁人人爽视频| 亚洲午夜小视频| 3d性欧美动漫精品xxxx软件| 欧美一区1区三区3区公司| 久久亚洲图片| 蜜臀久久99精品久久久久久| 在线视频国内一区二区| 国产福利电影在线| 国产精品ⅴa在线观看h| 成人女性视频| 成人亚洲免费视频| 亚洲摸摸操操av| 亚洲国产精品一| 6080yy精品一区二区三区| 性欧美lx╳lx╳| 91精品无人成人www| 国产精品高潮呻吟久久| 国产按摩一区二区三区| 久久久久久一区二区三区| 欧美调教在线| 日本熟妇人妻中出| 国产精品区一区二区三| av中文字幕免费| 国产91精品不卡视频| 精品久久影视| 手机av在线网站| 午夜精品久久久久久不卡8050 | 九九精品在线播放| 成人激情自拍| 女性隐私黄www网站视频| 国产精品久久久久久久久免费丝袜| 国产精品玖玖玖| 久久免费精品视频| 精品久久成人| 97中文字幕在线观看| 欧美小视频在线观看| 国精产品一区二区三区| 日本中文字幕一区| jizzjizzjizz国产| 欧美大胆人体bbbb| 欧美va在线观看| a天堂资源在线观看| 久久婷婷国产综合精品青草| 91麻豆成人精品国产| 97香蕉超级碰碰久久免费软件 | 国产一卡二卡三卡| 久久精品美女视频网站| 露出调教综合另类| 超碰人人草人人| 欧美视频中文在线看| 国产网站在线免费观看| 久久久久久久久久久一区| 精久久久久久久久久久|