精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

重磅發現!大模型的「aha moment」不是裝腔作勢,內部信息量暴增數倍!

人工智能 新聞
來自中國人民大學高瓴人工智能學院、上海人工智能實驗室、倫敦大學學院(UCL)和大連理工大學的聯合研究團隊,在最新論文中首次利用信息論這把「手術刀」,精準解剖了大模型內部的推理動態。

劉勇,中國人民大學,長聘副教授,博士生導師,國家級高層次青年人才。長期從事機器學習基礎理論研究,共發表論文 100 余篇,其中以第一作者/通訊作者發表頂級期刊和會議論文近 50 篇,涵蓋機器學習領域頂級期刊 JMLR、IEEE TPAMI、Artificial Intelligence 和頂級會議 ICML、NeurIPS 等。

你肯定見過大模型在解題時「裝模作樣」地輸出:「Hmm…」、「Wait, let me think」、「Therefore…」這些看似「人類化」的思考詞。

但一個靈魂拷問始終存在:這些詞真的代表模型在「思考」,還是僅僅為了「表演」更像人類而添加的語言裝飾?是模型的「頓悟時刻」,還是純粹的「煙霧彈」?

現在,實錘來了!來自中國人民大學高瓴人工智能學院、上海人工智能實驗室、倫敦大學學院(UCL)和大連理工大學的聯合研究團隊,在最新論文中首次利用信息論這把「手術刀」,精準解剖了大模型內部的推理動態,給出了令人信服的答案:

當這些「思考詞」出現的瞬間,模型大腦(隱空間)中關于正確答案的信息量,會突然飆升數倍!

這絕非偶然裝飾,而是真正的「信息高峰」與「決策拐點」!更酷的是,基于這一發現,研究者提出了無需額外訓練就能顯著提升模型推理性能的簡單方法,代碼已開源!

圖片

核心發現一:揭秘大模型推理軌跡中的「信息高峰」現象

研究者們追蹤了像 DeepSeek-R1 系列蒸餾模型、QwQ 這類擅長推理的大模型在解題時的「腦電波」(隱空間表征)。他們測量每一步的「腦電波」與最終正確答案的互信息(Mutual Information, MI),并觀察這些互信息如何演繹變化。

驚人現象出現了:模型推理并非勻速「爬坡」,而是存在劇烈的「信息脈沖」!在特定步驟,互信息值會突然、顯著地飆升,形成顯著的「互信息峰值」(MI Peaks)現象。這些峰值點稀疏但關鍵,如同黑暗推理路徑上突然點亮的強光路標!

圖片

這意味著什么?直覺上,這些互信息峰值點處的表征,模型大腦中那一刻的狀態,蘊含了更多指向正確答案的最關鍵信息!

進一步地,研究者通過理論分析證明(定理 1 & 2),推理過程中積累的互信息越高,模型最終回答錯誤概率的上界和下界就越緊,換言之,回答正確的概率就越高!

圖片

圖片

既然互信息峰值的現象較為普遍地出現在推理模型(LRMs)中,那么非推理模型(non-reasoning LLMs)上也會表現出類似的現象嗎?

圖片

為了探索這一問題,研究者選取了 DeepSeek-R1-Distill 系列模型和其對應的非推理模型進行實驗。如上圖橙色線所示,在非推理模型的推理過程中,互信息往往表現出更小的波動,體現出明顯更弱的互信息峰值現象,且互信息的數值整體上更小。

這表明在經過推理能力強化訓練后,推理模型一方面似乎整體在表征中編碼了更多關于正確答案的信息,另一方面催生了互信息峰值現象的出現!

核心發現二:「思考詞匯」=「信息高峰」的語言化身

那么,這些互信息峰值點處的表征,到底蘊含著怎樣的語義信息?

神奇的是,當研究者把這些「信息高峰」時刻的「腦電波」翻譯回人能看懂的語言(解碼到詞匯空間)時,發現它們最常對應的,恰恰是那些標志性的「思考詞」:

  • 反思/停頓型:「Hmm」、「Wait」…
  • 邏輯/過渡型:「Therefore」、「So」…
  • 行動型:「Let」、「First」…

圖片

例如,研究者隨機摘取了一些模型輸出: 「Wait, let me think differently. Let’s denote...,」 「Hmm, so I must have made a mistake somewhere. Let me double-check my calculations. First, ...」

研究團隊將這些在互信息峰值點頻繁出現、承載關鍵信息并在語言上推動模型思考的詞匯命名為「思考詞匯」(thinking tokens)。它們不是可有可無的裝飾,而是信息高峰在語言層面的「顯靈」,可能在模型推理路徑上扮演著關鍵路標或決策點的角色!

為了證明這些 tokens 的關鍵性,研究者進行了干預實驗,即在模型推理時抑制這些思考詞匯的生成。

實錘驗證:實驗結果顯示,抑制思考詞匯的生成會顯著影響模型在數學推理數據集(如 GSM8K、MATH、AIME24)上的性能;相比之下,隨機屏蔽相同數量的其他普通詞匯,對性能影響甚微。這表明這些存在于互信息峰值點處的思考詞匯,確實對模型有效推理具有至關重要的作用!

圖片

啟發應用:無需訓練,巧用「信息高峰」提升推理性能

理解了「信息高峰」和「思考詞匯」的奧秘,研究者提出了兩種無需額外訓練即可提升現有 LRMs 推理性能的實用方法。

應用一:表征循環(Representation Recycling - RR)

圖片

  • 啟發:既然 MI 峰值點的表征蘊含豐富信息,何不讓模型「多咀嚼消化」一下?
  • 方法:在模型推理過程中,當檢測到生成了思考詞匯時,不急于讓其立刻輸出,而是將其對應的表征重新輸入到模型中進行額外一輪計算,讓模型充分挖掘利用表征中的豐富信息。
  • 效果:在多個數學推理基準(GSM8K、MATH500、AIME24)上,RR 方法一致地提升了 LRMs 的推理性能。例如,在極具挑戰性的 AIME24 上,DeepSeek-R1-Distill-LLaMA-8B 的準確率相對提升了 20%!這表明讓模型更充分地利用這些高信息量的「頓悟」表征,能有效解鎖其推理潛力。

應用二:基于思考詞匯的測試時擴展(Thinking Token based Test-time Scaling - TTTS)

圖片

  • 啟發:在推理時如果允許模型生成更多 token(增加計算預算),如何引導模型進行更有效的「深度思考」,而不是漫無目的地延伸?
  • 方法:受啟發于前人工作,作者在模型完成初始推理輸出后,如果還有 token 預算,則強制模型以「思考詞匯」開頭(如「Therefore」、「So」、「Wait」、「Hmm」等)繼續生成后續內容,引導模型在額外計算資源下進行更深入的推理。
  • 效果:當 token 預算增加時,TTTS 能持續穩定地提升模型的推理性能。如圖所示,在 GSM8K 和 MATH500 數據集上,在相同的 Token 預算下,TTTS 持續優于原始模型。在 AIME24 數據集上,盡管原始模型的性能在早期提升得較快,但當 token 預算達到 4096 后,模型性能就到達了瓶頸期;而 TTTS 引導下的模型,其性能隨著 Token 預算的增加而持續提升,并在預算達到 6144 后超越了原始模型。

小結

這項研究首次揭示了 LRMs 推理過程中的動態機制:通過互信息動態追蹤,首次清晰觀測到 LRMs 推理過程中的互信息峰值(MI Peaks)現象,為理解模型「黑箱」推理提供了創新視角和實證基礎。

進一步地,研究者發現這些互信息峰值處的 token 對應的是表達思考、反思等的「思考詞匯」(Thinking Tokens),并通過干預實驗驗證了這些 token 對模型推理性能具有至關重要的影響。

最后,受啟發于對上述現象的理解和分析,研究者提出了兩種簡單有效且無需訓練的方法來提升 LRMs 的推理性能,即表征循環(Representation Recycling - RR)和基于思考詞匯的測試時擴展(Thinking Token based Test-time Scaling - TTTS)。

研究者希望這篇工作可以為深入理解 LRMs 的推理機制提供新的視角,并進一步提出可行的方案來進一步推升模型的推理能力。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-04-03 15:46:53

2021-01-13 10:25:30

加密隱私數據數據安全

2018-11-11 11:09:53

馬化騰李彥宏人工智能

2010-04-21 18:03:32

2023-08-30 07:37:21

AMDFSR 3英偉達

2021-06-01 10:21:58

網絡攻擊數據泄漏數據安全

2024-11-04 15:54:16

2025-03-05 11:02:21

2023-06-01 17:44:52

ChatGPTOpenAI性能

2025-01-13 02:00:00

模型訓練數據

2017-04-01 09:04:54

docker自動化

2015-07-30 13:46:15

2021-07-07 05:03:35

Debugger技巧Nodejs

2025-03-28 01:03:46

高并發技術異步

2024-01-08 12:47:02

代碼模型Mistral

2021-03-04 09:25:08

Go語言惡意軟件黑客

2024-11-14 15:53:56

2025-02-24 08:24:25

2023-08-31 07:16:32

人工智能AI算力
點贊
收藏

51CTO技術棧公眾號

中文字幕亚洲第一| 午夜视频久久久久久| 国产精品日韩在线| 国产精品久久久精品四季影院| 国产精品国产三级在线观看| 一区二区免费在线| 免费中文日韩| 国产精品欧美久久久久天天影视| 黑人一区二区| 日韩精品欧美国产精品忘忧草| 久久久久久香蕉| 免费的黄网站在线观看| 国产成都精品91一区二区三| 日本成人激情视频| 婷婷在线精品视频| 国产毛片一区二区三区| 欧美一区二区黄色| 日韩av在线综合| 午夜羞羞小视频在线观看| 久久久精品黄色| av成人观看| 最近中文字幕在线视频| 亚洲大片在线| 久久久精品国产一区二区| 少妇一级淫免费观看| 在线免费成人| 欧美成人视屏| 国产成人免费9x9x人网站视频 | 中国av一区| 欧美一级欧美一级在线播放| 久久综合久久色| 草草在线视频| 亚洲国产日韩av| 超碰成人在线免费观看| 黄色片在线播放| 99视频有精品| 国产乱人伦精品一区二区| 国产精品视频一二区| 日韩成人dvd| 欧美专区中文字幕| 日韩欧美亚洲视频| 一区二区亚洲精品| 欧美日韩第一页| 中文字幕电影av| 日韩大片在线| 这里只有视频精品| 成年人在线免费看片| 午夜欧洲一区| 亚洲免费一在线| 欧美精品欧美极品欧美激情| 精品五月天堂| 日韩av在线影院| 亚洲观看黄色网| 里番精品3d一二三区| 亚洲精美色品网站| 国产精品无码在线| 免费欧美一区| 亚洲人成电影在线观看天堂色| 国产精品久久久久久久无码| 久久99精品国产自在现线| 亚洲国产高清福利视频| 屁屁影院国产第一页| 日本在线中文字幕一区| 亚洲精品二三区| 一本加勒比北条麻妃| 国产剧情在线观看一区| 一本一道久久a久久精品逆3p | 色吊丝一区二区| 日韩av综合网站| 天天躁日日躁aaaxxⅹ| 国产亚洲电影| 日韩中文字幕精品| 亚洲天堂黄色片| 激情久久综合| 国产精品88a∨| 91亚洲国产成人精品一区| 国产自产2019最新不卡| 国产99视频精品免费视频36| 亚洲av成人无码网天堂| 国产亚洲综合av| youjizz.com亚洲| 免费av不卡在线观看| 五月婷婷另类国产| www黄色在线| www一区二区三区| 亚洲国产日韩一区| 久久国产精品无码一级毛片| 成人免费看片39| 欧美国产日韩xxxxx| 国产成人无码精品久在线观看| 久久一区二区三区四区五区| 国产噜噜噜噜噜久久久久久久久 | 亚洲成人黄色网| a毛片毛片av永久免费| 日韩欧美1区| 久久人91精品久久久久久不卡| 天天干天天干天天干天天| 久久精品国产亚洲aⅴ| 国产精品乱码| 1769视频在线播放免费观看| 一区二区三区四区激情| 欧美激情精品久久久久久小说| 国产成人免费av一区二区午夜 | 成人自拍偷拍| 国际av在线| 亚洲精品日日夜夜| 日韩欧美黄色大片| 日本免费一区二区视频| 亚洲色图欧美制服丝袜另类第一页| www.av成人| 久久一综合视频| 国产精品免费在线| 无遮挡的视频在线观看| 岛国精品视频在线播放| 爱豆国产剧免费观看大全剧苏畅| 色橹橹欧美在线观看视频高清| 久久精品在线视频| 艳妇乳肉豪妇荡乳av无码福利 | 这里只有精品视频在线观看| 无码人妻aⅴ一区二区三区| 综合久久婷婷| 国产精品久久久久91| 欧美在线 | 亚洲| 亚洲人成网站在线| 亚洲第一狼人区| 一区二区美女| 69av视频在线播放| 老司机午夜福利视频| 综合自拍亚洲综合图不卡区| www.xxx亚洲| 国产精品免费不| 欧美一区二区三区免费视| 一级黄色高清视频| 欧美日韩亚洲国产另类| 亚洲欧洲日本mm| 91香蕉视频在线下载| 精品黄色免费中文电影在线播放| 色婷婷av一区二区三区软件 | 国产亚洲欧美中文| 麻豆tv在线播放| 亚洲国产视频二区| 超碰精品一区二区三区乱码 | 精品乱人伦一区二区三区| 网爆门在线观看| 日本不卡在线视频| 日韩精品久久久| 澳门av一区二区三区| 亚洲欧美另类中文字幕| 国产精品777777| 337p粉嫩大胆色噜噜噜噜亚洲| 无码专区aaaaaa免费视频| 国产suv精品一区二区四区视频| 欧美激情欧美激情| 黄色一级大片在线免费看国产一 | 国产精品丝袜久久久久久消防器材| 18国产精品| 欧美激情啊啊啊| 色一情一乱一区二区三区| 五月天中文字幕一区二区| 水蜜桃av无码| 日一区二区三区| 午夜久久资源| 中文字幕日韩亚洲| 色综合天天狠天天透天天伊人| 亚洲AV无码精品国产| 婷婷综合另类小说色区| 素人fc2av清纯18岁| 美女尤物久久精品| 一区精品在线| 视频免费一区二区| 68精品久久久久久欧美| 免费毛片在线| 欧美裸体bbwbbwbbw| 久久久精品视频免费观看| 不卡的av网站| 国产精品免费成人| 97人人精品| 国产美女精品在线观看| 手机看片久久| 久久成年人视频| 日韩电影网址| 欧美乱妇一区二区三区不卡视频| 精国产品一区二区三区a片| 99久久夜色精品国产网站| 成年人在线观看视频免费| 影视亚洲一区二区三区| 精品国产一区二区三区日日嗨| 日韩av电影资源网| 欧美国产日韩一区二区三区| 天堂av中文在线资源库| 欧美三级电影网| 日本三级2019| 国产精品家庭影院| 国产精品扒开腿做爽爽爽a片唱戏| 日韩国产欧美在线观看| 伊人再见免费在线观看高清版 | 亚洲大尺度在线观看| 亚洲欧美日本韩国| 国产手机在线观看| 国产成人一区在线| 亚洲黄色av网址| 亚洲国产欧美国产综合一区| 亚洲精品一区二区三区av| 99ri日韩精品视频| 国产日韩欧美在线视频观看| 丁香高清在线观看完整电影视频| 在线色欧美三级视频| 欧美一级淫片aaaaaa| 91精品在线麻豆| 自拍偷拍18p| 婷婷久久综合九色综合伊人色| 免费成年人视频在线观看| 国产三级三级三级精品8ⅰ区| 影音先锋资源av| 精品一区二区三区影院在线午夜| 欧洲av无码放荡人妇网站| 欧美成人精品| 一区二区三区不卡在线| 深爱激情综合网| 国产一级二级三级精品| 欧美第一在线视频| 91精品国产自产在线| 欧洲精品一区二区三区| 97久久久久久| 暧暧视频在线免费观看| 欧美老女人xx| 麻豆视频在线| 最近2019免费中文字幕视频三 | 黄色动漫网站入口| 午夜久久福利| 黄色一级视频播放| 先锋资源久久| 一本一本a久久| 日韩欧美午夜| 午夜欧美一区二区三区免费观看| 精品视频黄色| 日韩国产欧美精品| 亚洲国产国产| 欧美日韩亚洲综合一区二区三区激情在线| 精品三级在线观看视频| 国产区一区二区| 精品亚洲自拍| 久久久久久久久久久一区 | 日韩免费小视频| 日韩美女视频在线观看| xx欧美视频| 国产成人a亚洲精品| 韩国精品主播一区二区在线观看| 国产91在线高潮白浆在线观看 | 在线观看国产日韩| 成人午夜精品视频| 欧美午夜视频网站| 一卡二卡三卡在线| 91精品国产91久久综合桃花 | 三上悠亚国产精品一区二区三区| 热久久美女精品天天吊色| 深夜成人影院| 国产欧美一区二区| 精品麻豆剧传媒av国产九九九| 亚洲影视中文字幕| 国产成人澳门| 欧美三级华人主播| 日韩在线观看| 国产精品视频二| 国产亚洲在线观看| 色综合色综合色综合色综合| 国产一区福利在线| 挪威xxxx性hd极品| 久久久99久久| 亚洲精品自拍视频在线观看| 亚洲精品免费在线观看| 日韩美女一级片| 色成人在线视频| 一级黄色片在线看| 欧美大片在线观看一区二区| 午夜av免费在线观看| 一本色道久久88亚洲综合88| 国产日产一区二区三区| 韩剧1988在线观看免费完整版 | 91久久国产精品91久久性色| 日韩中文在线| 日本亚洲自拍| 亚洲破处大片| 国产a级一级片| 精品一区二区久久久| 一级黄色片毛片| 欧美国产视频在线| 精品肉丝脚一区二区三区| 日韩欧美国产骚| av男人天堂网| 亚洲欧美激情另类校园| 成人影欧美片| 日本免费在线精品| 一区二区三区免费在线看| 日本精品一区| 在线观看一区| 在线观看亚洲色图| 91麻豆国产香蕉久久精品| 亚洲一二三四五六区| 欧美视频免费在线| 国产福利视频导航| 色偷偷综合社区| 天堂8中文在线最新版在线| 91免费欧美精品| 国产日产精品_国产精品毛片| 免费网站永久免费观看| 美女脱光内衣内裤视频久久网站 | 国产精品每日更新| 久久不卡免费视频| 日韩欧美的一区二区| 亚洲天天影视| 日本久久久久久久久| 国产精品xxxav免费视频| 国产又粗又硬又长| 日本视频一区二区三区| 亚洲AV无码国产精品| 依依成人综合视频| 91麻豆视频在线观看| 亚洲午夜小视频| 色在线视频观看| 国产精品一区二区三区观看| 欧美大陆一区二区| 一区二区91| av免费观看不卡| 樱花草国产18久久久久| 国产99久一区二区三区a片| www亚洲精品| 青青青国产精品| 性刺激综合网| 日本系列欧美系列| 亚洲无人区码一码二码三码的含义| 疯狂做受xxxx欧美肥白少妇| 秋霞欧美在线观看| 久久久久亚洲精品成人网小说| 国产精品亚洲综合在线观看| 资源网第一页久久久| 另类综合日韩欧美亚洲| 欧美福利第一页| 欧美在线不卡一区| 国产高清在线| 国产精品福利小视频| 欧美日韩在线播放视频| 日韩福利视频在线| 欧美激情一区不卡| 伊人久久亚洲综合| 久久精品福利视频| 精品国产麻豆| 亚洲国产一二三精品无码| 国产超碰在线一区| 日本一二三区视频| 日韩电影大片中文字幕| 神马久久午夜| 日韩精品欧美专区| 久久99精品视频| 青青草原在线免费观看| 日韩精品一区二区三区视频| 91精品国产黑色瑜伽裤| 精品产品国产在线不卡| 噜噜噜久久亚洲精品国产品小说| 高潮毛片无遮挡| 欧美男男青年gay1069videost| www视频在线看| 国产乱码精品一区二区三区中文 | 欧美日韩亚洲一区二| 女人偷人在线视频| 国产精品三级网站| 中文精品久久| 中文字幕一区三区久久女搜查官| 韩曰欧美视频免费观看| chinese偷拍一区二区三区| 国产在线播放不卡| 亚洲国产精品第一区二区| 免费看污片网站| 欧美一区三区二区| 日韩伦理在线| 一区二区三区四区五区视频| 国产成人午夜精品影院观看视频| 在线观看亚洲天堂| 中文字幕av一区| 国产精品jk白丝蜜臀av小说| 黑人粗进入欧美aaaaa| 亚洲欧美激情一区二区| 天堂√在线中文官网在线| 国产精品网站视频| 国语自产精品视频在线看8查询8| 中文在线永久免费观看| 7777精品伊人久久久大香线蕉经典版下载 | 亲子伦视频一区二区三区| 久久久久国产一区| 亚洲mv在线观看| 一本一道波多野毛片中文在线| 国产欧美日韩伦理| 视频一区二区不卡| 久久精品一区二区三| 亚洲一区二区久久| 亚洲精品视频一二三区| 黄色手机在线视频| 精品久久久久久| 宅男网站在线免费观看| 日韩高清国产精品|