精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI話癆終結者!UCSD清華提出「思維掃描術」Dynasor-CoT,推理巨省token

人工智能 新聞
推理模型在復雜任務上表現驚艷,缺點是低下的token效率。UCSD 清華等機構的研究人員發現,問題根源在于模型的「自我懷疑」!研究團隊提出了Dynasor-CoT,一種無需訓練、侵入性小且簡單的方法。實驗證明,Dynasor-CoT在保持準確性的同時,能減少高達29%的token消耗,且不增加推理延遲。

這段時間,諸如DeepSeek-R1和OpenAI o1/o3這類的CoT推理模型,在復雜任務上展現出了驚人的性能。

然而,與早期模型相比,它們的token效率卻非常之低。即,需要消耗更多的token才能達到相同的準確率。

下圖展示了傳統模型的token效率曲線比推理模型陡峭得多。

圖片

最近,來自加州大學圣地亞哥分校、清華等機構的研究人員揪出了罪魁禍首——「自我懷疑」。

圖片

論文地址:https://arxiv.org/abs/2412.20993

項目主頁:https://hao-ai-lab.github.io/blogs/dynasor-cot/

代碼地址:https://github.com/hao-ai-lab/Dynasor

Demo:https://hao-ai-lab.github.io/demo/dynasor-cot

換句話說就是,模型明明早就算出正確答案,卻要反復驗算糾結,白白耗費海量計算資源!

以一個簡單問題 (1+2i)*6-3i測試為例:傳統Qwen-7B用180個token輕松解題,而升級后的Deepseek版Qwen-7B雖在第340個token就得出正確答案,卻硬生生續寫1000+token反復驗證!

這種「學霸強迫癥」,讓DeepSeek等頂尖模型浪費了高達70%的算力!

圖片

為了解決模型的「自我懷疑」問題,研究團隊提出了Dynasor-CoT,一種無需訓練、侵入性最小且簡單的方法,用于長鏈式推理(CoT)。

這種方法結合了基于確定性的啟發式方法與「思維CT掃描術」技術,以動態確定(推理鏈的)終止點。在保持準確性的同時有效地截斷推理鏈。

實現了高達29%的token減少,同時不影響準確性,也不會給關鍵推理路徑帶來額外的延遲。

目前,團隊已將這款「AI話癆終結者」系統全面開源,快來看看你的AI能省多少token吧!

值得一提的是,本文的作者組USCD張昊實驗室還曾經推出過諸多知名研究項目,包括如今風靡全球的大模型競技場(LLM Arena、vLLM,Prefill-decode分離式服務架構等。

AI「思維CT掃描術」

為了系統地研究這個現象,研究人員開發了一種「思維CT掃描術」(Probe-In-The-Middle)。

通過在模型推理過程中插入特定提示(比如「啊!我悟了,答案是:」),來提取模型某一個中間思考節點的答案,從而確定到底模型最早在什么時候得到了正確答案。

就像考試時監考老師突然抽走草稿紙,逼迫AI提前交卷!

下圖展示了不使用和使用「思維CT掃描術」兩種方式的準確率對比分析。左邊采用標準推理。右邊使用「思維CT掃描術」技術提取早期答案,可以看出在50%的token減少下具有等效的準確性。

在相同的token預算下,綠色區域越早出現表示正確答案到達得越早——明顯更綠的右側面板表明模型實際上知道答案的時間比標準推理中顯示的要早得多。

圖片

以AMC23數據集為例,推理模型通常在早期就得到了正確答案(中位數:830個token),但由于「自我懷疑」會繼續生成不必要的token(中位數:2.7K個token)。

這種自我懷疑現象嚴重影響了token效率,因為模型即使內心已經對答案有一定把握,還是會繼續推理。

基于信心值的早停策略,巧妙減少token消耗!

想象一下,我們給AI裝了一個智能「話癆終結者」。每當AI說了一定數量的話(比如64個token),「思維CT掃描術」(probe-in-the-middle)就會悄悄啟動:

  1. 首先,像醫生做CT掃描一樣,給AI的思維來個「斷層掃描」,提取它當前的答案。
  2. 有趣的是,AI完全不知道自己被「掃描」了!它會繼續自顧自地推理,繼續寫解題步驟。
  3. 如果AI連續N次的「CT掃描」結果都顯示同一個答案,系統就會判定AI非常自信,并果斷按下停止鍵。堅定地告訴這位同學:「你已經答對了,不用再證明了!」

Dynasor-CoT通過三種關鍵機制提高長CoT LLM推理中的token效率:提取答案、確定性評估和生成后驗證。

下圖展示了Dynasor-CoT方法。如果模型回答比較確定則退出(案例 1),遇到有猶豫含義的詞匯(例如,等等)則繼續生成(案例 3),如果模型推理不足夠確定也繼續生成(案例 2)。

圖片

中間探針

研究人員在模型生成過程中引入了名為「中間探針」(probe-in-the-middle)的戰略干預。

他們在模型推理的中間階段添加精心設計的引導,以明確地提取出模型當前的答案。

這種方法利用了他們的觀察,即推理LLM通常在完成其完整的推理鏈之前就能達到正確答案。

當LLM已經在其內部得出結論時,這種早期提取技術顯著降低了計算成本。

通過答案一致性進行確定性評估

研究人員實現了一種動態確定性評估機制,該機制定期(例如每32、64或128個標記)監控模型的輸出。

在每個間隔內,探測模型以提取和存儲當前答案,然后允許LLM繼續其生成。重要的是,后續的生成不受探測標記的影響,從而實現答案提取和原始生成的并行執行。

當模型在多個間隔內產生一致的答案時,將其模式解釋為確定性的指標,遵循certaindex方法Dynasor。這種方法為模型的確定性提供了定量度量。

AI的微表情識別術:揪出不自信的時刻!

研究人員發現,AI也有自己的「微表情」!通過仔細觀察AI的語言習慣,他們找到了判斷AI是否自信的妙招:

  • 當AI說出「等等」、「嗯...」這樣的詞時,就像人類皺眉思考或撓頭的動作,說明它對自己的答案并不太有把握。
  • 這時候,即使「思維CT掃描」得到了答案,我們也要對它保持警惕,不能輕易相信一個支支吾吾的回答。
  • 這種語言習慣分析,就像是給AI裝了一個「情緒探測器」,能夠精準捕捉到它的不自信時刻!

總的說來,這種方法利用了模型在中間階段得出結論的能力,也保持了針對過早或不確定響應的強大保障措施。

Certaindex:一個更野心勃勃的目標!

這套基于信心值的策略遠不止于此,它還有更廣闊的應用前景:

  • 它可以推廣到各種高級推理算法中,比如自洽性檢驗(self-consistency)、蒙特卡洛樹搜索(MCTS)等。
  • 就像一個通用的「自信度測量儀」,能夠適應不同的思維方式。
  • 不管AI用什么方法思考,這個系統都能準確判斷:「嗯,這個答案它是真的有把握。」

通過這種方式,研究人員不僅讓AI變得更高效,還讓它的思維過程變得更透明、更可控。并且,還能知道什么時候該停下來,而不是無休止地解釋、驗證。

最重要的是,這個方法不需要重新訓練模型,可以直接應用到現有的AI系統中,堪稱即插即用的效率神器!

Dynasor:大模型推理的「調度大師」

簡單說,Dynasor就像是大模型推理任務的「智能調度系統」:

1. 智能資源分配

  • 基于Certaindex(信心值系統)動態分配計算資源
  • 像調度員一樣安排每個推理任務的優先級和資源

2. 結構化管理

  • 把復雜推理任務變成結構化的程序
  • 在應用層和系統層實現高效調度
  • 通過緩存優化提升性能

總之,它就是讓AI推理既快又準的效率神器!就像給大模型裝了個智能管家,讓推理過程更加高效有序。

下圖展示了該架構通過本地應用程序組件與服務器端系統管理之間的相互作用,實現了高效的資源分配。

圖片

實驗結果:大幅提升推理效率!

研究團隊在多個數學推理數據集(AIME24、AMC23和MATH500)上測試了這套系統,使用了不同規模的DeepSeek模型(7B、14B和32B)。

下圖評估了不同的探測間隔(如32、64等),這些間隔通過不同顏色的線條表示,并且最大token預算為16K。

對于每個間隔,研究人員調整了早期終止參數N(所需的連續一致答案的數量),從而生成每條線上的不同點。所有配置都實現了顯著的token節省,在保持與基準模型相當的準確度的同時,將token使用量減少了最多29%。

為了公平比較,適當的準確度閾值已根據模型規模進行校準——對于32B模型,使用嚴格的閾值標準,而對于較小的模型,則使用較低的閾值,同時在較簡單的任務中設置更高的目標,以便達到更高的準確度。

圖片

對于該方法在token減少方面表現最好的10%問題,研究人員觀察到AIME節省了34%的token,MATH500節省了53%。

在最優的1%問題中效果更加顯著——AIME節省了53%,MATH500節省了高達81%!

這種表現顯示了這種動態方法相對于固定token預算的優勢,因為不同問題在達到解決方案時對token的需求有所不同。

為了驗證可擴展性,研究人員將實驗擴展到更大的DeepSeek-R1模型。

下圖顯示了Dynasor-CoT在DeepSeek-R1上和較小蒸餾模型上表現一致,實現持續的效率提升:DeepSeek-R1在AIME問題上實現了12%的token節省,在AMC問題上實現了24%,同時保持了基線準確率水平。

圖片

責任編輯:張燕妮 來源: 新智元
相關推薦

2018-05-06 16:52:51

2012-09-10 09:28:51

2024-08-07 10:19:00

2011-09-06 14:36:34

觸摸菜單ipad應用電子點菜

2013-11-15 10:15:55

HA系統張振倫HypervisorH

2014-08-29 16:43:58

GitHubLinux

2015-12-09 10:41:51

2013-12-30 10:37:59

2017-11-13 09:00:44

寬帶服務DDoS

2009-08-24 15:22:37

云計算技術性工作

2010-09-09 15:10:56

2009-08-04 21:46:53

IBM動態架構DI

2016-01-15 11:39:46

物聯網互聯網

2021-08-28 09:04:54

死鎖順序鎖輪詢鎖

2011-10-11 10:02:48

2025-04-15 09:19:00

模型AI數據

2025-04-29 08:15:41

2009-03-21 10:16:46

微軟瀏覽器IE8

2017-01-19 09:36:02

2024-12-18 14:53:28

點贊
收藏

51CTO技術棧公眾號

亚洲日本va中文字幕| 91av久久久| 欧美美女黄色| 欧美视频精品在线| www.国产二区| 撸视在线观看免费视频| 黄网站免费久久| 97热在线精品视频在线观看| 欧美18—19性高清hd4k| 国产区一区二| 91成人在线免费观看| 黄色片免费在线观看视频| 免费在线观看污视频| 国产麻豆一精品一av一免费| 欧美亚洲视频在线观看| 国产av无码专区亚洲av毛网站| 美女呻吟一区| 91精品国产一区二区| 777米奇影视第四色| 伊人福利在线| 亚洲国产精华液网站w| 国产青春久久久国产毛片| 国产在线精品成人一区二区三区| 手机看片一级片| heyzo高清中文字幕在线| 久久精品亚洲一区二区三区浴池| 国产高清自拍一区| 一区二区日韩视频| 老司机亚洲精品| 992tv在线成人免费观看| 成人涩涩小片视频日本| 精品国产精品久久一区免费式 | 中文字幕精品视频| 中文字幕乱妇无码av在线| 欧美大电影免费观看| 欧美黄色一级视频| 伊人亚洲福利一区二区三区| 在线观看亚洲免费视频| 亚洲国产天堂| 欧美性色aⅴ视频一区日韩精品| 隔壁人妻偷人bd中字| 色多多视频在线观看| 国产亚洲精品福利| 免费精品视频一区| 天天干天天草天天射| 成人综合在线观看| 不卡一区二区三区视频| 国产精品无码天天爽视频| 蜜乳av一区二区三区| 国产成人亚洲综合91精品| 影音先锋亚洲天堂| 国产日韩1区| 欧美久久影院| 欧美在线小视频| 激情综合在线观看| 电影在线观看一区| 天天色 色综合| av黄色在线网站| 成人欧美magnet| 在线免费观看一区| 久久婷婷综合色| 欧美激情福利| 在线91免费看| 4438x全国最大成人| 美女久久精品| 精品国产免费视频| 麻豆精品国产传媒av| 精品国产乱子伦一区二区| 亚洲国产99精品国自产| 日本黄色免费观看| 色狠狠久久av综合| 国产亚洲精品美女| 大吊一区二区三区| 欧美成人一品| 91地址最新发布| 国产成人无码av| 久久精品久久综合| 91亚洲精品久久久| 欧美 日韩 国产 成人 在线观看| 日本中文字幕久久| 久久亚洲电影| 91精品中国老女人| 黄色一级大片在线免费看国产一 | 午夜视频在线免费播放| 91蜜桃视频在线| 五月天亚洲综合| 巨大荫蒂视频欧美大片| 亚洲成人自拍网| 日韩手机在线观看视频| 四虎在线精品| 亚洲护士老师的毛茸茸最新章节| 国产精品20p| 在线精品小视频| 欧美一区二粉嫩精品国产一线天| 一级黄在线观看| 成年人国产精品| 亚洲欧美日韩另类精品一区二区三区| 永久免费网站在线| 色天使色偷偷av一区二区| 不用播放器的免费av| 欧美电影在线观看完整版| 欧美丝袜美腿| 精品福利二区三区| 伊人影院综合网| 国产精品v日韩精品v欧美精品网站| 欧美一区影院| 一区二区三区动漫| 国产一级免费av| 蜜臀av一区二区在线观看 | 一区二区三区黄| 91蜜桃免费观看视频| 中文字幕日韩精品无码内射| 日本精品网站| 亚洲精品国产精品自产a区红杏吧| 天美传媒免费在线观看| 国产精品夜夜夜| 亚洲综合精品一区二区| 第一福利在线| 精品久久久久久久久久| 日本中文字幕在线不卡| 欧美午夜精品一区二区三区电影| 性色av一区二区三区在线观看| 国产美女精品视频国产| 国产欧美日韩中文久久| 777精品久无码人妻蜜桃| 欧美三级一区| 久久精品免费电影| 亚洲无码精品在线播放| 91美女视频网站| 国产素人在线观看| 凹凸av导航大全精品| 欧美成在线观看| 国产手机av在线| **欧美大码日韩| 国产成人美女视频| 久久一区二区三区电影| 国产激情999| 国模精品一区二区| 久久porn| 精品久久久久久亚洲综合网| 影音先锋男人资源在线观看| 青青草成人在线观看| 日本不卡高清视频一区| 中文字幕在线中文字幕在线中三区| 精品国产亚洲在线| 妺妺窝人体色www在线下载| 国内精品国产三级国产a久久| 成年人免费观看的视频| 日韩综合久久| 欧美成人精品在线视频| 国产成人a人亚洲精品无码| 国产精品成人在线观看| 日本在线播放一区二区| 91精品久久久久久久久久不卡| 成人久久18免费网站图片| 免费大片在线观看www| 精品视频在线视频| www深夜成人a√在线| 国产福利一区二区三区视频 | 黄色成人精品网站| 国产精品xxxx| 在线能看的av网址| 一本一本久久a久久精品综合小说 一本一本久久a久久精品牛牛影视 | 99精品在免费线偷拍| 综合国产在线视频| 国产一区二区小视频| 国产精品国产精品国产专区不蜜| 亚洲第一区第二区第三区| 欧美激情精品久久久六区热门| av一本久道久久波多野结衣| xxxx在线视频| 亚洲欧美激情另类校园| 人妻中文字幕一区二区三区| 国产精品国产三级国产三级人妇| 黄色aaaaaa| 最新亚洲激情| 奇米视频888战线精品播放| 日韩高清在线| 欧美精品免费在线| 欧美777四色影视在线| 欧美日本国产一区| 日本熟妇毛耸耸xxxxxx| 国产午夜精品在线观看| 亚洲自拍第三页| 一区二区动漫| 中文字幕一区综合| 任你弄精品视频免费观看| 国产精品久久久久久久久免费 | 成人亚洲免费视频| 极品尤物久久久av免费看| 日韩在线导航| 在线观看亚洲网站| 伊人成综合网| 欧美乱偷一区二区三区在线| 亚洲精品大片| 欧美又大又粗又长| h网站久久久| 亚洲视频免费一区| 成人黄色免费视频| 欧美日韩综合在线| 人人干人人干人人干| 亚洲天堂精品视频| 国产精品毛片一区二区| 国产电影精品久久禁18| 欧美伦理片在线看| 亚洲视频播放| 日本老太婆做爰视频| 国产精品一区2区3区| 懂色中文一区二区三区在线视频| 精品视频一区二区三区四区五区| 久久久久久91| 蜜桃视频在线观看www社区| 亚洲精品一区二区三区婷婷月| 999精品国产| 欧美午夜精品久久久久久超碰| 久久露脸国语精品国产91| 亚洲色图制服诱惑| 色www亚洲国产阿娇yao| 91免费观看视频在线| 免费看91视频| 国产乱码精品一区二区三| 日本毛片在线免费观看| 好看的av在线不卡观看| 国产精品亚洲天堂| 日韩精品91| 天天综合色天天综合色hd| 亚洲动漫精品| 欧美xxxx黑人又粗又长精品| 成人三级毛片| 99久久久精品免费观看国产| 91精品一久久香蕉国产线看观看 | 日韩中文字幕国产精品| 东热在线免费视频| 亚洲欧美制服综合另类| 先锋av资源站| 日韩av在线免费观看一区| 亚洲欧美高清视频| 日韩欧美国产1| av免费在线不卡| 日韩欧美一区在线观看| 国产av一区二区三区| 91麻豆精品国产91久久久资源速度| 中文字幕+乱码+中文字幕明步| 在线一区二区视频| 正在播放亚洲精品| 欧美日韩国产美女| 国产一区二区三区三州| 91精品国产色综合久久不卡蜜臀| 一级黄色小视频| 欧美一区二区三区精品| 北条麻妃一二三区| 日韩精品一区二区三区中文不卡| www.爱爱.com| 精品国产99国产精品| 动漫av一区二区三区| 亚洲国产精品一区二区久| 人妻va精品va欧美va| 日韩电影中文字幕av| 欧美女同网站| 日韩中文字幕在线视频播放| 国产在线一区二区视频| 九九九热精品免费视频观看网站| 欧洲成人综合网| 午夜精品一区二区三区av| 日韩伦理在线一区| 国产精品久久久久久久久影视 | 韩日午夜在线资源一区二区| 亚洲成人一品| 亚洲一区二区自拍偷拍| 91精品国产福利在线观看麻豆| 99久久久精品视频| 噜噜噜躁狠狠躁狠狠精品视频| 国产精品亚洲二区在线观看| 日韩影院精彩在线| 亚洲免费成人在线视频| 国产suv一区二区三区88区| 艳妇乳肉豪妇荡乳xxx| 91色九色蝌蚪| av资源在线免费观看| 亚洲综合自拍偷拍| 无码人妻一区二区三区线| 4438x亚洲最大成人网| 亚洲乱熟女一区二区| 亚洲欧美中文字幕在线一区| 视频三区在线| 97久久超碰福利国产精品…| 播放一区二区| 春色成人在线视频| 欧美精品羞羞答答| 六月婷婷激情综合| 视频一区中文字幕| 丰满饥渴老女人hd| 国产欧美日韩综合精品一区二区 | 免费在线视频欧美| 97久久久免费福利网址| 成人永久在线| 欧美日韩一区二区三区在线视频| 亚洲精品小说| 中文字幕第80页| 成人午夜又粗又硬又大| jizz日本在线播放| 五月婷婷激情综合网| 91精品国产乱码久久| 国产视频精品在线| 日本aa在线| 成人免费淫片aa视频免费| 日韩欧美天堂| 日本阿v视频在线观看| 久久超级碰视频| japanese中文字幕| 亚洲成在人线在线播放| 国产农村妇女毛片精品| 亚洲性69xxxbbb| xxxx成人| 91久久国产自产拍夜夜嗨| 成人3d精品动漫精品一二三| 3d动漫一区二区三区| 国产一区二区在线观看免费 | 青青草成人影院| 草草久久久无码国产专区| 国产成人av电影免费在线观看| 少妇高潮惨叫久久久久| 欧美在线视频全部完| 免费在线视频一级不卡| 性欧美长视频免费观看不卡| 亚洲成av人片在线观看www| 色一情一区二区三区四区| 欧美一级视频| 青青草视频播放| 亚洲mv大片欧洲mv大片精品| 亚洲国产精品久久人人爱潘金莲| 精品国产网站地址| 国产精品66| 亚洲国产日韩欧美| 日本欧美一区二区三区| jizz中文字幕| 在线观看中文字幕不卡| 日本aaa在线观看| 57pao精品| 小嫩嫩12欧美| 男人舔女人下面高潮视频| 国产亚洲欧洲一区高清在线观看| 91视频免费网址| 亚洲精品有码在线| 日本韩国欧美| 日韩国产精品一区二区三区| 久久久久久9| 91在线品视觉盛宴免费| 91精品国产九九九久久久亚洲| 亚洲一级大片| 国产精品成人久久电影| 成人免费视频免费观看| 国产乡下妇女做爰毛片| 亚洲精品久久久久中文字幕欢迎你 | 狂野欧美xxxx韩国少妇| 992tv成人免费观看| 国产精品自拍在线| 日韩 欧美 亚洲| 精品视频久久久| 四虎影视4hu4虎成人| 异国色恋浪漫潭| 成人小视频在线观看| 久久国产视频精品| 中文字幕一区电影| 精品国产鲁一鲁****| 激情五月婷婷六月| 久久综合九色综合欧美98| 啪啪小视频网站| 久久天天躁狠狠躁夜夜爽蜜月| 成人在线视频中文字幕| 亚洲欧洲日产国码无码久久99| 欧美国产成人在线| 国产成人a人亚洲精品无码| 性欧美激情精品| 欧美另类69xxxxx| 国产人妻精品久久久久野外| 午夜精品视频在线观看| 大胆av不用播放器在线播放| 91亚洲va在线va天堂va国| 日韩视频精品在线观看| 日本爱爱爱视频| 欧美不卡视频一区| 性欧美超级视频| 乱熟女高潮一区二区在线| 26uuu亚洲综合色| 国产尤物在线观看| 91精品国产精品| 一本到12不卡视频在线dvd| 国产精品无码网站| 在线电影院国产精品| 国产乱码午夜在线视频| 天天好比中文综合网| 成人av在线资源网站| 中文字幕二区三区| 久久人人爽人人| 欧美gvvideo网站| 国产精品边吃奶边做爽| 91麻豆精品国产91久久久使用方法| 美女91在线看| 日本一级黄视频|