精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

讓AI學著“看菜下碟”!港中大等新框架讓推理長度減少90%,準確率反增17%

人工智能 新聞
近日,香港中文大學聯合新加坡國立大學Show Lab的研究者提出了一種名為TON(Think Or Not)的新穎選擇性推理框架,讓視覺語言模型(VLM)可以自主判斷是否需要顯式推理。

人類在面對簡單提問時常常不假思索直接回答,只有遇到復雜難題才會認真推理。

如果AI模型也能像人一樣決定“要不要思考”,效率是否會大大提升?

近日,香港中文大學聯合新加坡國立大學Show Lab的研究者提出了一種名為TON(Think Or Not)的新穎選擇性推理框架,讓視覺語言模型(VLM)可以自主判斷是否需要顯式推理。

實驗表明,在不犧牲準確率的前提下,該方法顯著減少了生成的思考鏈長度,使模型推理過程更高效。

圖片

△圖1:“要不要思考”的示意

左側示例問題簡單,無需完整推理即可直接得出答案;而傳統方法如GRPO仍然生成了冗長的推理過程。右側示例問題復雜,需要逐步推理才能得到正確答案。

TON框架令模型能夠像人類一樣,對簡單問題直接作答(跳過冗余思考),對困難問題則給出詳盡的推理過程。

核心創新:引入“是否思考”的決策

TON框架的靈感源自人類決策過程:并非逢問必細想,而是視問題難易選擇思考或不思考

現有強化學習方法(如GRPO,Group Relative Policy Optimization)強調讓模型在回答前生成完整的推理鏈。這種“一刀切”的做法雖然提高了復雜任務的推理能力,但也導致對簡單任務的計算浪費——模型無論易題難題都冗長“自言自語”一番。

相比之下,TON的創新之處在于讓模型首先判斷“要不要思考”。這一選擇性推理策略意味著模型將推理與否視作一項獨立技能來學習,而非默認總是執行推理。

正如作者所言,他們關注的是“When to think”而非傳統方法研究的“How to think”。

圖片

△圖2: GRPO與TON的采樣過程對比示意圖

其中,q_1表示問題,{o_1, …, o_5}為生成的響應集合,每個響應包含思維過程T(圓形)和答案S(三角形)。TON方法能夠從空思維T_{\n\n}中進行采樣,從而GRPO顯著提升了響應多樣性。

為實現這一目標,研究者設計了兩階段訓練機制使模型掌握選擇性推理的本領。

第一階段是有監督微調(SFT)引入的“思想丟棄(Thought Dropout)”。具體來說,他們將模型訓練數據中原本的<think>推理過程</think>隨機替換為空內容<think>\\n\\n</think>

換言之,模型有約一半概率看到示例是不包含中間思考步驟的。這一步相當于教會模型輸出一種“不思考”的格式,讓模型知道直接回答也是允許的。

值得一提的是,研究者還用了一個“反向思考”策略來自行構造高質量的思考過程數據,以輔助模型學習何時可以跳過推理。

第二階段是強化學習的GRPO優化訓練。在這一階段,模型被鼓勵自主探索何時應該思考、何時跳過,以最大化任務獎勵。

具體做法是:模型針對同一輸入圖像和問題生成多個候選響應,其中有的包含完整思考鏈,有的為空想(即無思考過程直接回答)。

接著通過比較這些候選的結果正確性和格式,給予獎勵并用GRPO算法更新策略,引導模型學會在確保正確率的前提下盡量跳過不必要的推理。

經過這兩階段訓練,VLM模型便掌握了“一題一策”的選擇性思考能力:簡單題跳過推理,復雜題老老實實推理。

實驗結果:思考效率大幅提升,準確率不降反升

作者在多個具有不同推理難度的視覺-語言任務上驗證了TON的效果,包括CLEVR(簡單圖形推理)、GeoQA(數學幾何問答)以及AITZ(Mobile智能體導航任務)等。

在這些基準上,TON框架展現出驚人的效率提升——平均推理輸出長度最多減少了90%

例如,在CLEVR數據集上,TON將模型每次回答所需的生成文本長度減少了近九成,而在GeoQA上也減少了約65%。

值得注意的是,模型準確率不僅沒有下降,反而在某些任務上有所提高

以問答GeoQA為例,TON模型相比始終思考的GRPO基線,準確率提升了最高17個百分點

這意味著,讓模型學會“偷懶”跳過無用思考不僅節省計算,還可能帶來性能的“免費午餐”。

圖片

△圖3:TON和vanilla GRPO在CLEVR和GeoQA上的結果對比

TON平均推理長度最多減少了90%,并且準確率不降反升。

另外,研究人員對比了TON在AITZ的分布外數據集上面的效果,效果可以和vannila grpo保持一致,但是輸出長度從3k減少到了900,更加高效。

圖片

△圖4: TON在AITZ的不同domain測試集上面的表現。

由圖4可以看出效果保持一致,但是task level的長度從3k減少到了900。

研究人員進一步測試了訓練過程的更多指標,發現訓練過程中,TON輸出空內容<think>\\n\\n</think>的比例隨著reward的上升而增加,進而進一步降低了模型輸出的平均長度,但是輸出的有內容的思考過程的長度仍然維持不變。

圖片

△圖5: TON和vanilla GRPO在訓練過程中的reward可視化圖

圖片

△圖6: TON和vanilla GRPO在訓練過程中的輸出空思考的比例可視化圖

另外發現,簡單的任務更容易跳過思考(比如CLEVR),但是難的任務反而不容易跳過(比如GeoQA),展現出模型在強化學習的過程中,自適應的針對問題的難易程度,學習何時該思考合適不思考。

在不降低準確率的情況下減少將近九成的推理步驟,這對大型模型的實際部署帶來了切實的益處。

一方面,推理效率的提升意味著更快的響應速度和更低的算力消耗。這對于需要實時互動的多模態助手、機器人等應用尤為重要。

另一方面,TON 展現的“按需思考”模式讓AI更接近人類的思維習慣——該思考時就認真思考,該果斷時則不拖泥帶水。這種人性化的推理策略有望提升模型在推理任務上的通用性和可靠性。

總的來說,TON提出了一個值得關注的方向:并非一味追求更長的思維鏈,而是先問問自己“要不要思考?”。

未來,這類機制可能成為提升大模型實用性的一個重要途徑。

以下是兩個代表性的TON系列模型,它們在不同任務上展示了這一機制的實際應用效果。

例子1

圖片

△圖7: GRPO與TON在GUI agent AITZ上的對比

TON在多步移動導航過程中自適應跳過不必要的思考步驟,在保持任務準確性的同時實現了比GRPO更高的解碼效率(本例中節省了60%的token消耗)。

例子2

圖片

△圖8: CLEVR中思考模式與非思考模式的對比圖示

TON展示了選擇性激活推理的能力——僅在需要時啟動思考機制,而GRPO則不加區分地為所有情況生成推理軌跡。

論文地址:https://arxiv.org/abs/2505.16854代碼地址:https://github.com/kokolerk/TON

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-11-21 12:12:09

2024-01-16 14:00:00

2025-04-18 08:42:52

模型推理AI

2025-09-03 09:05:00

AI模型框架

2025-10-23 12:46:39

2023-12-12 13:51:00

AI訓練

2023-12-13 14:17:10

微軟變色龍框架

2024-01-05 08:44:52

2025-10-08 10:44:16

2019-07-21 22:22:37

圖像識別AI機器視覺

2023-05-14 17:21:04

2025-04-03 11:16:10

2025-05-26 08:33:00

2023-10-26 08:40:15

模型隱私推理

2022-01-10 23:57:36

人工智能語音識別技術

2023-06-28 13:49:12

AI人工智能

2018-11-14 10:01:30

谷歌開源機器學習

2023-10-14 17:24:49

2023-10-14 13:09:53

谷歌模型

2025-05-21 13:56:37

模型圖像AI
點贊
收藏

51CTO技術棧公眾號

日韩黄色片网站| 成人乱码一区二区三区av| 青草影视电视剧免费播放在线观看| 国产一区二区不卡| 午夜欧美大片免费观看| av男人的天堂av| 国产一区二区| 色婷婷精品久久二区二区蜜臀av| 在线观看福利一区| 性xxxfllreexxx少妇| 免费人成精品欧美精品| 欧美疯狂性受xxxxx另类| 在线免费观看日韩av| 久久在线观看| 91成人在线精品| 欧美日韩中文字幕在线播放| 极品白浆推特女神在线观看| 国产成人综合在线观看| 国产精品电影网| 久久久91视频| 日韩在线观看一区| 亚洲精品视频在线播放 | 中文字幕高清在线播放| 国产精品传媒入口麻豆| 精品一区日韩成人| 99在线无码精品入口| 丝袜国产日韩另类美女| 久久久亚洲精选| 成年人一级黄色片| 日韩av大片| 亚洲美女av网站| 亚洲精品久久一区二区三区777 | 国产精品二区二区三区| 在线免费观看视频网站| 久久亚洲国产精品一区二区| 午夜精品一区二区三区在线视 | 成年人免费观看视频网站| 一本一道久久a久久| 欧美一区三区四区| 黄色手机在线视频| 成人福利片在线| 精品欧美激情精品一区| 九九爱精品视频| 伊人电影在线观看| 亚洲色图欧洲色图婷婷| 亚洲在线观看一区| 国产大片在线免费观看| 久久精品男人天堂av| 国产美女精品在线观看| 黄色av网址在线| 国产很黄免费观看久久| 亚洲影院色无极综合| 国产免费一区二区三区免费视频| 久久国产福利国产秒拍| 国产精品一区二区性色av | 老司机精品视频一区二区三区| 国产成人精品久久二区二区| 少妇高潮av久久久久久| 久久久xxx| 国产va免费精品高清在线| 在线观看日本视频| 久久在线91| 国产精品久久久久久亚洲影视| www.久久视频| 免费在线看一区| 国产欧美精品日韩精品| 国产欧美综合视频| 国产精品99久久久久久久女警| 亚洲最大的免费| 亚洲精品一区二区三区四区| 成人黄色小视频在线观看| 国产日韩久久| 福利在线午夜| 综合在线观看色| 欧美国产综合在线| 天堂av在线| 欧美亚洲国产一卡| 欧美大片久久久| 97久久综合区小说区图片区| 日韩精品免费在线播放| 国产高清一区二区三区四区| 97人人精品| 欧美国产日本在线| 免费看污视频的网站| 精品亚洲成a人在线观看| 国产精品久久久久久久免费大片| 深夜福利在线观看直播| 久久亚洲精华国产精华液| 亚洲在线欧美| 白浆在线视频| 欧美精品日韩综合在线| 亚洲精品无码一区二区| 欧美在线免费看视频| 久久99国产精品自在自在app | 欧美日韩另类综合| 欧美videos极品另类| 亚洲国产精品一区二区久久恐怖片| 国产成人综合一区| 免费一级欧美在线大片| 亚洲精品一区中文| www欧美com| 久久久久看片| 国产高清在线一区| 日本三级在线视频| 精品久久久久久电影| 红桃视频 国产| 亚洲色图丝袜| 欧美国产视频日韩| 在线不卡免费视频| 99免费精品视频| 99亚洲国产精品| 高清av一区| 亚洲精品videossex少妇| 国产精品麻豆免费版现看视频| 亚洲精品系列| 亚洲自拍偷拍一区| 在线免费看a| 日韩欧美国产骚| 日本精品一二三区| 久久久久亚洲| 国产精品久久久久久av下载红粉 | 加勒比久久高清| xx视频.9999.com| 波多野结衣小视频| av毛片久久久久**hd| 麻豆视频传媒入口| 欧美亚洲黄色| 一色桃子一区二区| www.国产com| thepron国产精品| 青青视频免费在线| 亚洲精品aaa| 深夜福利亚洲导航| 中文字幕人妻互换av久久| 久久嫩草精品久久久精品| 国产二区视频在线| 亚洲精品黑牛一区二区三区| 欧美成aaa人片免费看| 国产精品欧美久久久久天天影视| 国产日韩欧美a| 少妇高清精品毛片在线视频| 亚洲日产av中文字幕| 欧美又大又硬又粗bbbbb| 午夜视频在线播放| 亚洲自拍另类综合| 日本成人在线免费| 精品动漫3d一区二区三区免费| 亚洲资源在线看| 91最新在线视频| 日韩欧美高清dvd碟片| 黄色在线观看免费| 成人一级片网址| 黄色www网站| 天堂俺去俺来也www久久婷婷| 91国内免费在线视频| 无码精品黑人一区二区三区 | 久久99亚洲精品| 亚洲av无码乱码国产精品| 亚洲黄色免费电影| 深夜视频在线观看| 9国产精品视频| 欧美激情论坛| 精品无人乱码一区二区三区| 中国china体内裑精亚洲片| 在线视频 中文字幕| 亚洲色图.com| 妖精视频一区二区| 免费亚洲婷婷| 亚洲三区视频| 日韩精品久久久久久久软件91| 欧美激情精品久久久久久蜜臀| 欧性猛交ⅹxxx乱大交| 日韩欧美国产视频| 黄色激情小视频| 国产成a人亚洲精品| 欧美a v在线播放| 欧美手机视频| 91免费看蜜桃| 在线高清av| 日韩亚洲综合在线| 国产自产一区二区| 色一区在线观看| 在线观看美女av| 99久久99久久免费精品蜜臀| 国产一级特黄a大片免费| 欧美在线精品一区| 欧美日本亚洲| 国产激情精品一区二区三区| 午夜精品久久17c| 岛国在线视频| 精品久久人人做人人爽| 亚洲天堂男人av| 亚洲精选一二三| 右手影院亚洲欧美| 国产乱一区二区| 国产三区在线视频| 一区二区电影| 欧洲精品亚洲精品| 日韩成人在线观看视频| 国产盗摄xxxx视频xxx69| 影音先锋男人资源在线| 国产亚洲欧美一区| 丰满人妻av一区二区三区| 欧美调教femdomvk| 日本在线观看视频网站| 中文字幕一区av| 免费看污片网站| 高清久久久久久| 亚洲欧美自偷自拍另类| 国产精品婷婷| 欧美日韩激情四射| 色一区二区三区四区| 久久国产精品一区二区三区四区| 国产精品一区二区精品| 国产精品成人免费视频| 91九色美女在线视频| 欧美成人全部免费| 2021av在线| 亚洲天堂av图片| 天堂在线一二区| 亚洲精品在线免费观看视频| 国产丝袜在线视频| 欧美日韩国产一区二区三区地区| 国产午夜性春猛交ⅹxxx| 亚洲宅男天堂在线观看无病毒| 日日碰狠狠添天天爽| 国产清纯白嫩初高生在线观看91 | 97精品国产一区二区三区 | 国产中文一区| 国产奶头好大揉着好爽视频| 欧美日韩色图| 日韩一区二区电影在线观看| 亚洲毛片免费看| 久久99精品久久久久久三级 | 色哟哟亚洲精品一区二区| 男人天堂网在线| 日韩精品亚洲精品| 无码精品视频一区二区三区| 欧美精品一区二区久久久| wwwxxxx国产| 日韩午夜激情电影| a天堂在线视频| 日韩欧美国产午夜精品| 精品乱子伦一区二区| 7777精品伊人久久久大香线蕉| 中文字幕日产av| 欧美在线|欧美| 中文字幕精品在线观看| 欧美视频一区在线| 超碰在线免费97| 欧美日韩欧美一区二区| 一级特黄录像免费看| 欧美高清www午色夜在线视频| 中文在线a天堂| 欧美日韩免费观看一区三区| 中文字幕视频一区二区| 欧美丰满少妇xxxbbb| 国产精品久久久久久久免费看 | 午夜久久电影网| 亚洲精品国产精品乱码| 欧美午夜www高清视频| 黄瓜视频在线免费观看| 日本道精品一区二区三区| 日韩免费av网站| 欧美日韩第一区日日骚| 性一交一乱一乱一视频| 欧美精品一区二区在线观看| 少妇高潮一区二区三区99小说| 亚洲免费伊人电影在线观看av| 美女做暖暖视频免费在线观看全部网址91 | 九九综合九九| 深夜福利成人| 一区二区蜜桃| 国模吧无码一区二区三区| 久久精品九九| 亚洲理论中文字幕| 福利一区二区在线观看| 色婷婷av777| 中文字幕一区三区| 国产一级在线免费观看| 欧美日韩在线视频观看| 中文字幕 视频一区| 欧美一级免费观看| 午夜视频在线播放| 这里只有视频精品| 国产啊啊啊视频在线观看| 欧美在线视频观看| 亚洲图片小说区| 国产亚洲欧美一区二区| 色琪琪久久se色| 99色这里只有精品| 轻轻草成人在线| 丰满熟女人妻一区二区三区| 国产亚洲va综合人人澡精品| 精品自拍偷拍视频| 婷婷综合五月天| 国产精品久久久久毛片| 亚洲精品97久久| 黄色一级大片在线免费看产| 555www成人网| 激情视频亚洲| 日韩三级电影网站| 一区二区三区国产在线| www.cao超碰| 久久亚洲免费视频| 国产精品第二十页| 欧美色成人综合| 日本成人一区| 欧美精品做受xxx性少妇| 久久久成人av毛片免费观看| 成人羞羞视频免费| 97精品国产| 国产真人无码作爱视频免费| 成人h动漫精品| 欧美色图亚洲视频| 欧美欧美欧美欧美| 精品无人乱码| 97在线免费观看| 2023国产精华国产精品| 一区二区视频国产| 麻豆精品网站| 日韩av手机在线播放| 亚洲激情图片qvod| 国产精品一区二区人人爽| 国产亚洲欧美视频| 欧美xx视频| 久久精品aaaaaa毛片| 在线精品亚洲| 手机在线播放av| 亚洲日本中文字幕区| 在线视频欧美亚洲| 国产一区二区三区在线观看视频| а√天堂8资源在线| 国产91精品入口17c| 欧美黄在线观看| 国产xxxxhd| 亚洲女子a中天字幕| 国产精品久久久久久久久久久久久久久久 | 麻豆91蜜桃| 国产亚洲在线观看| 日韩aaaaa| 午夜不卡av在线| 日本免费不卡视频| 国模精品一区二区三区色天香| 99这里只有精品视频| 国产乱子伦精品视频| 国产河南妇女毛片精品久久久 | 欧洲国产伦久久久久久久| 天堂av电影在线观看| 69久久夜色精品国产69乱青草| 林ゆな中文字幕一区二区| 免费观看国产精品视频| 成人高清免费观看| 久久久久久久久久免费视频| 亚洲精品97久久| 国模套图日韩精品一区二区| 欧美精品国产精品久久久| 久久国产高清| 欧美丰满老妇熟乱xxxxyyy| 欧美嫩在线观看| 色女人在线视频| 国产高清自拍99| 亚洲欧美日韩国产一区二区| 亚洲天堂久久新| 欧美伊人久久久久久午夜久久久久| av中文字幕在线| 91在线免费网站| 国产精品观看| 中文字幕一区二区三区人妻电影| 一本色道久久综合狠狠躁的推荐| 国产资源在线观看| 成人精品网站在线观看| 欧美一区久久| free性中国hd国语露脸| 欧美最猛黑人xxxxx猛交| 五月天婷婷在线视频| 成人性色av| 日韩黄色小视频| 国产真实乱在线更新| 亚洲福利视频网站| 成人av免费电影网站| 一级特黄录像免费播放全99| 国产不卡视频一区二区三区| 日本韩国欧美中文字幕| 最新国产精品拍自在线播放| 9国产精品午夜| 亚洲中文字幕久久精品无码喷水| 亚洲欧洲99久久| 欧美新色视频| 成人激情在线播放| 国产精品呻吟| 午夜精品一区二区三级视频| 日韩电视剧免费观看网站| 欧洲精品久久久久毛片完整版| 精品视频在线观看一区二区| 久久久精品免费观看| 亚洲av无码国产精品永久一区| 国产成人福利网站| 精品白丝av| 无码人妻精品中文字幕|