精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

港科大Apple新研究:Tokens使用量減少,模型推理還更強了

人工智能 新聞
來自港科大、港城、滑鐵盧大學和Apple的研究人員,最近提出了Laser系列新方法,實現了更好的模型效率和準確率平衡,做到了兩者的共同顯著提升。

1+1等于幾?

現在的大推理模型(LRMs)已經展現出了非凡的推理能力。但是面對這樣最簡單的數學問題,現有的LRMs仍需要花費1400+的tokens來思考。

那么有辦法讓LRMs在推理思考時更快更強嗎?

來自港科大、港城、滑鐵盧大學和Apple的研究人員,最近提出了Laser系列新方法,實現了更好的模型效率和準確率平衡,做到了兩者的共同顯著提升。

圖片

經過Laser和它的進階方法Laser-D、Laser-DE訓練后的模型,相較于訓練前模型或者其他方法訓練的模型,在準確率(Accuracy)和Tokens使用效率(Efficiency)上,同時取得了顯著的提升。

例如在知名復雜數學推理基準AIME24上,Laser-D和Laser-DE方法能夠讓模型在減少Tokens使用量63%的情況下,還繼續提升6.1的性能。

同時,研究人員還發現,經過訓練的模型的思考過程里,冗余的“self-reflection”的比例大大降低,呈現出了一種更加健康的思考模式。

圖片

這一研究也在??引起了討論:

圖片

那么,Laser是如何讓大模型推理又快又好的呢?

三大創新實現性能-效率雙贏

Laser的研究人員首先發現,僅僅通過在強化學習過程中,對模型輸出長度進行截斷,就可以讓訓練后的模型的推理效率大幅提升。

但這種方式,只能帶來效率的提升,對于模型推理的準確性仍然有不小的損害。

這意味著,推理的準確性和效率其實是一個平衡問題(Trade-off),用更多的Tokens經常能取得更高的準確率,反之可能準確率就會受到損害。

所以不應該僅僅關注某一指標,而應該將兩者一同考慮,將問題的重點放在如何提升它們之間的平衡上面。

圖片

Laser主要通過以下三點創新來平衡效率和準確率,以做到雙提升:

1、統一視角:提出了一套統一的框架來看待各類基于長度的獎勵設計(Length-based Reward),并且將訓練時截斷這一簡單方法也統一進了這一套框架內。

2、Laser(Length-bAsed StEp Reward):基于這一個統一框架,研究人員提出一種全新的基于目標長度和階躍函數(Step Function)的獎勵設計,規避了之前獎勵設計存在的一些問題。

3、動態且帶有難度感知的Laser-D、Laser-DE方法:進一步的,研究人員提出了一套自動適配機制,來匹配不同難度下,不同題目的最優目標長度,讓Laser達到最優的平衡。

下面分別詳細展開下。

統一視角看待不同獎勵設計

研究人員首先將直接截斷訓練的方法和先前不同的長度獎勵設計聯系起來,統一成了一套統一的獎勵設計框架。

具體而言,所有的這些方法,都可以看做是正確性的獎勵C(x)、基于長度的獎勵S(x),以及一個控制開關λ(y)的組合。

圖片圖片

表中最右側的可視化圖片,展示了不同的方法對應的獎勵函數的不同形狀,其中藍線代表正確的回復對應的獎勵函數,紅線代表錯誤的回復對應的獎勵函數。

從圖上可以看到,訓練時直接截斷的方法,有一個很大的問題在于,當模型產生的回復很長的時候,正確回復和錯誤回復的獎勵會雜糅在一起,使得模型無法正確區分回復的正確性,影響對對應數據的學習

Laser:基于目標長度和階躍函數的獎勵設計

為了解決訓練截斷中“無法區分正確但冗長的回答”這一問題,研究人員提出了Laser獎勵函數

Laser不再“懲罰”所有長回答,而是對在目標長度以內生成的正確回答給予額外的正向獎勵。

這種階躍函數(Step Function)形式的獎勵機制,既鼓勵簡潔,也保留了對準確推理的認可,有效提升了準確率與效率的整體平衡。

動態且帶有難度感知的LASER-D / LASER-DE方法

在進一步提升準確率與效率的平衡性上,研究人員提出了LASER-D方法:

通過引入動態調整目標長度與題目難度感知機制,模型在訓練過程中可以根據題目的難易程度,自適應設定更合適的token使用上限。

這一機制通過監控模型在不同難度題目上的生成表現,動態評估不同難度題目的最優目標長度。

具體來說,這一機制會定期使用一個小規模的監控集,對不同長度設定下的“預期正確回答數量”進行估算,并據此動態更新易/中/難三類題目的目標長度,幾乎不增加訓練開銷,卻顯著提升了訓練時獎勵函數的靈活性與適應性。

此外,他們還提出了LASER-DE。即在模型答錯時,鼓勵模型在更長長度上進行探索,嘗試糾正錯誤、發現更優的推理路徑,從而提升在困難題目上的表現。

這一系列改進讓LASER系列方法在多個benchmark上,實現了更優的性能-效率雙贏效果。

實驗效果

研究人員用DeepSeek-R1-Distill-Qwen的1.5B / 7B / 32B三個不同規模的模型,在MATH500、AIME24、AMC23、Olympiad Bench上進行了廣泛實驗。

首先,他們通過調整各個方法在訓練中的關鍵參數,繪制出不同方法在準確率(Accuracy)與token使用量(Efficiency)上的帕累托(Pareto)前沿。

如圖所示,在AIME2024和所有Benchmarks的平均上,原始模型(藍色虛線)在token使用上代價巨大。

而其他baselines方法雖然在效率上有所提升,但準確率下降明顯。

圖片

相比之下,LASER、LASER-D和LASER-DE(橙紅色)始終位于原模型的準確率之上——

在顯著減少Tokens使用的同時,準確率還明顯高于baseline,展現出強大的推理性能和推理效率雙提升。

特別是在AIME2024上,LASER-D在只使用原始模型1/3 Tokens的情況下,就能取得+6.1的準確率提升,證明其在復雜數學推理任務中的強大效果。

圖片

在7B和32B模型上,LASER-D和LASER-DE相較于其他方法,在準確率和token使用效率上都取得了更優表現。

DeepSeek-R1-Distill-Qwen-7B模型上,例如對于AIME24,LASER-D在7B模型上,在提升5.1的準確率的同時,平均token使用量還能降低60%,再次實現效率準確率雙提升。

研究人員還在多個領域外(OOD)測試集(GPQA、LSAT、MMLU)上對他們的方法進行了驗證。

實驗結果表明,在OOD測試集上,LASER、LASER-D和LASER-DE取得良好的泛化,同樣取得了最優的準確率與效率平衡,實現了準確率效率雙提升。

圖片

行為分析

為了進一步理解LASER系列方法為何能在保持準確性的同時大幅壓縮token使用,研究人員對模型推理行為的變化進行了分析。

結果顯示,經過LASER訓練后,模型生成中冗余的Backtracking(反復自我否定)顯著減少,而Verification(驗證)、Subgoal Setting(子目標拆解)等關鍵推理行為得以保留甚至增強。

這表明LASER不僅壓縮了長度,還引導模型學會了更簡潔、結構更清晰的思考方式。

這也與文章開頭展示的 “1+1等于幾” 的案例相呼應——

訓練后的模型不再陷入反復的self-reflections,而是能直接識別出問題的關鍵,做出高效、準確的回應。

圖片

團隊表示,他們相信“能夠準確且精簡地表達”是高級智能的重要體現。

真正強大的模型,應在準確性與簡潔性之間實現良好平衡,而非只追求其中任何一者。

LASER系列方法正是朝這一目標邁出的關鍵一步,它不僅壓縮了推理長度,更提升了推理質量。

團隊也表示,未來將繼續探索更靈活、更通用的方法,進一步推高模型的這一高級智能的能力。

論文: https://arxiv.org/abs/2505.15612
GitHub倉庫: https://github.com/hkust-nlp/Laser

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-05-26 08:40:00

2024-06-11 14:30:18

2025-10-08 10:44:16

2010-11-08 10:07:23

SQL Server內

2024-06-17 13:34:54

2025-06-10 09:07:00

2024-08-22 16:23:05

2021-08-17 10:03:34

.NET開發者使用量

2012-08-06 13:45:38

LTE網絡LTE

2024-03-18 09:54:32

開源AI模型

2023-04-13 15:40:59

模型論文

2022-06-30 18:05:51

訓練模型圖像

2025-09-23 09:09:49

2013-10-30 17:23:01

Chrome瀏覽器

2023-06-20 13:38:22

2022-03-28 18:38:00

SD-WANMPLS

2024-03-04 13:36:00

模型訓練

2021-04-02 09:40:06

量子計算芯片超算
點贊
收藏

51CTO技術棧公眾號

欧美性久久久久| 国产精品久久久久久久电影| 日本亚洲一区二区三区| 欧美xxxx做受欧美88bbw| 国产69精品久久久久777| 欧美性做爰毛片| 欧美人与禽zoz0善交| 一区二区三区视频播放| 色婷婷国产精品综合在线观看| 在线一区高清| 亚洲aⅴ在线观看| 理论电影国产精品| 97精品免费视频| 亚欧精品视频一区二区三区| 成人爽a毛片免费啪啪红桃视频| 欧美性猛xxx| 18视频在线观看娇喘| 四虎影视在线播放| 国产自产高清不卡| 国产v综合v亚洲欧美久久| 欧美成欧美va| 久久精品不卡| 国产视频欧美视频| 色欲无码人妻久久精品| 日韩在线免费| 精品国产乱码久久久久酒店| 免费观看亚洲视频| 9191在线观看| 久久久久久久综合日本| 国产精品久久久久久久天堂第1集 国产精品久久久久久久免费大片 国产精品久久久久久久久婷婷 | 欧美色视频日本高清在线观看| 亚洲欧洲精品在线观看| 日本福利午夜视频在线| 成人h动漫精品一区二区| 国产有码在线一区二区视频| 国产免费av一区| 亚洲国产国产亚洲一二三| 久久亚洲影音av资源网| 男人的天堂官网| 亚洲图区在线| 日韩国产中文字幕| 日本69式三人交| 99re8这里有精品热视频免费 | 97视频在线观看成人| 中文字幕在线有码| 亚洲影视一区二区三区| zzjj国产精品一区二区| 在线观看免费黄色网址| 精品国产乱码久久久久久1区2匹| 国产视频精品一区二区三区| ass精品国模裸体欣赏pics| 极品尤物一区| 亚洲国产一区二区三区在线观看 | 中文字幕 国产精品| 午夜在线一区| 日韩美女视频免费在线观看| 亚洲天堂男人av| 日韩精品福利网| 国产精品福利无圣光在线一区| 久久精品五月天| 日韩精品乱码av一区二区| 国产精品成人av性教育| 中文字幕理论片| 老司机免费视频一区二区| 国产日本欧美在线观看| 国产成人精品无码高潮| 成人一区二区三区中文字幕| 国产亚洲欧美一区二区| 日韩私人影院| 欧美极品少妇xxxxⅹ高跟鞋| 亚洲 国产 欧美一区| 日本韩国在线视频爽| 亚洲欧美一区二区视频| 菠萝蜜视频在线观看入口| av手机免费在线观看| 欧美性69xxxx肥| 日本www.色| 亚洲国产伊人| 日韩一区二区精品| 国产精品扒开腿做爽爽爽a片唱戏| 亚洲精品aaaaa| 最近日韩中文字幕中文| 91插插插插插插| 亚洲深夜影院| 国产欧美日韩精品在线观看| 国产婷婷一区二区三区久久| 成人的网站免费观看| 欧美精品一区二区视频| 快射av在线播放一区| 亚洲一级片在线观看| av免费中文字幕| 日韩一级视频| 亚洲激情视频在线播放| 一级片视频免费看| 女主播福利一区| 欧美一级视频在线观看| 国产精品福利电影| 91丝袜高跟美女视频| 中文字幕一区二区三区在线乱码| 97在线超碰| 欧美日韩亚洲综合一区二区三区| 中文字幕久热精品视频在线| 欧美日韩在线精品一区二区三区| 日本免费中文字幕在线| 偷拍一区二区三区| 国产乱女淫av麻豆国产| 黄色网一区二区| 色黄久久久久久| 日韩三级免费看| 蜜臀av性久久久久av蜜臀妖精| 国产精品久久7| 免费在线观看av网站| 姬川优奈aav一区二区| 中文av字幕在线观看| 亚洲精品国产setv| 欧美成人精品一区二区三区| 免费看污视频的网站| 丰满岳乱妇一区二区三区| 天堂精品一区二区三区| 国产精品蜜芽在线观看| 欧美一区二区三区四区久久 | 久久久精品免费免费| 中文字幕人妻熟女人妻洋洋| 美女视频一区| 亚洲人成在线电影| 中文字幕精品三级久久久| 国产成人精品影视| 影音先锋在线亚洲| 国产精成人品2018| 亚洲情综合五月天| 97久久久久久久| 不卡高清视频专区| 欧美人与动牲交xxxxbbbb| 日韩黄色三级| 中文字幕欧美日韩va免费视频| 国产成人精品网| 99久久精品费精品国产一区二区| 97在线免费视频观看| 综合久久伊人| 久久久国产精品视频| 最近国语视频在线观看免费播放| 久久综合久色欧美综合狠狠| 给我免费播放片在线观看| 日本免费精品| 欧美猛男性生活免费| 精品国产九九九| 亚洲欧美一区二区久久| www.久久com| 亚洲一级淫片| 91在线播放视频| 91麻豆国产福利在线观看宅福利| 91精品国产综合久久精品性色| 国产亚洲精品精品精品| 另类专区欧美蜜桃臀第一页| 亚洲一区二区三区加勒比| 欧美日韩成人影院| 中文在线资源观看视频网站免费不卡| www毛片com| 欧美国产乱子伦| 天天干天天草天天| 亚洲精品网址| 999日本视频| 国产福利在线免费观看| 亚洲国产又黄又爽女人高潮的| 日韩精品在线免费看| 91免费视频网| 黄色三级视频片| 首页国产精品| 99精品国产高清在线观看| 激情av在线| 亚洲美女视频网| 中文字幕永久在线观看| 亚洲日本护士毛茸茸| 国产xxx在线观看| 国产手机视频一区二区 | 色视频精品视频在线观看| 日韩欧美第一页| 欧美a级片免费看| 国产精品亚洲视频| 精品少妇人妻av免费久久洗澡| 伊人成综合网yiren22| 国产精品久久久久秋霞鲁丝 | 久久久久久久久久国产精品| 天堂在线中文字幕| 欧美日韩激情一区二区三区| 欧美精品videos极品| 26uuu欧美| 天堂中文av在线| 亚洲激情网站| 亚洲高清不卡一区| 99国产精品久久一区二区三区| 99久久婷婷国产综合精品青牛牛| 亚洲社区在线观看| 91麻豆视频在线观看| 午夜私人影院久久久久| 国产又黄又粗又猛又爽的| 成人avav在线| 欧美wwwwwww| 99视频+国产日韩欧美| 亚洲午夜精品久久| 偷拍自拍一区| 成人激情直播| 久久女人天堂| 欧美一区二区三区四区在线| caopen在线视频| 亚洲欧美日韩久久久久久| aaaa一级片| 日本精品一区二区三区高清| 欧美国产在线看| 亚洲国产精品99久久久久久久久| 中文字幕人妻一区| 麻豆91在线看| 不要播放器的av网站| 日韩午夜在线| 浴室偷拍美女洗澡456在线| 久久av综合| 97国产超碰| 国产精品久久久久久久久免费高清 | 精品国产电影一区| 国产女人18水真多毛片18精品| 国产夜色精品一区二区av| 在线精品视频播放| 国产精品一区二区在线观看网站| 能看的毛片网站| 亚洲欧美久久| 成人黄色av片| 欧美天堂亚洲电影院在线观看| 一本色道久久综合亚洲二区三区| 亚洲aaa级| 国产嫩草一区二区三区在线观看 | 国产精品视频一区二区三区经| 欧美91在线|欧美| 国产精品6699| 欧美特大特白屁股xxxx| 性金发美女69hd大尺寸| 污污的网站在线看| 欧美成人激情视频免费观看| 日本三级视频在线播放| 国产亚洲美女精品久久久| 极品白浆推特女神在线观看| 精品亚洲永久免费精品| 亚洲欧美日韩动漫| 日韩大片免费观看视频播放| 亚洲免费视频网| 欧美成人一区二区三区在线观看| 国产男男gay网站| 欧美久久久久久久久| 亚洲熟妇av乱码在线观看| 欧美性videosxxxxx| 亚洲图片视频小说| 欧美片在线播放| 888奇米影视| 正在播放亚洲一区| 国产美女精品视频国产| 日韩欧美综合在线| 午夜精品久久久久久久爽| 日韩久久精品一区| 免费观看黄色av| 亚洲欧美国产精品va在线观看| 亚洲三级中文字幕| 亚洲欧美日韩国产中文专区| jyzzz在线观看视频| 北条麻妃在线一区二区| mm1313亚洲国产精品美女| 九九综合九九综合| segui88久久综合9999| 97成人超碰免| 福利一区和二区| 成人激情春色网| 97品白浆高清久久久久久| 久久国产一区| 欧美日韩精品一区二区视频| 亚洲日本精品| 欧美精品99| 欧美色图另类小说| 麻豆国产欧美一区二区三区| 亚洲综合在线一区二区| 成人激情动漫在线观看| 特级西西www444人体聚色 | 日韩欧美国产亚洲| 色天天综合色天天久久| 国产精品美女一区| 亚洲丁香久久久| 国产福利电影在线| 欧美成人免费一级人片100| 午夜不卡影院| 亚洲在线免费视频| 欧美偷拍视频| 理论电影国产精品| 欧洲熟妇精品视频| 国产乱码一区二区三区| 稀缺小u女呦精品呦| 国产女主播视频一区二区| 久久免费播放视频| 91福利社在线观看| 精品久久久久久亚洲综合网站| 亚洲欧美一区二区三区久久| 国产二区三区在线| 欧洲永久精品大片ww免费漫画| 亚洲精品aa| 精品久久久三级| 最新国产精品| 熟女性饥渴一区二区三区| 国产一区二区三区在线观看精品 | 久久久久国产精品免费免费搜索| 国产男女猛烈无遮挡在线喷水| 婷婷久久综合九色综合伊人色| 在线观看免费高清视频| 亚洲精品一区中文字幕乱码| 日韩av毛片| 成人激情视频免费在线| 欧美伦理影院| 久久久精品在线视频| 国产成人午夜精品影院观看视频| 中文字幕有码在线播放| 婷婷综合另类小说色区| 亚洲精品喷潮一区二区三区| 色诱女教师一区二区三区| 欧美日韩视频免费观看| 黄色99视频| 在线观看日韩av电影| 免费网站在线观看黄| 欧美国产视频在线| 伊人中文字幕在线观看| 亚洲国产精品推荐| 污污片在线免费视频| 成人在线精品视频| 日韩午夜电影网| 国产福利一区视频| 久久亚洲精精品中文字幕早川悠里 | 欧美精品videosex极品1| 人人精品久久| 午夜精品一区二区三区四区| 免费看亚洲片| 美女脱光内衣内裤| 欧美日韩国产中文精品字幕自在自线| 午夜老司机福利| 欧美精品一区二区免费| 欧洲大片精品免费永久看nba| 婷婷视频在线播放| 狠狠色丁香九九婷婷综合五月| 久久日免费视频| 欧洲精品一区二区| eeuss影院在线播放| 国产精品嫩草影院久久久| 激情五月综合| www.精品在线| 中文字幕一区二区5566日韩| 中文字幕在线观看免费| 中文字幕在线观看日韩| 欧美网站免费| 综合久久国产| 国产福利视频一区二区三区| 九九视频免费观看| 精品国产精品网麻豆系列| av中文字幕在线观看第一页 | 天堂av2020| 亚洲日本成人在线观看| 国产同性人妖ts口直男| 欧美激情一区二区三区高清视频 | 亚洲精品在线电影| 国产高清自产拍av在线| 免费亚洲一区二区| 日韩国产欧美一区二区三区| 国产精品久久久免费看| 日韩欧美国产精品一区| 第一福利在线视频| 欧美另类视频在线| 久久精品99国产精品| 久久久久久久黄色| 亚洲精品视频在线观看视频| 国产韩日精品| 青青草免费在线视频观看| proumb性欧美在线观看| 色一情一乱一伦| 久久精品99久久久久久久久| 涩涩屋成人免费视频软件| 日本三级免费网站| 中文字幕亚洲区| 六月丁香综合网| 国产精品www色诱视频| 一本一道久久a久久精品蜜桃| 中文在线观看免费视频| 91成人在线精品| 天堂av最新在线| 欧美日韩在线精品| 国产成人精品亚洲日本在线桃色 | 国产一区二区无遮挡| 日韩精品一级二级| 国产一级片免费观看| 国产一区二区三区18| va天堂va亚洲va影视| 亚洲色欲综合一区二区三区| 亚洲欧美日韩一区| 你懂的好爽在线观看| 91在线无精精品一区二区| 久久久青草婷婷精品综合日韩| 一区二区国产精品精华液| 日韩极品精品视频免费观看| 成人国产精品久久|