精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大模型推理無損加速6.5倍!EAGLE-3碾壓一切、延續Scaling Law能力

人工智能 新聞
近日,EAGLE 團隊的新作《EAGLE-3: Scaling up Inference Acceleration of Large Language Models via Training-Time Test》通過一系列優化解鎖了投機采樣的 Scaling Law 能力,可以將大語言模型的推理速度提高 6.5 倍,同時不改變大語言模型的輸出分布,確保無損。

自回歸解碼已然成為大語言模型的推理標準。大語言模型每次前向計算需要訪問它全部的參數,但只能得到一個 token,導致其生成昂貴且緩慢。

近日,EAGLE 團隊的新作《EAGLE-3: Scaling up Inference Acceleration of Large Language Models via Training-Time Test》通過一系列優化解鎖了投機采樣的 Scaling Law 能力,可以將大語言模型的推理速度提高 6.5 倍,同時不改變大語言模型的輸出分布,確保無損。同時,隨著訓練數據的增加,加速比還能進一步提高。

圖片

  • 論文標題:EAGLE-3: Scaling up Inference Acceleration of Large Language Models via Training-Time Test
  • arXiv 地址:https://arxiv.org/abs/2503.01840
  • 項目地址:https://github.com/SafeAILab/EAGLE
  • SGLang 版本:https://github.com/sgl-project/sglang/pull/4247

EAGLE-3 的加速效果(DeepSeek-R1-Distill-LLaMA 8B 在數學推理數據集 GSM8K 上測試,其他模型在多輪對話數據集 MT-bench 上測試):

圖片

不同方法的生成速度對比:

背景

投機采樣使用一個小的模型快速生成草稿,一次生成多個 token。目標大語言模型通過一次前向計算并行驗證草稿的正確性,輸出正確的草稿,并確保無損。EAGLE 系列是投機采樣的最快實現。

EAGLE-1 在更有規律的特征層面而不是 token 層面進行自回歸,同時輸入采樣結果(超前一個時間步的 token)消除了不確定性,明顯提升了草稿模型的準確率。EAGLE-2 利用草稿模型的置信度近似接受率,據此動態地調整草稿樹的結構,進一步提升了投機采樣的效率。 

最新的大模型通過使用越來越多的訓練數據以取得更好的性能。比如說,對于 LLaMA 系列 7B(8B)大小的模型,LLaMA 1、LLaMA 2 和 LLaMA 3 分別使用了 1T、2T、15T token 訓練數據,模型結構和推理成本基本不變的前提下各項指標取得了明顯提升。

EAGLE-3 的作者們希望通過增加草稿模型的訓練數據量以提高接受率和加速比(藍色曲線)。遺憾的是, EAGLE-1 從訓練數據增加中得到的提升非常有限(紅色曲線)。

EAGLE-1 和 EAGLE-3 的加速比隨著訓練數據的增加而變化的趨勢:

圖片

動機

EAGLE 在特征層進行自回歸,再使用目標模型的分類頭得到草稿 token。這種方式利用了目標模型的中間結果和信息,相比 token 層自回歸有更好的性能。因為草稿模型的最終任務是預測草稿 token,EAGLE 的損失函數包括兩部分,一部分是特征預測損失,另一部分是 token 預測損失。特征預測損失也可以被認為是一種約束,限制了模型的表達能力。

EAGLE-3 的作者們進行了實驗驗證,觀察第一個草稿 token 的接受率 0-α,在數據集較小時,特征預測損失在訓練數據較少時可以提高性能,但嚴重損害了草稿模型的 scaling up 能力。

圖片不過,不使用特征預測損失會導致生成后續草稿 token 時的輸入偏離訓練分布,導致第二個草稿 token 的接受率 1-α 嚴重下降。為了解決這一問題,EAGLE-3 使用 “訓練時測試” 模擬多步生成,從而兼顧了模型的 scaling up 能力和生成多個草稿 token 的能力。

圖片

EAGLE、Medusa 等投機采樣方法都重用目標模型的最后一層特征作為草稿模型的提示,但 EAGLE-3 的作者們發現這存在缺陷。大語言模型的最后一層特征經過線性變換就能得到下一個 token 的分布。對于滿秩的分類頭,最后一層特征和下一個 token 的分布一一對應。最后一層特征只有下一個 token 的信息,失去了目標模型的全局性質。

因此,EAGLE-3 不再使用目標模型的最后一層特征作為輔助信息,而是混合目標模型的低層、中層、高層信息來作為草稿模型的輸入。

方法

與其他投機采樣方法一致,EAGLE-3 交替執行草稿階段和驗證階段。

草稿階段以下圖為例。在預填充或者上一個驗證階段,EAGLE-3 記錄模型的低、中、高層特征序列,分別記為 l、m 和 h,拼接 k 維向量 l、m 和 h 得到 3k 維向量,然后通過一個全連接層將其降維到 k 維,就得到融合了不同層級信息的特征 g,其中 k 為目標模型的隱藏層維度。目標是生成以 “How can I” 為前綴的草稿 token 序列,只輸入 g_how 和 g_can,草稿模型無法感知隨機的采樣過程。

因此 EAGLE-3 引入采樣結果 I 的詞向量嵌入 e_I。將 g 與對應的超前一個時間步的嵌入 e 拼接,即 g_how 與 e_can 拼接,g_can 和 e_I 拼接。將拼接后的向量通過全連接層降到 k 維,并將其輸入進一個單層的 transformer 得到 a。然后,將 a 輸入分類頭,采樣得到第一個草稿 token “do”。

在 step 1,以 “How can” 為前綴時,EAGLE-3 重用了來自目標模型的 g_how 和 g_can。

在 step 2,前綴是 “How can I”。理想的方式是重用來自目標模型的 g_how、g_can 和 g_I。但這是不可能的,因為 token “I” 還沒有被目標模型檢查,無法獲取 g_I。EAGLE-3 用上一個 step 草稿模型的輸出 a_I 替代 g_I,拼接 a_I 與采樣結果 “do” 的詞向量嵌入作為草稿模型 step2 的輸入。

在 step 3,同樣無法獲得 g_do,所以使用 a_do 代替,拼接 a_do 與 e_it 作為草稿模型的輸入。之后的 step 同理。

圖片

實驗

EAGLE-3 在多輪對話、代碼、數學推理、指令遵循、總結五項任務上分別使用 MT-bench、Humaneval、GSM8K、Alpaca、CNN/DM 數據集進行了實驗,并與 7 種先進的投機采樣方法(SpS、PLD、Medusa、Lookahead、Hydra、EAGLE、EAGLE-2)進行了比較。

該實驗分別在 Vicuna (V), LLaMA-Instruct 3.1 (L31), LLaMA-Instruct 3.3 (L33), DeepSeek-R1-Distill-LLaMA (DSL) 上進行。

圖片

表格中的 Speedup 為加速比,τ 為平均接受長度,也就是目標模型每次前向計算能生成的 token 數。EAGLE-3 每次前向計算能生成大約 4-7 個 token,而自回歸解碼每次生成 1 個 token,因此 EAGLE-3 明顯加速了大語言模型的生成,加速比為 3.1x-6.5x。

在所有任務和模型上,EAGLE-3 的加速比和平均接受長度都是最高的,明顯優于其他方法。

應用

EAGLE-3 發布第一天就被集成到 SGLang 中。在生產級框架中,EAGLE-3 也有數倍加速效果。以下實驗由 SGLang 團隊提供并以 LLaMA 3.1 8B(batch size=1, 1x H100)為例。

圖片

投機采樣往往被認為在大 batch size 下會降低吞吐量。但是在 SGLang 這一生產級框架下,EAGLE-3 在 batch size 為 64 時仍可以提高 38% 的吞吐量,而 EAGLE 在 batch size 為 24 時就導致吞吐量下降。這里 1.00x 以 SGLang (w/o speculative) 的吞吐量作為基準。以下實驗由 SGLang 團隊提供并以 LLaMA 3.1 8B(1x H100)為例。 

圖片

作者介紹

李堉暉:北京大學智能學院碩士,滑鐵盧大學訪問學者,受張弘揚老師和張超老師指導,研究方向為大模型加速和對齊。

魏芳蕓:微軟亞研院研究員,研究方向為具身智能、圖像生成和 AI agents。

張超:北京大學智能學院研究員,研究方向為計算機視覺和大模型加速。

張弘揚:滑鐵盧大學計算機學院、向量研究院助理教授,研究方向為大模型推理加速、AI 安全和世界模型。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-12-14 13:30:00

AI模型

2025-11-18 09:11:48

2025-03-27 09:47:23

訓練模型AI

2024-09-11 12:31:59

2024-07-19 09:59:31

2025-01-08 13:15:02

2024-12-10 07:00:00

大模型密度定律人工智能

2024-09-09 08:31:15

2023-05-23 14:06:53

微軟研究

2024-10-11 14:00:00

模型數據

2023-01-05 09:33:37

視覺模型訓練

2025-07-07 08:56:00

2025-04-08 00:40:00

谷歌合成數據大模型

2023-11-22 11:40:00

Meta模型

2024-01-24 13:11:00

AI模型

2024-11-11 17:35:11

2023-12-06 13:36:00

模型數據

2024-09-02 14:30:00

數據訓練

2024-08-29 14:05:00

數據模型

2025-11-20 10:25:07

點贊
收藏

51CTO技術棧公眾號

日本精品一区二区三区在线| 精品伦理精品一区| 伊人色综合影院| 精品人妻午夜一区二区三区四区| 亚洲国产日本| 永久免费看mv网站入口亚洲| 日本高清免费观看| 北岛玲heyzo一区二区| 国产精品久99| 久久青青草原| 国产伦一区二区| 国产一区二区三区久久| 日韩一区二区三区国产| 国产激情第一页| 9.1麻豆精品| 色综合天天综合在线视频| 五月天色婷婷综合| 久久视频www| 国产精品99久久久久久宅男| 日本一区二区在线免费播放| 青娱乐在线视频免费观看| 精品久久不卡| 日韩成人性视频| 亚洲AV无码久久精品国产一区| 在线最新版中文在线| 亚洲日韩欧美一区二区在线| 狠狠色噜噜狠狠色综合久| 国产精品爽爽久久久久久| 亚洲一区二区三区免费在线观看| 欧美大片va欧美在线播放| 少妇无套高潮一二三区| 亚洲免费一区三区| 欧美一区二区国产| 高潮一区二区三区| 欧美国产日韩电影| 欧美性生交xxxxxdddd| 大伊香蕉精品视频在线| 制服丝袜在线播放| 国产精品第五页| 日韩在线导航| 男男激情在线| 91免费在线播放| 国产欧美日韩视频一区二区三区| 99精品久久久久久中文字幕| 免费一区二区视频| 国产精品成人免费视频| 在线观看日本网站| 香蕉av777xxx色综合一区| 欧美激情视频在线观看| 欧美黑吊大战白妞| 中文字幕一区二区三区乱码图片 | 少妇极品熟妇人妻无码| 中文成人激情娱乐网| 欧美日韩亚洲不卡| 中文字幕av专区| 91超碰碰碰碰久久久久久综合| 欧美性猛交xxxx富婆弯腰| 国模无码视频一区二区三区| 天堂中文最新版在线中文| 午夜婷婷国产麻豆精品| 黄www在线观看| 中文字幕色婷婷在线视频| 疯狂做受xxxx欧美肥白少妇| 国产精品网站免费| 日本久久免费| 欧美日韩国产小视频在线观看| 日本激情视频在线播放| 永久免费观看精品视频| 欧美一级高清片在线观看| 欧美一区二区三区影院| 一区三区自拍| 日韩经典第一页| 国产123在线| 91精品一区二区三区综合在线爱| 欧美另类在线播放| 精品成人免费视频| 日韩二区三区在线观看| 国产一区红桃视频| 99久久精品免费看国产交换| 成人av免费网站| 欧美一区国产一区| 免费a级在线播放| 亚洲一级二级三级在线免费观看| 青青草视频在线免费播放| 老司机2019福利精品视频导航| 欧美日韩视频在线观看一区二区三区 | 在线播放精品视频| 久久se这里有精品| av一区二区三区免费| 午夜一区在线观看| 国产精品美女久久久久久久久久久 | 素人啪啪色综合| 欧美女孩性生活视频| 午夜免费一级片| 国产劲爆久久| 中文字幕久热精品在线视频| 成人观看免费视频| 久久狠狠一本精品综合网| 成人av在线天堂| 天堂中文在线观看视频| 国产精品久久久久久久久图文区| www.夜夜爱| 性感美女一区二区在线观看| 欧美一级高清大全免费观看| 国产激情在线免费观看| 在线看片不卡| 国产精品国内视频| 蜜桃视频久久一区免费观看入口| 中文字幕免费一区| 欧美日韩一道本| 精品一区二区三区视频在线播放| 亚洲美女精品久久| 久久久久久久中文字幕| 蜜桃精品在线观看| 久久精精品视频| 污污视频在线看| 欧美日韩一区二区三区在线| 亚洲第一黄色网址| 午夜精品av| 国产日韩欧美视频在线| 青青操视频在线| 亚洲午夜在线观看视频在线| 在线观看免费不卡av| 最新亚洲精品| 久久久久久久久久久免费精品| 一区二区视频网站| 久久综合九色综合97婷婷女人 | av色综合久久天堂av色综合在| 色综合欧美在线| 欧美图片自拍偷拍| 91tv精品福利国产在线观看| 国产精品麻豆va在线播放| 日韩电影网址| 精品久久久一区二区| 精品国产一二区| 最新精品国产| 91综合免费在线| 免费网站成人| 欧美日韩亚洲综合一区二区三区| 在线观看国产精品一区| 亚洲欧美日本国产专区一区| 国产日本一区二区三区| 欧洲性视频在线播放| 日韩一区二区免费在线观看| 美女三级黄色片| 国产一区二区调教| 一级黄色录像免费看| 亚洲一区二区三区久久久| 中文字幕在线看视频国产欧美在线看完整| 国产黄色免费观看| 国产亚洲欧洲997久久综合| 亚洲成熟丰满熟妇高潮xxxxx| 少妇一区二区三区| 日本电影亚洲天堂| 黄色在线视频观看网站| 91成人网在线| 日本伦理一区二区三区| 久久99国产精品免费| 在线看成人av电影| 精品一区二区三区中文字幕视频| 欧美精品在线免费观看| www.色婷婷.com| 亚洲丶国产丶欧美一区二区三区| 国产精品久久久久久亚洲av| 一本色道久久精品| 涩涩涩999| 亚洲一区二区av| 久久久久久中文字幕| 少妇无码一区二区三区| 欧美日韩国产一中文字不卡 | 亚洲欧美高清视频| 偷拍一区二区三区| 日本aaa视频| 免费观看一级特黄欧美大片| 久久久成人精品一区二区三区| 亚洲精品国产九九九| 97精品在线视频| 精品乱码一区二区三四区视频| 欧美日韩精品一区二区三区蜜桃| fc2ppv在线播放| 国产福利一区二区| 日日橹狠狠爱欧美超碰| 成人影院在线| 风间由美一区二区三区| 成人欧美magnet| 日韩一区二区欧美| 午夜在线视频免费| 欧美日韩免费观看一区二区三区 | 一本一本久久| 亚洲国产午夜伦理片大全在线观看网站| 亚洲日本免费电影| 97视频在线观看视频免费视频 | 国模精品视频一区二区| 精彩国产在线| 日韩欧美资源站| 99re国产在线| 一区二区三区中文在线| 在线免费看黄视频| 国产ts人妖一区二区| 91av在线免费播放| 亚洲特色特黄| 亚洲韩国在线| 欧美有码在线| 91黄在线观看| 国产91在线播放精品| 97视频在线观看成人| 日本美女在线中文版| 亚洲精品久久久久久久久久久| 国产又大又黑又粗| 色欧美日韩亚洲| 国产亚洲精品久久777777| 中文字幕久久午夜不卡| 欧美一区二区免费在线观看| 国产麻豆精品theporn| 老头吃奶性行交视频| 亚洲激情一区| 奇米777四色影视在线看| 欧美色图国产精品| 久久久久久精| 国产精品久av福利在线观看| 成人免费网站在线看| 欧洲亚洲两性| 26uuu久久噜噜噜噜| 色呦呦视频在线观看| 久久韩国免费视频| av网站无病毒在线| 亚洲视频一区二区| 日韩av资源站| 精品亚洲夜色av98在线观看 | 国产亚洲观看| 国产日韩视频在线观看| 国产成人精品123区免费视频| 97在线视频免费看| 97天天综合网| 久久久久久久国产| 少女频道在线观看免费播放电视剧| 色一情一乱一区二区| 免费av在线电影| 日韩毛片在线观看| 亚洲欧美日韩精品永久在线| 亚洲国模精品私拍| 天天干天天舔天天射| 亚洲精品国产精品国自产在线 | 欧美多人乱p欧美4p久久| 成人日日夜夜| 久久99久国产精品黄毛片入口| a免费在线观看| 欧美成人午夜影院| 肉肉视频在线观看| 欧美夫妻性生活xx| 国产美女一区视频| 午夜伦理精品一区| 日韩深夜视频| 国产精品18久久久久久首页狼| 国产精品伦理| 国产精品女人久久久久久| 外国成人毛片| 99re视频在线播放| 国产成人一二片| 欧美极品jizzhd欧美| 国产欧美日韩一区二区三区四区| 日韩精品资源| 999国产精品永久免费视频app| 国产高清免费在线| 欧美激情精品久久久六区热门| 800av在线免费观看| 亚洲区第一页| 精品久久久久久中文字幕2017| 麻豆国产欧美日韩综合精品二区| 国产美女18xxxx免费视频| 国产精品一区二区视频| 欧美在线一级片| 久久精品无码一区二区三区| 国产wwwwxxxx| 一区二区三区日韩欧美精品| 男女视频免费看| 欧美日精品一区视频| 精品国产区一区二| 国产丝袜一区视频在线观看| chinese偷拍一区二区三区| 欧美精品在线播放| 精品国产免费人成网站| 成人午夜小视频| 亚洲黄页在线观看| 一本一道久久a久久精品综合| 狠狠综合久久av一区二区老牛| 免费无码国产v片在线观看| 久久爱www久久做| 国产制服丝袜在线| 亚洲精品中文在线观看| 久久免费激情视频| 欧美一区二区在线不卡| 天堂资源中文在线| 久久夜色精品亚洲噜噜国产mv | 91精品一区二区| 日韩激情毛片| 国产免费内射又粗又爽密桃视频| 先锋影音久久久| 亚洲熟女一区二区三区| 中文字幕第一区| 日韩女同强女同hd| 欧美乱妇23p| 色播色播色播色播色播在线| 萌白酱国产一区二区| 一区二区视频免费完整版观看| 国产精品二区三区| 天天揉久久久久亚洲精品| 精品一卡二卡三卡| 成人亚洲一区二区一| 免费成人美女女在线观看| 欧美日韩中文在线| 动漫av一区二区三区| 久久精品成人欧美大片| 日韩电影av| 精品国产一区二区三区麻豆小说 | 高清一区二区三区四区| 久久精品成人欧美大片古装| 日本电影欧美片| 久久青青草原| 一区二区三区精品视频在线观看| gogo亚洲国模私拍人体| 国产精品麻豆久久久| 亚洲无码精品一区二区三区| 亚洲第一国产精品| 日韩另类在线| 99久久无色码| 亚洲人metart人体| 中文字幕22页| 国产精品毛片久久久久久| 日韩黄色片网站| 国产丝袜一区二区| 美女100%一区| 久久久影院一区二区三区| 中国女人久久久| 国产视频久久久久久| 午夜伦欧美伦电影理论片| xxxx18国产| 欧美激情喷水视频| 77成人影视| 久久久久99精品成人片| 国产69精品久久久久毛片| 欧美卡一卡二卡三| 精品美女一区二区三区| 欧美伦理免费在线| 国产精品久久波多野结衣| 伊人久久亚洲影院| 中文字幕天堂av| 午夜精品久久久久久| 日本wwwxxxx| 97超级碰碰碰久久久| 少妇高潮一区二区三区| 美女网站免费观看视频| 欧美激情一区在线| 一道本无吗一区| 久久躁日日躁aaaaxxxx| 亚洲1区在线| 日本中文字幕亚洲| 久久综合色之久久综合| 麻豆成人免费视频| 中文字幕av一区中文字幕天堂| 日韩三区四区| 妺妺窝人体色www看人体| av中文字幕亚洲| 成人av网站在线播放| 中文字幕精品一区久久久久| 久久影院一区二区三区| 免费看欧美黑人毛片| 91麻豆.com| 又污又黄的网站| 欧美成人第一页| 台湾色综合娱乐中文网| 15—17女人毛片| 亚洲精选视频在线| 香港三日本三级少妇66| 国产精品午夜视频| 国产主播精品| 51妺嘿嘿午夜福利| 欧美一区二区美女| 625成人欧美午夜电影| 一区二区不卡在线观看| 高清不卡在线观看| www.com亚洲| 欧美成年人视频网站| 网红女主播少妇精品视频| 一区二区三区 日韩| 亚洲国产综合在线| 国产小视频在线观看| 91久久精品一区二区别| 免费精品视频| 国产性xxxx| 精品亚洲一区二区三区在线播放| 日本午夜精品久久久久| 成人免费观看cn| 国产精品久久久久久久浪潮网站| 秋霞av鲁丝片一区二区| 国产日韩欧美中文| 免费欧美在线| 免费在线观看日韩| xxxx性欧美| 怕怕欧美视频免费大全|