精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

小紅書提出大模型推理加速算法 HASS 刷新 SOTA

人工智能
生成式大語言模型(LLMs)在各種任務上表現(xiàn)出令人驚嘆的能力。然而,由于其固有的自回歸解碼機制,人們難以在這些模型上高效推理,這限制了它們在時間敏感場景中的應用。投機采樣技術通過利用額外的資源來增加并發(fā)性,提供了一種大模型推理加速的解決方案。

在大模型推理領域,投機采樣是一種被廣泛使用的無損加速算法。近期一些投機采樣的工作將大模型的上下文信息(例如 hidden states 和 KV cache)引入草稿模型,可以充分利用大模型的知識來提升加速比,但這類算法也會帶來訓練和解碼的上下文不一致問題。此外,我們也發(fā)現(xiàn)現(xiàn)有算法在訓練和解碼的目標上也存在一定的不一致現(xiàn)象。小紅書中臺算法團隊提出的 HASS 算法在目標和上下文上對齊了草稿模型的訓練和解碼階段,達到了普通推理速度的 2.81~4.05 倍,相比 SOTA 方法 EAGLE-2 提升 8%~20%,相關技術已應用在小紅書實際業(yè)務場景中。

論文地址

https://arxiv.org/pdf/2408.15766


圖片


01 背景

生成式大語言模型(LLMs)在各種任務上表現(xiàn)出令人驚嘆的能力。然而,由于其固有的自回歸解碼機制,人們難以在這些模型上高效推理,這限制了它們在時間敏感場景中的應用。投機采樣技術通過利用額外的資源來增加并發(fā)性,提供了一種大模型推理加速的解決方案。

投機采樣(Speculative Sampling) 

投機采樣是一種先起草再驗證的解碼范式。在每一步解碼時,先高效地生成多個草稿 token,再使用目標 LLM 并行地驗證這些 token 來加速推理。  表示想要加速推理的目標 LLM,  表示基于前綴  從目標 LLM 生成下一個 token 的條件概率分布(簡寫為  )。  表示一個更高效的草稿模型,  表示基于前綴  從草稿模型生成下一個 token 的條件概率分布(簡寫為  )。投機采樣分為如下3步:

1.使用更高效的草稿模型  來生成  個草稿 token。

2.使用目標 LLM  來并行地驗證這些草稿 token 以及它們從  被生成的概率,接受能使得輸出分布和  一致的所有草稿 token。

3.如果某個草稿 token 被拒絕后,從修正后的分布中采樣一個額外的 token 替代它;如果所有的草稿 token都被接受,額外增加一個新的 token。

具體驗證過程如下:從  中采樣一個草稿 token  ,如果  則接受  ;否則將以  的概率拒絕并從修正分布  中重新采樣一個 token 接受。

經(jīng)證明,對于任意的  和  ,如此得到的 token 總是與目標 LLM 分布一致。目標 LLM 的每一次前向推理至少產生一個新的 token,而至多產生  個新的 token,生成的個數(shù)取決于目標 LLM 和草稿模型的對齊程度。

投機采樣的實際性能取決于兩個因素:草稿模型的解碼成本及其與目標 LLM 的對齊程度。為了獲得與目標 LLM 高度對齊的高效草稿模型,近期的工作提出利用目標 LLM 的上下文信息。例如,EAGLE 使用目標 LLM 的 hidden states 作為草稿模型的輸入特征。然而,這些方法在訓練和解碼階段引入了不一致的上下文,如圖 2 所示。在訓練期間,草稿模型總是能獲取到目標 LLM 在先前時間步的 hidden states。但在解碼期間,草稿模型卻無法獲取到未被驗證時間步的目標 LLM 的 hidden states,這導致了訓練和解碼階段的上下文不一致。這一問題可以看作是投機采樣中在特征層面的 exposure bias。

圖片

訓練和解碼階段之間還存在目標上的不一致。在解碼階段,草稿模型的目標是生成目標 LLM 會賦予高概率的 token。在這種情況下,草稿模型應更關注于召回這些高概率 token,而對它們之間的具體順序則可以稍微放松。另外,大部分 LLM 在應用時采取核采樣或 top-k 采樣。在這些解碼策略中,高概率 token 對輸出起著更重要的作用。因此,為了獲得高效的草稿模型,它的訓練目標應考慮到解碼階段的這些特性。據(jù)我們所知,現(xiàn)有的涉及訓練草稿模型的投機采樣方法普遍忽視了這些解碼目標。

02 方法

為解決上述的訓練和解碼階段不一致問題,我們提出了協(xié)調投機采樣(HASS),旨在通過訓練階段學習協(xié)調的表征來解決上述問題。我們的方法包含兩部分:(1)為了讓草稿模型在訓練階段感知到解碼目標,HASS 將推薦系統(tǒng)中的排序蒸餾思想擴展到投機采樣,即協(xié)調目標蒸餾;(2)為了解決訓練和解碼間的上下文不一致,我們提出了一種多步的對齊訓練策略,即協(xié)調上下文對齊。結合這兩部分,HASS 顯著提高了 LLM 的推理速度。在無需額外推理開銷的情況下,也保持了草稿模型訓練的高效。

協(xié)調目標蒸餾(Harmonized Objective Distillation)

HASS 通過引入推薦系統(tǒng)中的排序蒸餾思想,優(yōu)先考慮草稿模型解碼時更重要的一些 token。具體來說,排序蒸餾的目標是訓練學生模型,使其對教師模型中排名靠前的項賦予更高的排序。在投機采樣中,草稿模型是學生模型,而目標 LLM 是教師模型。具有類似特性的草稿模型在解碼階段將獲得更高的接收率。設 K 個概率最高的 token 組成的集合為  ,其中  代表整個詞匯表。HASS 在訓練時使用以下的 Top-K 蒸餾損失:

  

其中  和  分別表示目標 LLM 和草稿模型預測下一個詞的條件概率分布。在結合 EAGLE 時,訓練階段可以從目標 LLM 的 hidden states 中獲取  ,這意味著結合 Top-K 損失訓練有著和 EAGLE 一樣的訓練效率。

協(xié)調上下文對齊(Harmonized Context Alignment)

圖片

HASS 采用了多步的對齊訓練策略,使草稿模型在訓練和解碼階段的上下文保持一致。具體來說,HASS 將訓練過程分為 n 步,使草稿模型能夠利用與解碼階段一致的上下文特征。過程如下:

  • 第一步與 EAGLE 的訓練相同。在時間步 t+1,草稿模型以目標LLM的特征  作為輸入并生成草稿模型特征  。這一步中,注意力掩碼與因果掩碼一致,不做修改。
  • 第二步利用了來自第一步的特征。在時間步 t+1 的自注意力機制中,使用  來生成 query。key 和 value 由  生成,其中  表示拼接操作,  表示早于時間步 t 的特征。注意力掩碼被修改以確保  看到的前一個特征始終是  ,如圖 3 中的“HASS Training Step 2“所示。
  • 對于第 j 步(j ≥ 3),前一步生成的特征  用于生成時間步 t+1 的query,而 key 和 value 由  生成。

HASS 的訓練開銷是 EAGLE 的 n 倍,但解碼開銷不變。后續(xù)實驗證明,HASS 的加速效果在 n 值較小時就會收斂,因此是訓練高效的,具體實現(xiàn)請參考論文的附錄部分。

03 實驗

主要實驗

圖片

如表 1、2 所示,HASS 在所有的數(shù)據(jù)集和目標 LLM 上都表現(xiàn)出了最高的接受長度和最優(yōu)的加速比。大部分方法在 HumanEval 數(shù)據(jù)集上加速效果最好,因為代碼生成任務中的固定模版對于草稿模型更易生成從而加速。盡管 PLD 和 Lookahead 無需訓練,但是它們的性能都顯著弱于 EAGLE、EAGLE-2 和 HASS。

協(xié)調目標蒸餾的消融實驗

圖片

我們改變了 Top-K 損失的 K 和權重,結果如圖 4 所示。使用 Top-K 損失訓練(權重大于 0)時,總是能提升草稿模型的接受長度。當 K 值很小時(K=1)會導致性能下降,可能是因為草稿模型過度關注概率最高的 token 而忽視了其他潛在 token。在 K=5 時,草稿模型的接受長度最大。

圖片

我們還嘗試了更多關注高概率 token 的損失函數(shù)以替換 Top-K 損失,結果如表 3 所示。BiLD 損失在 T=0 時表現(xiàn)最好,Top-K 損失在 T=1 時表現(xiàn)最好??傮w上,Top-K 損失的表現(xiàn)最好。

協(xié)調上下文對齊的消融實驗

圖片

我們改變了協(xié)調上下文對齊的對齊步數(shù),將用 Top-K 損失訓練后的 EAGLE-2 權重作為基準,結果如表 4 所示。在不使用協(xié)調上下文對齊時(EAGLE-2+Top-K),草稿模型的效果最差。用 3 或 4 步協(xié)調上下文對齊訓練的草稿模型總體上能獲得最優(yōu)的接受長度。當對齊步數(shù)增加到 5 步時,接受長度反而會下降,這可能是因為草稿模型的能力有限,當過度關注后幾步的 token 生成時就會導致在前幾步的預測精度下降。

圖片

我們畫出了 HASS 和 EAGLE-2 在每一步生成token時的接受率曲線,如圖 5 所示??梢娫诤髱撞缴?token 時,HASS 的接受率顯著高于 EAGLE-2,驗證了協(xié)調上下文對齊的有效性。

圖片

但在 LLaMA2-Chat 13B 和 LLaMA3-Instruct 70B 上,HASS 的第一步接受率相比 EAGLE-2 下降了。這可能是因為草稿模型關注后幾步的 token 生成而忽視了第一步的,但第一步的接受率對于接受長度非常關鍵。因此我們考慮調整訓練時每一步對齊的損失權重,來強調前幾步的重要性。具體的,我們對于第 j 步的訓練損失乘上權重  ,結果如表 5 和圖 6 所示。當  從 1.0 降到 0.5 時,草稿模型的接受長度不斷提高。其在第一步的接受率也對應增長,而后幾步的接受率有所下降。當  下降到 0.3 時,訓練過程過分強調了第一步 token 生成,導致了接受長度下降。我們將在多步對齊間取得平衡的探索留到后續(xù)工作中。

04 作者簡介

  • 樂凡

小紅書中臺算法工程師,目前主要負責大語言模型的相關研究和應用。


  • 曉丹

小紅書中臺算法工程師,目前主要負責大語言模型的相關研究和應用。


  • 特圖

小紅書中臺算法基礎模型方向負責人,主要研究方向:多模態(tài)大模型 x 內容分發(fā)技術。


  • 瑞格

小紅書中臺算法團隊負責人。

責任編輯:龐桂玉 來源: 小紅書技術REDtech
相關推薦

2025-08-05 09:09:00

AI訓練模型

2025-08-20 07:49:28

2017-08-31 10:48:59

CNN 模型壓縮算法

2023-01-05 09:33:37

視覺模型訓練

2025-11-18 10:00:56

2025-08-07 16:24:19

小紅書開源dots.vlm1

2023-07-27 13:58:19

2025-08-07 02:00:00

2025-08-01 09:03:16

2024-01-12 21:18:22

負樣本大模型蒸餾

2024-09-09 08:31:15

2024-01-16 17:17:30

模型訓練

2024-09-10 13:30:00

2025-08-13 09:00:00

AI模型訓練

2025-11-03 08:15:00

2025-02-10 08:30:00

2023-05-30 14:17:00

模型推理

2025-11-04 08:46:00

2023-11-19 23:36:50

2025-03-03 08:00:00

小紅書AI圖像檢測模型AI
點贊
收藏

51CTO技術棧公眾號

欧美激情二区| 久久精品性爱视频| 韩国女主播一区二区| 中文字幕精品一区二区精品绿巨人| 国产精品久久久久av免费| 一级黄色录像毛片| 国产精品亚洲一区二区在线观看 | 91免费版黄色| 成人午夜视频精品一区| 成人在线丰满少妇av| 欧美xingq一区二区| 日韩人妻精品无码一区二区三区| 97最新国自产拍视频在线完整在线看| 国产精品中文欧美| 国产成人综合亚洲| 欧美精品久久久久性色| 国产a久久精品一区二区三区| 666欧美在线视频| 精品国产一区三区| 在线观看麻豆蜜桃| 91色porny蝌蚪| 亚洲sss综合天堂久久| 日韩久久久久久久久久久久久| 黑人玩弄人妻一区二区三区| 成人av免费电影网站| 亚洲天堂成人网| 麻豆av一区二区三区| 99热这里只有精品在线| 水蜜桃久久夜色精品一区的特点| 色综合天天狠天天透天天伊人| www.av天天| 老司机精品视频在线播放| 8x8x8国产精品| 亚洲天堂av线| 成人动漫一区| 精品久久久久久久久中文字幕| 特级西西444| 1024国产在线| 久久精品人人做人人综合| 精品国产_亚洲人成在线| 国产免费高清av| 美女任你摸久久| 国产成人精品一区二区| 好吊操这里只有精品| 一区二区电影| 久久精品国产成人| 长河落日免费高清观看| 国内成人精品| 亚洲午夜女主播在线直播| 岛国精品资源网站| 一区二区三区视频播放| 日韩视频一区二区三区在线播放| 少妇一级淫免费播放| 欧美与亚洲与日本直播| 欧美无砖专区一中文字| 激情五月婷婷久久| 日韩欧美另类一区二区| 日韩欧美国产免费播放| 国产在线观看福利| 国产免费不卡| 在线观看精品一区| 中文字幕第36页| 国产一区二区三区四区五区3d| 欧美系列一区二区| 伊人网在线综合| 国产精品欧美激情在线| 亚洲欧洲日本韩国| 亚洲自拍偷拍欧美| 国产妇女馒头高清泬20p多| 国产美女情趣调教h一区二区| 亚洲高清三级视频| 久久综合色视频| 偷拍中文亚洲欧美动漫| 欧美亚洲国产一卡| 中文字幕一区二区在线观看视频 | 北岛玲一区二区| 欧美在线导航| 一区二区亚洲精品国产| 天天色影综合网| 欧美激情视频一区二区三区免费| 欧美极品少妇与黑人| 日韩欧美中文字幕一区二区| 久久精品盗摄| 成人做爰www免费看视频网站| 国产成人免费看一级大黄| 国产成人一区在线| 免费99视频| 瑟瑟视频在线| 亚洲国产婷婷综合在线精品| 欧美 日韩精品| 99久久婷婷国产综合精品首页| 欧美人动与zoxxxx乱| 精品国产aⅴ一区二区三区东京热| 精品欠久久久中文字幕加勒比| 亚洲美女久久久| 国产日产精品一区二区三区的介绍| 综合久久99| 秋霞av国产精品一区| 在线免费看av片| 国产aⅴ综合色| 欧美三级电影在线播放| www国产在线观看 | 国产露脸国语对白在线| 成人av在线播放网址| 日韩欧美99| 啦啦啦中文在线观看日本| 日韩欧美成人网| 曰本三级日本三级日本三级| 天堂在线观看免费视频| 激情婷婷综合| 久久躁日日躁aaaaxxxx| 国产婷婷色一区二区在线观看| 精品无人码麻豆乱码1区2区| 久久久久久艹| av在线网址观看| 在线观看区一区二| 成人免费无码大片a毛片| 天天做天天爱天天爽综合网| 5566日本婷婷色中文字幕97| 精品久久久久久亚洲综合网站 | 国产精品久久久免费| 成人免费直播live| 韩国福利在线| 午夜精品久久久久久久久久| 手机在线国产视频| 国产精品欧美在线观看| 午夜精品福利视频| 精品国产九九九| 国产精品麻豆久久久| 日本在线视频www| 超碰97久久| 欧美老妇交乱视频| 国产精品主播一区二区| 亚洲国产精品成人综合色在线婷婷| 波多野结衣之无限发射| 在线精品国产亚洲| 久久69精品久久久久久久电影好 | 亚洲国产福利在线| 2021亚洲天堂| 久国产精品韩国三级视频| 欧美中日韩免费视频| 亚洲午夜天堂| 亚洲黄页网在线观看| 免费在线一级片| 国产美女娇喘av呻吟久久| 亚洲黄色成人久久久| 免费欧美电影| 亚洲香蕉av在线一区二区三区| 97久久久久久久| 99精品视频在线播放观看| 久久久久久久9| caoporn成人| 欧美精品久久久久久久| 亚洲AV午夜精品| 亚洲一二三区在线观看| 亚洲免费观看在线| 在线成人av| 精品久久久久久一区| 345成人影院| 亚洲视频免费一区| 最新中文字幕在线观看视频| 亚洲国产高清aⅴ视频| 午夜国产一区二区三区| 国产高清一区二区| 97人人澡人人爽| cao在线视频| 亚洲乱码一区av黑人高潮| 无码人妻精品一区二区| 中文字幕免费不卡| 免费黄频在线观看| 黄色欧美成人| 美乳视频一区二区| 成人自拍视频网| 久久综合久久88| 成人免费一级视频| 欧美日韩亚洲网| 国产三级黄色片| 国产精品原创巨作av| 搞av.com| 欧美伦理影院| 91成人免费在线观看| caoprom在线| 亚洲夜晚福利在线观看| 国产乱码精品一区二区| 亚洲国产精品天堂| 第一次破处视频| 国产自产视频一区二区三区| 成人性免费视频| 日本欧美国产| www.成人av.com| 男人最爱成人网| 久久精品这里热有精品| 性高潮久久久久久久久久| 欧美怡红院视频| 久草视频手机在线观看| 久久精品日韩一区二区三区| 韩国三级丰满少妇高潮| 免费精品视频| 2021狠狠干| 免费欧美激情| 波多野结衣成人在线| 欧美福利在线播放| 久久久久久国产精品三级玉女聊斋| 免费资源在线观看| 精品久久久久久久一区二区蜜臀| 亚洲精品男人天堂| 亚洲欧美福利一区二区| 无码人妻精品一区二区三应用大全| 免费高清成人在线| 欧美成人三级在线视频| 日本欧美视频| 久久综合一区二区三区| 午夜日韩影院| 国产美女被下药99| 亚洲欧美小说色综合小说一区| 欧美精品一区二区免费| 国产精品一区在线看| 精品99一区二区| 亚洲天堂中文字幕在线| 日韩欧美精品中文字幕| 豆国产97在线 | 亚洲| 中文字幕制服丝袜一区二区三区 | 国产免费叼嘿网站免费| 日本二三区不卡| 日韩黄色一级大片| 亚洲已满18点击进入久久| 人人艹在线视频| 国产清纯白嫩初高生在线观看91| 黄色在线免费播放| 国产精品18久久久久久久久| 91国产精品视频在线观看| 国产亚洲毛片| 欧美在线一区视频| 狠久久av成人天堂| 自拍偷拍一区二区三区| 青青草国产成人a∨下载安卓| 久久久综合亚洲91久久98| av综合网址| 国产精品视频一区二区三区经| 精品国模一区二区三区欧美| 成人激情视频在线播放| 粉嫩91精品久久久久久久99蜜桃| 欧美中文字幕在线播放| 成人观看网址| 91高清视频免费| 免费毛片b在线观看| 91av在线播放视频| 欧亚在线中文字幕免费| 69视频在线免费观看| 欧美a级在线观看| 1769国产精品| 亚洲最大成人| 国产精品久久久久久久久久小说| 我爱我色成人网| 国产精品久久久久久久久久久不卡| www.日韩| 国产精品久久久久久av福利软件| 日本美女一区| 国产精品久久久久7777婷婷| 精品裸体bbb| 成人免费福利视频| 欧美二区观看| 国产区日韩欧美| 天海翼精品一区二区三区| 久久久99国产精品免费| 久久最新网址| 亚洲综合激情五月| 午夜电影亚洲| 免费观看日韩毛片| 三级不卡在线观看| 欧美性猛交xxxx乱大交91| 东方欧美亚洲色图在线| 制服丝袜第二页| 国产日韩精品一区二区三区在线| 战狼4完整免费观看在线播放版| 国产精品不卡在线观看| 免费一级a毛片夜夜看| 精品国产乱码久久久久久虫虫漫画| 7799精品视频天天看| 欧美日韩视频在线观看一区二区三区 | 国产综合久久久久| 999久久久精品一区二区| 久久精品国产理论片免费| 欧美丝袜一区| www.好吊操| 日韩精品三区四区| 国产九九九视频| 久久久综合精品| 欧美一级特黄高清视频| 亚洲va中文字幕| 亚洲熟女乱色一区二区三区久久久| 欧美一区二区三区免费大片| 四虎精品成人免费网站| 国产日韩欧美电影| 一级性生活免费视频| 午夜精品久久久久久久99水蜜桃| 一级黄色av片| 精品久久久久香蕉网| 麻豆国产在线播放| 欧美成人剧情片在线观看| 高清不卡av| 国产91视觉| 日韩久久视频| 欧洲黄色一级视频| 国产一区二区在线观看免费| 欧美一区二区三区成人精品| 亚洲欧美日韩在线| 三级网站在线播放 | 香港三日本三级少妇66| 日韩在线精品一区| 一区二区乱码| 成人欧美一区二区三区视频| 成人av国产| 欧美日韩在线中文| 国产91精品精华液一区二区三区| 91精品国自产在线| 欧美视频中文字幕在线| wwwav网站| 精品国偷自产在线视频| 欧美黑人一区| 精品一区2区三区| 国产在线日韩| 伊人五月天婷婷| 国产农村妇女毛片精品久久麻豆| 亚洲精品国产精品乱码| 欧美刺激脚交jootjob| 午夜激情视频在线观看| 国产精品99蜜臀久久不卡二区| 美女一区二区在线观看| 加勒比海盗1在线观看免费国语版| 日产欧产美韩系列久久99| 91av在线免费| 婷婷亚洲久悠悠色悠在线播放| 精品黑人一区二区三区在线观看| zzjj国产精品一区二区| 国产精品无码久久久久| 3d成人动漫网站| aaa一区二区三区| 日韩亚洲欧美中文在线| 香蕉视频亚洲一级| 欧美乱偷一区二区三区在线| 国产一区二区三区的电影| 午夜剧场免费看| 亚洲制服丝袜在线| 亚洲精品字幕在线| 欧美巨乳在线观看| 一区二区三区四区高清视频| 真实国产乱子伦对白视频| 国产精品一区一区| 久久久久人妻一区精品色欧美| 欧美一卡2卡三卡4卡5免费| 国产激情小视频在线| 国产精品网站入口| 欧美wwwww| 91亚洲一区二区| 亚洲在线一区二区三区| 丰满人妻一区二区三区四区53 | 国产精品18在线| 欧美另类高清zo欧美| 香蕉视频在线播放| 2019国产精品视频| 激情久久婷婷| 亚洲国产欧美视频| 欧美丝袜自拍制服另类| 麻豆免费在线观看| 97se亚洲综合| 99精品视频免费观看视频| 中文字幕xxx| 日韩精品电影在线| 中文字幕av久久| 久久国产欧美日韩精品| 欧美日韩在线视频免费播放| 亚洲第一网站男人都懂| 希岛爱理一区二区三区av高清| 五月天色一区| 国产激情视频一区二区三区欧美 | 毛茸茸free性熟hd| 福利二区91精品bt7086| 国产在线一在线二| 91精品视频专区| 亚洲青涩在线| 蜜桃传媒一区二区亚洲| 4438x亚洲最大成人网| heyzo在线欧美播放| 日韩免费三级| 丰满岳乱妇一区二区三区| 69视频免费在线观看| 色偷偷88888欧美精品久久久| 亚洲视频国产精品| 男人的天堂99| 一区二区三区在线视频免费观看| 亚洲aaaaaaa| 国产原创欧美精品| 精品成人久久| 国产黄色片在线| 日韩精品在线免费| 日本精品一区在线| 一区二区三区欧美视频| 黄上黄在线观看| 国产精品免费看一区二区三区|