精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AAAI 2025 | 大模型推理加速新范式:加速比高達3.51倍、成本降至1/3

人工智能 新聞
論文中提出的 Falcon 方法是一種增強半自回歸投機解碼框架,旨在增強 draft model 的并行性和輸出質量,以有效提升大模型的推理速度。

近日,中國電信翼支付針對大模型推理加速的最新研究成果《Falcon: Faster and Parallel Inference of Large Language Models through Enhanced Semi-Autoregressive Drafting and Custom-Designed Decoding Tree》已被 AAAI 2025 接收。

論文中提出的 Falcon 方法是一種增強半自回歸投機解碼框架,旨在增強 draft model 的并行性和輸出質量,以有效提升大模型的推理速度。Falcon 可以實現約 2.91-3.51 倍的加速比,在多種數據集上獲得了很好的結果,并已應用到翼支付多個實際業務中。

圖片

論文地址:https://arxiv.org/pdf/2412.12639

1. 研究背景

大型語言模型 (LLMs) 在各種基準測試中展現了卓越的表現,然而由于自回歸 (AR) 解碼方式,LLMs 在推理過程中也面臨著顯著的計算開銷和延遲瓶頸。

為此,研究學者提出 Speculative Decoding (投機采樣) 方法。Speculative Decoding 會選擇一個比原始模型 (Target Model) 輕量的 LLM 作為 Draft Model,在 Draft 階段使用 Draft Model 連續生成若干個候選 Token。在 Verify 階段,將得到的候選 Token 序列放入到原始 LLM 做驗證 & Next Token 生成,實現并行解碼。通過將計算資源導向于驗證預先生成的 token,Speculative Decoding 大大減少了訪問 LLM 參數所需的內存操作,從而提升了整體推理效率。

現有的投機采樣主要采用兩種 Draft 策略:自回歸 (AR) 和半自回歸 (SAR) draft。AR draft 順序生成 token,每個 token 依賴于前面的 token。這種順序依賴性限制了 draft 模型的并行性,導致顯著的時間開銷。相比之下,SAR draft 同時生成多個 token,增強了 draft 過程的并行化。然而,SAR draft 的一個重要局限是它無法完全捕捉相同 block 內 draft tokens 之間的相互依賴關系,可能導致生成的 token 接受率較低。

因此,在投機采樣中,平衡低 draft 延遲與高推測準確性以加速 LLMs 的推理速度,是一個重大挑戰。

為此,翼支付提出了 Falcon,一個增強的半自回歸(SAR)投機解碼框架,旨在增強 draft model 的并行性和輸出質量,從而提升 LLMs 的推理效率。Falcon 集成了 Coupled Sequential Glancing Distillation(CSGD)方法,提高了 SAR draft model 的 token 接受率。

此外,Falcon 還設計了一種專門的 decoding tree 來支持 SAR 采樣,使得 draft model 可以在一次前向傳播中生成多個 token,并且也能夠支持多次前向傳播。這種設計有效提升 LLMs 對 token 的接受率,進一步加快了推理速度。

2. 研究方法

Falcon 的架構如圖 1 所示,可以看到,該半自回歸解碼框架主要由三個組件構成:Embedding Layer、LM-Head 和半自回歸解碼 Head

圖片

圖 1 Falcon 框架圖

具體來講,Falcon 將一個時間步長之前的連續特征序列和當前 token 序列連接起來,以同時預測接下來的 k 個標記。例如,當 k = 2 時,Falcon 使用初始特征序列 (f1, f2) 和提前一個時間步長的標記序列 (t2, t3) 來預測特征序列 (f3, f4)。隨后,將預測得到的特征 (f3, f4) 與下一個標記序列 (t4, t5) 連接,形成新的輸入序列。這個新輸入序列用于預測后續的特征序列 (f5, f6) 和標記序列 (t6, t7),從而促進 draft 過程的繼續。Draft model 多次 forward 之后生成的 token 被組織成樹結構,輸入到大模型中進行 verify,通過 verify 的 token 被大模型接收,并基于此基礎開始下一個循環。

2.1 Coupled Sequential Glancing Distillation

當前推測解碼方法的準確性相對較低,主要原因是 token 之間的上下文信息不足。CSGD 通過用真實 token 和 hidden states 替換一些初始預測來改善這一點,將正確信息重新注入解碼過程中,從而提高后續預測的準確性和連貫性。模型結構及訓練流程如下圖:

圖片

圖 2 CGSD 方法示意圖

在訓練過程中,一個時間步長之前的連續特征序列和當前 token 序列連接起來,并輸入到 draft model 中,形成一個融合序列,其維度為 (bs, seq_len, 2 * hidden_dim)。

draft model 由一個混合 Transformer 網絡組成,該網絡包括兩層 LSTM、Relaxed Causal-Masked 多頭注意力機制,以及 MLP 網絡。其中 LSTM 網絡將融合序列的維度減少到 (bs, seq_len, hidden_dim),并保留關于過去 token 的信息,從而提高模型的準確性。Relaxed Causal-Masked 多頭注意力機制能夠在保持因果關系的同時,專注于輸入序列的相關部分。MLP 層進一步處理這些信息,以做出最終預測。

當序列首次通過 draft model 后,會生成初始的 token 預測圖片。然后,我們計算 draft model 的預測與真實 token Y 之間的漢明距離,以此來衡量預測的準確性。接下來,我們將一定數量連續預測的 token 序列圖片和特征序列圖片替換為來自 LLMs 的正確 token 序列圖片和特征序列圖片

CSGD 與傳統的 glancing 方法不同,后者僅隨機替換 token。相反,CSGD 選擇性地同時替換預測之前的連續 token 和特征序列,如圖 2 中虛線框標注的 choice 1、choice 2、choice3 所示。這種方法增強了對 token 間的關系的理解,并確保 draft model 能夠有效利用提前時間步長的 token 序列,這在 SAR 解碼中尤為重要。隨后,修正后的 token 和特征序列被重新輸入到 draft model 中以計算訓練損失。

在訓練過程中,我們采用了知識蒸餾,損失函數包括 draft model 的輸出特征與真實特征之間的回歸損失以及蒸餾損失,具體的損失函數如下:

圖片


2.2 Custom-Designed Decoding Tree

當前基于樹的推測解碼方法通過在每個起草步驟生成多個 draft token 來提升推測效率。然而,這些方法仍然需要 draft model 按順序生成 token,這限制了推測效率的進一步提高。為了解決這一局限性,CDT (Custom-Designed Decoding Tree) 支持 draft model 在一次前向傳遞中生成多個 token (k 個),并且在每個 draft 步驟中支持多次前向傳遞。因此,與現有方法相比,CDT 生成的草稿標記數量是其 k 倍。

Draft model 多次 forward 之后,生成的 token 被組織成樹結構,輸入到大模型中進行 verify。LLM 使用基于樹的并行解碼機制來驗證候選 token 序列的正確性,被接受的 token 及其相應的特征序列會在后續繼續進行前向傳遞。在傳統的自回歸(AR)解碼中,使用因果掩碼,其結構為下三角矩陣。它確保了前面的 token 不能訪問后面的信息。

相比之下,Falcon 采用了一種 causal 因果掩碼 (如圖 3 所示),允許模型訪問同一 k*k 的 block 內的 token 以及相應的之前的連續 token。這一增強顯著提高了 drafter 生成 token 的效率,使 LLM 能夠同時驗證更多的 token,從而加快了 LLM 的整體推理速度。

圖片

圖 3 Custom-Designed Decoding Tree 方法示意圖

3. 實驗結果

我們在多個數據集和多個模型上進行了廣泛的實驗,驗證了本文方法的有效性。和現有的方法相比,Falcon 展現了優越的性能,具體如下圖:

圖片

圖 4 Falcon 實驗結果圖

4. 業務潛力

Falcon 大模型可以實現約 2.91-3.51 倍的加速比,相當于同等條件下推理成本下降至約原先的 1/3,從而大幅降低了大模型推理計算相關成本。

當前,Falcon 技術已轉化至翼支付大模型產品 InsightAI 平臺,并已服務諸如翼支付數字人客服、借錢-翼小橙、人力-翼點通、財務-翼小財等多個業務應用。

5. 總結

投機采樣是大模型推理加速的一個核心方法。當前,主要的挑戰是如何提升 draft model 的準確率、采樣效率,并提升大模型的驗證效率。文章提出了 Falcon 方法,一種基于增強半自回歸投機解碼框架。Falcon 通過 CSGD 這種訓練方法以及半自回歸的模型設計,顯著提升了 draft model 的預測準確率以及采樣效率。此外,為了讓大模型能驗證更多的 token,本文精心設計了一個 decoding tree,有效提升了 draft model 的效率,從而提升了驗證效率。Falcon 在多種數據集上可以實現約 2.91-3.51x 的加速比并應用到翼支付的眾多業務中,獲得了很好的效果。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-01-05 09:33:37

視覺模型訓練

2025-09-26 10:58:03

AI視覺語言模型

2025-07-14 09:14:00

2024-02-20 13:13:00

模型訓練

2024-09-09 08:31:15

2024-07-19 09:59:31

2023-11-30 18:25:57

數據訓練

2025-04-11 09:15:00

語言模型AI數據

2025-06-26 09:06:59

2023-11-19 23:36:50

2025-06-30 08:42:00

模型訓練AI

2025-05-16 08:44:01

2025-06-09 09:32:35

2024-07-08 13:04:01

2024-01-24 13:11:00

AI模型

2024-04-03 12:32:00

數據訓練

2022-06-01 16:47:53

AI模型開源

2025-02-28 09:40:00

2025-02-06 10:16:00

2024-03-25 13:04:00

AI模型
點贊
收藏

51CTO技術棧公眾號

欧美一区视频| 日韩资源在线| 欧美日韩福利| 日韩av中文字幕在线播放| 97成人在线免费视频| 户外极限露出调教在线视频| 激情综合五月天| 91av视频在线观看| 亚洲精品国产精品乱码在线观看| 精品国产18久久久久久二百| 狠狠色狠狠色综合日日五| 亚洲精品永久www嫩草| 国内爆初菊对白视频| 视频精品一区二区| 欧美激情国产精品| 欧美成人久久久免费播放| 中文字幕视频精品一区二区三区| 欧美午夜性色大片在线观看| 中文精品一区二区三区| 天天av综合网| 国产成人综合亚洲91猫咪| 国产97色在线| 日韩少妇裸体做爰视频| 天天色天天射综合网| 日韩成人激情视频| wwwxxxx在线观看| 成人免费直播| 午夜电影网一区| 国产精品啪啪啪视频| 国产在线网站| 91亚洲国产成人精品一区二三 | 日本在线视频www鲁啊鲁| 久久久久国产精品麻豆| 成人av免费在线看| 国产精品一级视频| 日韩av不卡一区二区| 4438全国成人免费| 国产无套内射又大又猛又粗又爽| 色135综合网| 亚洲欧洲高清在线| 中文字幕一区二区三区人妻不卡| xxxx日韩| 日韩视频一区二区三区| 日本不卡一区二区在线观看| 成人性生活视频| 精品久久久久久久久久久久| 男人的天堂avav| 先锋影音在线资源站91| 亚洲欧美视频在线观看| 亚洲国产午夜伦理片大全在线观看网站 | 欧美一级二区| 欧美在线激情网| 黄色小视频在线免费看| 欧美日一区二区在线观看| 久久视频在线直播| 日韩欧美123区| 91国语精品自产拍| 欧美日韩成人在线视频| 欧美毛片在线观看| 亚洲午夜在线| 久久久久久久网站| 日本在线视频免费观看| 亚洲深夜av| 欧美制服第一页| www.av88| 激情久久五月天| 98国产高清一区| 欧美一区,二区| xfplay精品久久| 欧美主播一区二区三区美女 久久精品人| 青青青免费视频在线2| 久久久综合精品| 视频一区亚洲| 最近中文字幕免费mv2018在线| 亚洲精品国产a久久久久久| 国产激情片在线观看| 好看的中文字幕在线播放| 狠狠躁夜夜躁人人爽超碰91| 欧美激情成人网| 高清欧美日韩| 日韩欧美的一区| 超碰97在线资源站| 精品日本12videosex| 久久久精品久久| 国产精品成人久久| 日韩高清不卡一区二区三区| 91精品久久久久久久久青青| 99久久99久久久精品棕色圆| 成人午夜av影视| 蜜桃久久影院| 黄色av电影在线观看| 亚洲一区二区av在线| aaa毛片在线观看| 白嫩亚洲一区二区三区| 亚洲国产精品国自产拍av秋霞| 日韩av在线看免费观看| 欧美一区高清| 日本午夜精品理论片a级appf发布| 亚洲天堂视频在线播放| 成人免费视频免费观看| 日本日本精品二区免费| 新版中文在线官网| 91福利视频久久久久| 美女又黄又免费的视频| 亚洲三级精品| 久久久久久久久久久免费 | 宅男在线国产精品| 国产精品300页| 亚洲天堂一区二区三区四区| 91chinesevideo永久地址| 国产又大又粗又硬| 久久嫩草精品久久久久| 97av中文字幕| 国产一区二区三区四区五区3d| 亚洲精品一区二区精华| 可以免费看av的网址| 一区二区三区精品视频在线观看| 国产日韩欧美影视| 国产视频网站在线| 精品久久久国产| 在线中文字日产幕| 亚洲精品网址| 国产一区二区在线免费| 国产在线高清| 欧美午夜激情在线| 亚洲国产综合视频| 黄色亚洲大片免费在线观看| 成人天堂噜噜噜| av资源种子在线观看| 日韩欧美精品中文字幕| 好男人香蕉影院| 欧美日韩一视频区二区| 91网站在线看| 91麻豆一二三四在线| 欧美日韩激情在线| 少妇愉情理伦三级| 日韩va亚洲va欧美va久久| 欧美日韩精品免费观看| 一本大道色婷婷在线| 日韩av在线免费看| 好吊操这里只有精品| 高清久久久久久| h无码动漫在线观看| 国产精品视频首页| 精品国产欧美一区二区三区成人| 中文在线字幕av| 久久精品一区八戒影视| 亚洲爆乳无码专区| 国产日韩欧美一区二区三区| 欧洲中文字幕国产精品| 九色视频在线观看免费播放 | 国产又黄又粗又长| 中文字幕一区二区三| 欧美日韩理论片| 亚洲最新av| 不卡日韩av| 蜜桃视频www网站在线观看| 亚洲精品福利在线| 黄色片中文字幕| 日本一区二区三区四区| 天天干在线影院| 91亚洲自偷观看高清| 91亚洲精品一区二区| 亚洲综合图区| 亚洲高清免费观看高清完整版| 日干夜干天天干| 91视频你懂的| 五月天亚洲视频| 久久精品一区二区不卡| 91免费精品视频| 免费在线国产视频| 亚洲精品视频播放| 中文字幕人妻一区二区三区视频| 国产精品国产三级国产a| 日本一本在线视频| 国产精品色网| 亚洲精品国产精品国自产观看| 欧美一级免费| 久久久久久久久中文字幕| 国产最新视频在线| 91精品欧美久久久久久动漫 | 伊人久久综合| 欧美性xxxx69| 精品中文在线| 欧美亚州一区二区三区| 日本精品一区二区三区在线播放| 欧美成人精品3d动漫h| 天天操天天操天天操天天| 久久精子c满五个校花| 18深夜在线观看免费视频| 亚洲第一黄网| 亚洲欧洲一区二区| 久久久伦理片| 国产日韩在线视频| 两个人看的在线视频www| 中文字幕在线视频日韩| 天天色天天操天天射| 欧美少妇bbb| 久久午夜无码鲁丝片| 日本一区二区三级电影在线观看| 日本黄色三级网站| 青青草国产精品亚洲专区无| 美女黄色免费看| 久久美女视频| 麻豆成人av| 一区二区亚洲视频| 国产男人精品视频| 理论不卡电影大全神| 欧美男插女视频| 男人的天堂在线视频免费观看| 亚洲精品国产欧美| 国产毛片毛片毛片毛片| 一本大道av伊人久久综合| 国产精品99精品| 亚洲欧洲国产日韩| 国产又粗又长又黄的视频| 91麻豆免费看| 一级黄色电影片| 激情久久久久久久久久久久久久久久| 欧美综合在线观看视频| 亚洲日本欧美| www.亚洲成人网| 久久久久久美女精品| 亚洲精品成人自拍| 狠狠做深爱婷婷综合一区| 国产在线欧美日韩| 99久久人爽人人添人人澡| 91久久嫩草影院一区二区| 欧美大片1688网站| 国产精品久久一区| 亚洲成人不卡| 国产成人av在线| 欧美xoxoxo| 国产999精品久久久| 咪咪网在线视频| 538国产精品一区二区免费视频| 欧美卡一卡二| 国外成人性视频| 波多野结衣中文在线| 欧美激情成人在线视频| 国产在线观看免费麻豆| 麻豆国产va免费精品高清在线| 91精品专区| 色偷偷av一区二区三区| 91精彩视频在线播放| 中文字幕亚洲第一| 久久日韩视频| 欧美裸体xxxx极品少妇| 女囚岛在线观看| 欧美激情一级欧美精品| av资源一区| 欧美壮男野外gaytube| 免费亚洲电影| 国产精品久久999| **精品中文字幕一区二区三区| 国产在线观看91精品一区| 亚洲免费一区| 俄罗斯精品一区二区| 国内精品偷拍| 欧美另类网站| 日本午夜一区| 佐佐木明希av| 99国产精品久久久久久久| 欧美成人一区二区在线观看| 亚洲一区免费| 五月婷婷六月合| 国产精品中文有码| 国产精品扒开腿做爽爽爽a片唱戏| 99久久精品免费| 成人一级片免费看| 亚洲精品视频在线观看免费| 久久久久久久黄色| 一本色道亚洲精品aⅴ| ,亚洲人成毛片在线播放| 欧美一区二区三区播放老司机| 色综合免费视频| 中文字幕成人在线| 四虎影院观看视频在线观看| 97精品欧美一区二区三区| 日韩精品影片| 亚洲自拍偷拍第一页| 欧美调教在线| 一区二区日本伦理| 韩国亚洲精品| 天堂在线资源视频| 岛国av在线一区| 精品人体无码一区二区三区| 一区二区高清视频在线观看| 91美女免费看| 欧美一级片在线看| 男人天堂资源在线| 欧美xxxx18国产| 成人做爰视频www网站小优视频| 91亚洲精华国产精华| 羞羞答答一区二区| 亚洲小视频在线播放| 久久黄色网页| 国产a级片视频| 国产精品家庭影院| 特级西西444www大精品视频免费看| 欧美日韩1234| 免费成人av电影| 久久青草福利网站| 五月天色综合| 日本10禁啪啪无遮挡免费一区二区| 91国语精品自产拍| 欧美性猛交xxx乱久交| 不卡影院免费观看| 性色av无码久久一区二区三区| 日韩欧美在线视频| 四虎永久在线观看| 欧美大片在线看免费观看| 免费高清视频在线一区| 久久久久久国产精品免费免费| 综合日韩在线| 日日干夜夜操s8| 久久精品男人的天堂| 日本一区二区不卡在线| 日韩美女在线视频| 麻豆视频网站在线观看| 国产精品日韩欧美综合| 亚洲免费成人av在线| 国产精品又粗又长| 国产成人高清在线| 懂色av懂色av粉嫩av| 精品1区2区3区| 国产九九在线| 国产成人综合av| 在线一级成人| 日本女优爱爱视频| 久久久精品中文字幕麻豆发布| 久久久国产高清| 日韩禁在线播放| 在线视频超级| 久久久亚洲综合网站| 国产精品久久国产愉拍| 91丨porny丨对白| 婷婷国产在线综合| 日本人妻丰满熟妇久久久久久| 欧美激情免费在线| 2021年精品国产福利在线| 国产在线无码精品| 国产成人综合网| 久久视频免费在线观看| 精品成人一区二区三区四区| 欧美xxxx免费虐| 国产另类第一区| 一本色道久久综合一区| 黄色正能量网站| 色综合久久综合网97色综合| 欧美777四色影视在线| 日本精品久久电影| 欧美一区二区麻豆红桃视频| 日本人视频jizz页码69| 国产精品免费aⅴ片在线观看| 依依成人在线视频| 久久精品久久久久久国产 免费| 不卡的国产精品| 伊人久久在线观看| www.久久久久久久久| 久久久久久久久久久影院 | 手机av在线播放| 国产精品伊人日日| 久久黄色网页| 中日韩一级黄色片| 精品成人a区在线观看| 色在线中文字幕| 亚洲精品不卡| 高清国产午夜精品久久久久久| 日韩精品――中文字幕| 国产一区二区三区视频免费| 日本午夜免费一区二区| 亚洲高潮无码久久| 99精品视频在线免费观看| 中文无码av一区二区三区| 欧美裸体xxxx极品少妇| 亚洲婷婷丁香| 亚洲18在线看污www麻豆| 亚洲一区在线观看网站| 国产原创av在线| 91天堂在线视频| 性欧美暴力猛交另类hd| 成人信息集中地| 日韩av一区二区在线观看| 日韩黄色在线| 免费看国产一级片| 中文字幕在线不卡一区| 丰满少妇一级片| 国产精品久久不能| 在线观看日韩av电影| 微拍福利一区二区| 亚洲丁香久久久| 91精品国产一区二区在线观看| 91丨porny丨探花| 亚洲欧美在线另类| 免费一级毛片在线观看| 91成人理论电影| 日本欧美大码aⅴ在线播放| 亚洲国产精品成人无久久精品| 色阁综合伊人av|