精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

超大模型推理加速2.18倍!SGLang聯(lián)合美團(tuán)技術(shù)團(tuán)隊(duì)開源投機(jī)采樣訓(xùn)練框架

人工智能 新聞
SGLang,當(dāng)前趨勢(shì)下最受青睞的推理框架之一,為DeepSeek提供了專屬優(yōu)化,也深受英偉達(dá)、AMD、xAI等廠商喜愛。

專門適用超大模型、帶來2.18倍推理加速,最新投機(jī)采樣訓(xùn)練框架開源!

SGLang團(tuán)隊(duì)聯(lián)合美團(tuán)搜推平臺(tái)、Cloudsway.AI開源SpecForge。

SGLang,當(dāng)前趨勢(shì)下最受青睞的推理框架之一,為DeepSeek提供了專屬優(yōu)化,也深受英偉達(dá)、AMD、xAI等廠商喜愛。

這一次開源,主要是針對(duì)當(dāng)下超大模型趨勢(shì)。

隨著Kimi K2、Qwen Coder的開源,越來越多的超大型模型進(jìn)入大家的視野。這些模型具有強(qiáng)勁的性能,但受制于模型尺寸導(dǎo)致推理效率較低。對(duì)于超大尺寸的模型,除了進(jìn)一步優(yōu)化算子之外。還有像投機(jī)采樣這樣的技術(shù)能加速它們的推理。

投機(jī)采樣(Speculative Sampling)通過引入輕量級(jí)的輔助模型來提升推理效率,同時(shí)確保結(jié)果的質(zhì)量和正確性。

目前性能強(qiáng)勁的投機(jī)采樣技術(shù)分別有MTPEagle3,但MTP其需要在預(yù)訓(xùn)練階段與基礎(chǔ)模型一起訓(xùn)練,限制了MTP在業(yè)界的廣泛應(yīng)用。而Eagle3作為一種訓(xùn)練后而集成的技術(shù),很適合在已開源的超大尺寸模型上繼續(xù)訓(xùn)練,而進(jìn)一步提升推理效率。

SpecForge正是基于Eagle3,它不僅是首個(gè)支持超大模型投機(jī)采樣訓(xùn)練并開箱即用的框架,還與SGLang推理引擎深度集成。一鍵打通投機(jī)采樣訓(xùn)練推理全流程。

為何推出新的Spec訓(xùn)練框架?

投機(jī)采樣(speculative decoding)已成為大語言模型(LLM)推理加速的共識(shí)方案,但其端到端訓(xùn)練工具的缺失仍是明顯短板。目前開源社區(qū)中,尚無能夠支持超大尺寸模型訓(xùn)練且與SGLang深度結(jié)合的框架,而這些工具層面的不足,直接導(dǎo)致此類模型的部署面臨巨大挑戰(zhàn)。

SpecForge為此而來,一個(gè)專為投機(jī)采樣訓(xùn)練而生、并與SGLang原生集成的生態(tài)系統(tǒng),其核心功能包括:

  • 原生支持最新開源架構(gòu):SpecForge支持主流模型,包括復(fù)雜的MoE層和Transformer變體。
  • 可擴(kuò)展的分布式訓(xùn)練:SpecForge集成了FSDP(Fully Sharded Data Parallel)和TP(Tensor Parallelism)等并行策略,可在GPU集群上實(shí)現(xiàn)高效擴(kuò)展。
  • 內(nèi)存高效訓(xùn)練優(yōu)化:顯著降低了大規(guī)模模型訓(xùn)練時(shí)的內(nèi)存開銷;即使是萬億參數(shù)的基礎(chǔ)模型,訓(xùn)練Eagle3也同樣高效。

SpecForge核心特性

Eagle3集成

Eagle是一種最先進(jìn)的投機(jī)采樣方法,旨在加速大型語言模型推理。它通過訓(xùn)練一個(gè)專門的輕量級(jí)草稿模型來準(zhǔn)確預(yù)測(cè)較大目標(biāo)模型的token分布,從而實(shí)現(xiàn)高接受率和顯著的性能提升。下圖展示了Eagle3的端到端訓(xùn)練流程:

圖片

訓(xùn)練時(shí)測(cè)試(TTT)支持

EAGLE3的高性能提升主要來源于其創(chuàng)新的訓(xùn)練時(shí)測(cè)試(Training-Time Test)架構(gòu),該架構(gòu)通過模擬多步生成來增強(qiáng)草稿模型的健壯性。盡管TTT性能強(qiáng)大,但其實(shí)現(xiàn)卻極具有挑戰(zhàn)性,因?yàn)樗蕾囉趶?fù)雜的專用注意力掩碼(specialized attention masks)和遞歸式數(shù)據(jù)循環(huán)(recursive data loops)。

SpecForge將這一復(fù)雜過程完全封裝,提供了內(nèi)置且經(jīng)過驗(yàn)證的TTT支持。實(shí)現(xiàn)嚴(yán)格參照了官方Eagle3的核心邏輯,以確保其計(jì)算的正確性與性能,從而免除底層實(shí)現(xiàn)負(fù)擔(dān)。

雙重訓(xùn)練模式:在線與離線

SpecForge通過提供兩種訓(xùn)練模式:在線(Online)和離線(Offline)來簡(jiǎn)化隱藏狀態(tài)的收集,隱藏層的收集是Eagle類模型的特點(diǎn)。它通過主模型的隱藏層訓(xùn)練草稿模型,讓草稿模型整體分布和主模型對(duì)齊。

該框架的雙模式設(shè)計(jì)能讓用戶能找到高效的訓(xùn)練模式,關(guān)于在線和離線訓(xùn)練的優(yōu)缺點(diǎn)如下文所示。

圖片

選擇在線或離線模式,可以根據(jù)您的具體需求和資源調(diào)整訓(xùn)練過程。

  • 在線模式:可實(shí)現(xiàn)最大速度和靈活性。它非常適合快速實(shí)驗(yàn)和存儲(chǔ)有限的場(chǎng)景,因?yàn)樗軇?dòng)態(tài)生成數(shù)據(jù),無需大量磁盤空間。
  • 離線模式:適用于可復(fù)現(xiàn)性和數(shù)據(jù)復(fù)用至關(guān)重要的場(chǎng)景。通過預(yù)先計(jì)算和存儲(chǔ)隱藏狀態(tài),此模式可保證實(shí)驗(yàn)之間的一致性,在存儲(chǔ)空間充足時(shí)效率很高。

擴(kuò)展性優(yōu)先

SpecForge在設(shè)計(jì)時(shí)高度重視可擴(kuò)展性,以滿足工程生產(chǎn)需求。該框架使用模塊化接口實(shí)現(xiàn)了新草稿模型和主模型的直接實(shí)現(xiàn)和注冊(cè)。

為了實(shí)現(xiàn)可擴(kuò)展性,團(tuán)隊(duì)實(shí)現(xiàn)了多種訓(xùn)練時(shí)并行策略。包括FSDP(Fully Sharded Data Parallel) 和TP并行實(shí)現(xiàn),確保超大型模型的高效訓(xùn)練。

實(shí)驗(yàn)

為驗(yàn)證SpecForge的有效性,團(tuán)隊(duì)利用它在包含320K樣本的ShareGPT和UltraChat數(shù)據(jù)集上,為L(zhǎng)LaMA 4訓(xùn)練了Scout和Maverick草稿模型。

這些模型在MT-Bench等行業(yè)標(biāo)準(zhǔn)基準(zhǔn)上表現(xiàn)出色,充分證明了其模型質(zhì)量以及與Eagle3架構(gòu)的兼容性。特別值得一提的是,團(tuán)隊(duì)為L(zhǎng)lama 4 Maverick訓(xùn)練的草稿模型在MT-Bench上實(shí)現(xiàn)了2.18倍的推理加速。

詳細(xì)的實(shí)驗(yàn)結(jié)果與性能指標(biāo)總結(jié)如下。

在下圖所示的所有測(cè)試中,x軸代表投機(jī)采樣步長(zhǎng),對(duì)應(yīng)于SGLang中的speculative-num-steps。同時(shí),將 SGLang 的speculative-eagle-topk固定為8,將speculative-num-draft-tokens固定為10,這樣可以使用 tree attention達(dá)到更高的接受率。為了找到最優(yōu)的投機(jī)采樣參數(shù),可以使用SGLang代碼庫中的bench_speculative腳本。該腳本會(huì)在不同配置下運(yùn)行吞吐量基準(zhǔn)測(cè)試,針對(duì)硬件調(diào)優(yōu)出最佳性能。

圖片圖片

最后,可以在GitHub上查看源代碼,并在Hugging Face上試用已訓(xùn)練的模型。

GitHub倉庫: 訓(xùn)練框架的完整源代碼,包括TTT和數(shù)據(jù)處理的實(shí)現(xiàn)細(xì)節(jié)。https://github.com/sgl-project/SpecForge

Hugging Face模型:下載LLaMA 4 Scout(https://huggingface.co/lmsys/sglang-EAGLE3-Llama-4-Scout-17B-16E-Instruct-v1)和Maverick(https://huggingface.co/lmsys/sglang-EAGLE3-Llama-4-Maverick-17B-128E-Instruct-v1)Eagle3 heads(不含完整模型)用于您的項(xiàng)目。

SpecForge的Roadmap如下:

  • 支持更多模型架構(gòu),包括Kimi K2和Qwen-3 MoE。
  • 將視覺-語言模型 (VLM) 集成到 SpecForge 中。
  • 通過更好的并行策略和kernel優(yōu)化來支持更高效的訓(xùn)練。

Blog地址:https://lmsys.org/blog/2025-07-25-spec-forge/

團(tuán)隊(duì)成員

SGLang核心團(tuán)隊(duì):Shenggui Li、Shuai Shi、Fan Yin、Yikai Zhu、Yi Zhang、Yingyi Huang、Yineng Zhang 及其他成員。

美團(tuán)搜推平臺(tái):Chao Wang

SafeAILab團(tuán)隊(duì):Yuhui Li、Hongyang Zhang及其成員

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2024-11-02 10:28:03

2023-01-05 09:33:37

視覺模型訓(xùn)練

2022-04-26 15:09:14

優(yōu)化模型訓(xùn)練

2023-09-12 14:45:18

2025-06-30 08:42:00

模型訓(xùn)練AI

2023-05-30 14:17:00

模型推理

2025-03-07 09:57:01

2025-04-11 09:15:00

語言模型AI數(shù)據(jù)

2023-09-12 13:43:00

智能技術(shù)

2024-11-21 15:00:00

大語言模型數(shù)據(jù)

2022-03-21 17:56:59

大模型訓(xùn)練訓(xùn)練框架

2022-03-21 15:06:10

模型字節(jié)跳動(dòng)框架

2022-07-18 17:37:27

字節(jié)跳動(dòng)人工智能AI模型

2025-10-14 08:58:00

2025-10-24 12:14:32

2015-05-28 09:54:33

美團(tuán)docker容器

2025-07-07 08:46:00

2024-11-01 13:30:56

2025-11-06 09:03:00

2025-06-05 08:40:00

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

日韩精品极品视频| 精品毛片三在线观看| 91精品综合视频| 欧美日韩人妻精品一区二区三区| 超碰97久久国产精品牛牛| 亚洲影视在线播放| 欧美综合激情| 国产理论片在线观看| 99在线精品免费视频九九视| 国产性猛交xxxx免费看久久| 午夜天堂在线视频| 欧产日产国产精品视频| 亚洲欧美在线视频观看| 精品一区二区久久久久久久网站| 国产偷人爽久久久久久老妇app| 亚洲激情久久| 亚洲一级片在线看| 日本少妇xxx| 视频一区在线免费看| 一区二区三区蜜桃| 亚洲一区3d动漫同人无遮挡 | 国产专区一区| 中文欧美日本在线资源| 亚洲精品乱码久久| 国产精品va视频| 色狠狠桃花综合| 成人黄色大片网站| 超碰caoporn久久| 国产日韩精品一区二区三区 | 亚州精品一二三区| 青青青免费在线视频| 亚洲精品免费看| 日韩和欧美的一区二区| 亚洲 欧美 激情 小说 另类| 国产不卡一区视频| 成人性生交xxxxx网站| 无码人妻精品一区二区三区蜜桃91| 欧美日韩亚洲三区| 久久亚洲春色中文字幕| 成年人网站免费在线观看 | 欧美电影一区二区| 激情综合网俺也去| 黑人巨大精品| 福利一区福利二区微拍刺激| 草草草视频在线观看| 嫩草香蕉在线91一二三区| 久久综合狠狠综合久久综合88| 99久久伊人精品影院| 国产色综合视频| 国内精品在线播放| 成人淫片在线看| 怡春院在线视频| 麻豆精品在线看| 国产精品美女久久久免费| 性色av免费观看| 乱人伦精品视频在线观看| 51ⅴ精品国产91久久久久久| 国产一级aa大片毛片| 欧美色一级片| 久久久欧美一区二区| 麻豆一区二区三区精品视频| 黄色成人av网站| 久久人人爽人人| 国产一级淫片a| 国产精品视区| 国产精品黄色影片导航在线观看| 国产一级一级国产| 青青青伊人色综合久久| 国产欧美精品一区二区三区介绍| 亚洲图片视频小说| 国产麻豆成人精品| 国产精品 日韩| 婷婷在线免费观看| 久久婷婷国产综合国色天香 | 91精品国产91久久久久久黑人| 神马久久久久久| 亚洲色图综合区| 在线观看的日韩av| 日本精品一区二区三区在线播放视频| 青青视频在线免费观看| 久久国产精品第一页| 亚洲一区二区三区sesese| 亚洲精品视频91| 26uuuu精品一区二区| 日韩欧美在线电影| 在线你懂的视频| 亚洲成人动漫av| av网址在线观看免费| 免费成人高清在线视频| 欧美一级片在线看| 午夜一区二区三区免费| 色777狠狠狠综合伊人| 欧美黑人又粗大| 亚洲av无码精品一区二区| 精品在线你懂的| 国产视频一区二区不卡| 粉嫩一区二区三区国产精品| 亚洲免费观看高清完整版在线| 国产无限制自拍| 福利一区和二区| 欧美videossexotv100| 精品无码一区二区三区| 中文无码久久精品| 日本一区二区在线免费播放| 国产黄色片免费| 久久久久久电影| 久久手机在线视频| 天然素人一区二区视频| 精品久久久久久综合日本欧美| 妺妺窝人体色WWW精品| 欧美激情日韩| 国产女精品视频网站免费| 亚洲乱码精品久久久久..| 国产欧美中文在线| 激情深爱综合网| 欧美日韩黄色| 中文字幕在线亚洲| 欧美在线观看不卡| 国产精品综合在线视频| 无遮挡亚洲一区| 欧美13videosex性极品| 日韩精品专区在线影院观看| 你懂得视频在线观看| 国产精品嫩草99av在线| 成人3d动漫一区二区三区91| 91精品大全| 日韩欧美高清视频| 日韩www视频| 国产综合色产| 97神马电影| 黄网址在线观看| 欧美色偷偷大香| 伊人网伊人影院| 亚洲精选91| 国产精品二区二区三区| a级在线观看| 欧美日本不卡视频| 亚洲精品91在线| 日日夜夜免费精品视频| 欧美大香线蕉线伊人久久国产精品| 七七成人影院| 日韩欧美精品在线| 青娱乐国产盛宴| 国产精品白丝av| 大桥未久一区二区三区| 国产精区一区二区| 久久精品国产免费观看| 国产一区二区三区黄片| 亚洲天堂久久久久久久| 午夜啪啪小视频| 婷婷综合社区| 91系列在线观看| www在线观看播放免费视频日本| 在线电影欧美成精品| 午夜精品一区二区三级视频| 精品写真视频在线观看| 大地资源第二页在线观看高清版| 成人免费91| 九九热这里只有精品免费看| 亚洲精品911| 五月天一区二区| 午夜一区二区三区免费| 老牛国产精品一区的观看方式| 欧美性色黄大片人与善| 国产精品美女午夜爽爽| www.欧美精品一二三区| 国产情侣激情自拍| 亚洲午夜一二三区视频| 欲求不满的岳中文字幕| 国产毛片一区| 亚洲国产日韩美| 四虎国产精品成人免费影视| 欧美成人在线免费| 高h放荡受浪受bl| 色婷婷精品大在线视频| 狂野欧美性猛交| 国产福利电影一区二区三区| 可以看毛片的网址| 国产精品最新| 亚洲在线视频福利| 手机av在线| 日韩在线中文字| 黄色a在线观看| 在线精品视频一区二区三四 | 欧美日韩黑人| 91九色在线观看| 九色porny丨国产首页在线| 国产亚洲欧美日韩美女| 国产乱叫456在线| 欧美日韩精品国产| 男人av资源站| 久久综合成人精品亚洲另类欧美| 日本黄大片一区二区三区| 欧美日韩国产在线一区| 色阁综合av| 国产91精品入| 91精品国产自产在线| 国产夫妻在线| 精品国产自在精品国产浪潮| 色av男人的天堂免费在线| 欧美丰满少妇xxxxx高潮对白 | xxxxx在线观看| 国产一区二区在线视频| aa在线免费观看| 一区二区免费不卡在线| 欧美在线日韩精品| 国产成人tv| 91九色蝌蚪国产| www.日韩| 久久久久久亚洲精品不卡| wwwww在线观看免费视频| 精品成人一区二区三区四区| 一级做a爱片性色毛片| 欧美性jizz18性欧美| 午夜69成人做爰视频| 国产精品乱码一区二区三区软件| 中文字幕天堂网| 国产精品中文欧美| av免费一区二区| 久久久久国产一区二区| 大西瓜av在线| 欧美在线高清| 中文字幕99| 欧美色网址大全| 欧美精品一区二区三区在线四季 | 美女在线一区二区| 欧美综合在线观看视频| 国产精品夜夜夜| 蜜臀av无码一区二区三区| 欧美国产高潮xxxx1819| 中文字幕久精品免| 日韩黄色大片| 丝袜足脚交91精品| 免费av一区| 欧美日韩电影一区二区| 琪琪久久久久日韩精品| 国产精品一区二| 国偷自产av一区二区三区| 粉嫩av一区二区三区免费观看 | 日韩精品欧美精品| av动漫在线观看| 香蕉久久国产| 夫妻免费无码v看片| 亚洲国产精品一区| 国产精品久久中文字幕| 精品不卡视频| 国产一区二区在线视频播放| 日韩午夜免费| 一本大道熟女人妻中文字幕在线 | 亚洲色图20p| 天天天天天天天天操| 亚洲同性gay激情无套| 视频国产一区二区| 亚洲男人天堂av| 青娱乐国产在线| 午夜精品免费在线观看| 国产精品黄色大片| 在线一区二区观看| 一级特黄aaa| 日韩欧美一级精品久久| 欧美一区二区黄片| 精品中文视频在线| wwwxxx在线观看| 欧美超级免费视 在线| 蜜桃成人365av| 欧美一级大胆视频| 日韩av首页| 91沈先生作品| 红杏aⅴ成人免费视频| 欧美日韩一区二区三区在线视频 | 中文字幕av一区中文字幕天堂 | 国产精品久久久久影院老司| av最新在线观看| 亚洲综合激情网| 男人日女人网站| 欧美日韩一卡二卡三卡| 国产高中女学生第一次| 国产丝袜精品第一页| 天天综合视频在线观看| 欧美日韩高清在线观看| 英国三级经典在线观看| 国产欧美精品在线| 国产精品乱战久久久| 欧美日韩在线一二三| 婷婷亚洲最大| 国产黄页在线观看| 免费人成黄页网站在线一区二区| 一起草最新网址| 久久天天做天天爱综合色| 黑鬼狂亚洲人videos| 粉嫩av一区二区三区免费野| 中文字幕在线播放日韩| 精品国产制服丝袜高跟| 国产黄在线观看免费观看不卡| 九九热这里只有在线精品视| 456亚洲精品成人影院| 亚洲一区二区自拍| 欧美人妖在线| 毛片av在线播放| 秋霞午夜av一区二区三区| 精品人妻在线视频| 中文av一区二区| 精品美女久久久久| 欧美一区永久视频免费观看| 欧洲免费在线视频| 欧美大片大片在线播放| 精品三级在线| 久久久精品动漫| 国产综合网站| 欧美视频国产视频| 久久久综合激的五月天| 一级黄色录像视频| 欧美视频一区二区三区在线观看| 高清国产mv在线观看| 日韩视频永久免费观看| 欧美黑人疯狂性受xxxxx野外| 高清国产在线一区| 日韩成人午夜| 欧美黑人在线观看| 九色综合国产一区二区三区| 好吊一区二区三区视频| 亚洲一区二区三区三| 99久久久无码国产精品免费| 中国人与牲禽动交精品| 久久r热视频| 久久人人九九| 日韩图片一区| 成人性生活免费看| 亚洲一区中文日韩| av在线资源观看| 久久精品国产亚洲一区二区| 成人黄色免费观看| 欧美最大成人综合网| 玖玖视频精品| 性高潮久久久久久久| 欧美性生交xxxxxdddd| 天天综合永久入口| 66m—66摸成人免费视频| 国产精品白丝一区二区三区| 精品一区二区三区毛片| 狠狠色伊人亚洲综合成人| 午夜国产福利视频| 欧美久久久久久蜜桃| 日本电影在线观看网站| 国产欧美日韩中文字幕| 久久电影院7| 日本中文字幕二区| 1024精品合集| 国产乱码久久久久| 超碰91人人草人人干| 国产一区二区三区免费在线 | 亚洲AV无码成人精品区明星换面| 欧美性xxxxxxx| 狠狠v欧美ⅴ日韩v亚洲v大胸| 欧美最猛性xxxx| 精品日韩欧美一区| 亚洲天堂2018av| 亚洲精品视频一区| 亚洲乱色熟女一区二区三区| 久久久天堂国产精品女人| 老牛精品亚洲成av人片| 97在线播放视频| 中文字幕精品在线不卡| 国产精品视频在线观看免费| 久久99精品国产99久久6尤物| 成人高潮a毛片免费观看网站| 久久亚洲中文字幕无码| 久久久久久久久蜜桃| 在线播放精品视频| 欧美成人中文字幕| 欧美wwwwww| 久久婷五月综合| 亚洲免费av观看| 污污视频在线观看网站| 国产精品久久久久久久久久久久 | 中文字幕永久在线| 久久精品国产久精国产思思| 2021年精品国产福利在线| 欧美日韩黄色一级片| 欧美国产日韩精品免费观看| 国产精品一级二级| 97在线观看免费| 97色伦图片97综合影院| 好吊操视频这里只有精品| 欧美色videos| 久久日韩视频| 国内精品二区| 精品一区二区三区影院在线午夜| 久久久久久天堂| 在线看欧美日韩| 成人福利一区| 在线观看免费污视频| 亚洲成人你懂的| 日本www在线观看视频| 国产伦理久久久| 看电视剧不卡顿的网站| 中日韩黄色大片| 久久中文精品视频| 久久99国内| 亚洲少妇一区二区三区|