精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大模型生成提速2倍!單GPU幾小時搞定微調,北大數院校友共同一作丨開源

人工智能 新聞
這項新研究名叫Medusa(美杜莎),來自普林斯頓、UIUC、CMU和康涅狄格大學,FlashAttention作者Tri Dao也在其中。

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

只需給大模型“加點小零件”,推理速度立刻提升2倍!

圖片

不需要額外訓練一個模型,也不需要對計算硬件做優化,單張A100最快幾小時就能微調完成。

這項新研究名叫Medusa(美杜莎),來自普林斯頓、UIUC、CMU和康涅狄格大學,FlashAttention作者Tri Dao也在其中。

圖片

目前,它已經成功部署到伯克利70億參數的“駱馬”Vicuna中,后續還會支持其他大模型,已經登上GitHub熱榜:

圖片

但其實,在這種方法推出之前,業界并非沒有大模型推理加速方法,主流的就是DeepMind推出的投機采樣(speculative decoding)

相比這種方法,Medusa有什么不一樣的地方?

投機采樣的2個“bug”

要想加速大模型推理,需要先知道究竟是什么“限制”了它的速度。

相比計算量的增加,大模型推理速度更容易受到內存帶寬的影響(memory bound)

這是因為,大模型由于參數量巨大、遠超緩存容量,因此推理時需要先把權重從外部內存(顯存)讀取一次到緩存中,這個過程受內存帶寬限制,速度通常很慢。

圖片

因此,模型做批量推理(batch inference)時,一次處理100個tokens和一個tokens時間上區別不大。

基于這個特點,DeepMind去年11月想出了一個名叫投機采樣的神奇操作——

訓練一個更小的模型(draft模型),給大模型提前生成一批“候選詞”,相比于讓大模型自己“思考”生成,直接做“選擇”就好。

圖片

由于小模型生成速度比大模型快好幾倍,一旦大模型覺得小模型已有的詞“可用”,就直接拿來,不用自己再緩慢生成一遍。

這個過程,有點像是輸入法的聯想詞候選,在我們(大模型)想好下一個詞用什么之前,輸入法(小模型)先給列出一些備選項:

要是看到覺得不錯,就從中選一個用;要是覺得生成的都不行,就pass掉自己重新打。

圖片

這種投機采樣方法確實取得了顯著成效,甚至能輕輕松松在M2 Ultra上以高精度跑340億參數LLaMA大模型。

圖片

BUT,這種方法存在兩個問題。

一方面,給大模型找個生成“候選詞”的draft小模型,沒那么容易。

這個小模型可不是隨便抓個生成模型就能用,除了接口統一、概率分布接近等要求,生成質量也不能比大模型差太多。

對于Meta發布的LLaMA這種模型可能還好,既有幾百億參數的大模型版本,又有幾十億參數的小模型版本,可以把參數量更小的版本拿來當draft模型使用。

但對于其他開源大模型,這種方法就不太適用了,自己去搭建訓練一個小模型,不僅時間成本更高,生成效果可能還不達預期。

另一方面,雙模型的組合,使得后續要想做系統調優變得更復雜

這是因為,相比于大模型自身是一個系統,新增加的draft模型相當于又引入了一個系統。

這樣會導致模型部署起來更復雜,包括額外的網絡傳輸、不同的硬件條件都需要考慮到,在做計算優化時難度也會進一步提升。

為了解決這些問題,Medusa出現了。

不用小模型,加幾個“頭”就行

Medusa(美杜莎,一種長有多個頭的妖怪)是一種新的大模型推理加速方法。

相比投機采樣,它選擇直接給Transformer大模型多加幾個解碼頭(decoding heads),每個頭都是一個單層前饋網絡。

圖片

這幾個多出來的解碼頭,可以讓大模型直接一次多生成幾個詞,而不是“擠牙膏式”一個一個生成。

生成準確率也還可以,在預測“下一個詞的下一個詞”時,Medusa準確率達到了60%,還在不斷優化中。

隨后,結合樹狀注意力機制(tree-based attention mechanism)并行驗證這些詞,從而實現推理加速。

圖片

基于Medusa,Vicuna的70億、130億和330億參數大模型推理速度,均有了1.9倍以上的效率提升:

圖片

針對70億參數的模型,研究者們還在不同任務上測試了一下加速效果,顯示最高在代碼生成上有2.15倍的速度提升。

圖片

最關鍵的是,用上Medusa后,并不需要將整個大模型重新訓練一遍。

相比之下,它可以和大模型一起訓練,只需要凍結大模型的參數就行,甚至單個GPU就能搞定。

由于不增加額外的模型,對于分布式推理也很友好。

作者介紹

這項研究有兩位共同一作。

共同一作蔡天樂,普林斯頓大學博士生,研究方向包括優化、表示學習、架構設計等,本科畢業于北京大學數學科學學院,獲得應用數學和計算機科學雙學位。

圖片

共同一作Yuhong (Jesse) Li,伊利諾伊大學香檳分校(UIUC)博士生,研究方向是高效機器學習,本科畢業于北京郵電大學。

圖片

此外,這項研究也有FlashAttention作者、斯坦福博士Tri Dao的參與。

FlashAttention是一種能加快注意力并減少內存占用的方法,相比PyTorch標準注意力實現,最高能提速9倍。

圖片

GitHub地址:https://github.com/FasterDecoding/Medusa

研究地址:https://sites.google.com/view/medusa-llm

責任編輯:張燕妮 來源: 量子位
相關推薦

2023-07-17 09:21:12

Meta模型

2023-10-16 12:31:17

人工智能數據

2025-02-26 13:23:08

2021-11-19 10:13:01

模型人工智能計算

2023-04-13 13:24:38

OpenAI模型圖片

2023-06-30 13:01:26

2023-06-16 09:49:11

人工智能研究

2023-05-29 12:35:09

模型ChatGPT

2023-10-21 12:53:04

AI數據

2023-06-16 09:45:36

AI視頻

2023-11-16 15:58:00

訓練數據

2024-06-20 07:23:29

2023-10-04 19:52:33

模型論文

2024-04-23 13:37:00

數據訓練

2024-10-28 07:20:00

AI模型

2024-02-07 12:37:23

模型數據

2023-12-06 12:42:25

2023-05-30 14:17:00

模型推理

2021-09-13 09:49:37

開發方程函數

2025-09-12 09:03:00

點贊
收藏

51CTO技術棧公眾號

欧美极品欧美精品欧美图片| 91精品国产一区二区三区动漫| 国产麻豆天美果冻无码视频| 牛牛精品视频在线| av成人免费在线观看| 欧洲成人在线视频| 欧美视频一区二区在线| 在线一区视频观看| 18欧美亚洲精品| 国产日韩欧美黄色| 全网免费在线播放视频入口| 老牛影视av一区二区在线观看| 欧美性69xxxx肥| 亚洲欧洲一区二区| 高h调教冰块play男男双性文| 免费视频一区| 久久久成人av| 日韩aaaaa| 福利一区二区免费视频| 亚洲一区二区在线观看视频| 国产精品毛片一区视频| 日本视频www| 亚洲码欧美码一区二区三区| 狠狠躁夜夜躁久久躁别揉| 午夜老司机精品| 国产黄色片网站| 久久伊人亚洲| 久久综合免费视频影院| a天堂视频在线观看| 全球中文成人在线| 一区二区三区中文在线| 欧美重口乱码一区二区| 亚洲av无码国产精品永久一区| 亚洲欧洲视频| 久久深夜福利免费观看| 精品无码人妻一区| 麻豆国产一区| 在线观看视频一区| 黄色av网址在线播放| 成人午夜在线影视| 国产日韩欧美激情| 99电影网电视剧在线观看| 波多野结衣一区二区三区四区| 欧美亚洲激情| 精品国产一区二区亚洲人成毛片| 色综合av综合无码综合网站| 黄色在线观看视频网站| 国产精品久久午夜| 欧美一区二区三区四区五区六区| 国产av一区二区三区| 日韩av电影天堂| 91精品国产色综合| 免费在线观看国产精品| 亚洲有吗中文字幕| 在线精品视频视频中文字幕| 国产又爽又黄无码无遮挡在线观看| 欧美一区在线观看视频| 337p亚洲精品色噜噜| 黄色国产精品视频| 欧美午夜大胆人体| 亚洲人精品午夜| 伊人久久av导航| 成人高潮成人免费观看| 久久久精品免费网站| 99三级在线| 国产成人精品白浆久久69| 国精产品一区一区三区mba桃花 | 无码人妻精品一区二| 欧美日韩免费| 中文字幕免费国产精品| 超碰97在线资源站| 老司机aⅴ在线精品导航| 亚洲成人三级在线| 色哟哟在线观看视频| japansex久久高清精品| 色综合网色综合| 狠狠干视频网站| 黄色网在线免费观看| 亚洲视频狠狠干| 亚洲国产日韩综合一区| 超碰在线影院| 中文字幕五月欧美| www.18av.com| 久草在线视频资源| 欧美日韩亚洲系列| 美女网站免费观看视频| 精精国产xxxx视频在线野外 | 亚洲美女搞黄| 精品视频在线一区二区| 亚洲尤物在线视频观看| 国产视频九色蝌蚪| 成人免费一区| 91精品国产91综合久久蜜臀| 亚洲三级在线观看视频| 懂色av色香蕉一区二区蜜桃| 精品欧美一区二区三区精品久久 | 成人久久精品| 日韩精品一区二区三区四区| 国产精品伦子伦| 婷婷精品在线| 国产一区二区三区高清在线观看| chinese全程对白| 欧美视频福利| 国产成人97精品免费看片| 中文字幕精品一区二区精| 激情综合一区二区三区| av蓝导航精品导航| 青青草视频在线观看| 中文字幕中文字幕一区| 2019日韩中文字幕mv| 日韩精选视频| 精品日韩av一区二区| 国产精品毛片一区二区| 五月天久久网站| 91国产视频在线播放| 中文字幕一区二区久久人妻| 成人国产电影网| 亚洲午夜精品一区二区三区| av漫画网站在线观看| 欧美色图12p| 欧美成人三级伦在线观看| 日韩精品永久网址| 97精品国产91久久久久久| 波多野结衣视频在线看| 韩国一区二区三区| 欧美污视频久久久| 678在线观看视频| 欧美放荡的少妇| 人妻丰满熟妇av无码久久洗澡| 国产精品99一区二区三区| 欧洲成人性视频| xxxx18国产| 中文字幕不卡一区| 欧美日韩二三区| 免费一级欧美在线大片 | 日韩a级作爱片一二三区免费观看| 国产精品欧美一级免费| 黄色免费视频大全| 91精品久久久久久综合五月天| 亚洲女成人图区| 精品无码久久久久久久| 国内不卡的二区三区中文字幕 | 久久久久9999亚洲精品| 97超碰人人澡| 视频国产精品| 日韩中文字幕视频在线观看| 天天操天天干天天摸| gogogo免费视频观看亚洲一| 丰满人妻一区二区三区53号 | 天涯成人国产亚洲精品一区av| 久久精品国产99久久99久久久| 欧美系列电影免费观看 | 久久久无码精品亚洲国产| 久久激情五月激情| 婷婷四房综合激情五月| 精品欧美一区二区三区在线观看| 国产偷亚洲偷欧美偷精品| 久久网免费视频| 国产福利视频一区二区三区| 欧美日韩一级在线| 精品午夜视频| 欧美成人一区二区三区电影| 国产精品女同一区二区| 日韩美女久久久| 在线观看免费污视频| 欧美色网址大全| 国产精品嫩草视频| a黄色在线观看| 欧美日韩大陆在线| 欧美美女18p| youjizzxxxx18| 日韩成人av在线资源| 久久乐国产精品| 丁香六月色婷婷| 亚洲成人在线免费| 在线天堂www在线国语对白| 亚洲看片一区| 国产一区二区不卡视频在线观看| 成人ssswww在线播放| 日韩精品视频观看| 欧美国产一级片| 国产精品久久久久久久久久免费看| 激情黄色小视频| 午夜久久黄色| 国产亚洲精品美女久久久m| 男女羞羞在线观看| 在线观看日韩av| 97免费观看视频| 一区二区三区 在线观看视频| 91传媒理伦片在线观看| 国产一级一区二区| 天堂精品一区二区三区| 美女国产精品久久久| 久久久久久久爱| 九九九伊在人线综合| 欧美二区在线观看| 国产精品第72页| 国产日产欧美一区| 佐山爱在线视频| 日韩图片一区| 亚洲欧美国产精品桃花| 欧洲大片精品免费永久看nba| 欧美国产日韩精品| 你懂的在线视频| 91精品欧美综合在线观看最新 | 国产精品国产av| 亚洲午夜电影在线| jizz中文字幕| 国产成人亚洲综合a∨婷婷| 欧美网站免费观看| 国产伦精品一区二区三区千人斩| 国产有码在线一区二区视频| 1024在线看片你懂得| 伊人久久大香线蕉av一区二区| 精品人妻无码一区二区色欲产成人| 亚洲h精品动漫在线观看| 女人黄色一级片| 粉嫩绯色av一区二区在线观看| www.日日操| 亚洲黄色毛片| 最新欧美日韩亚洲| 日韩欧美影院| 国产精品草莓在线免费观看| 亚洲精品天堂| 在线观看免费高清视频97| 婷婷丁香一区二区三区| 欧美精选在线播放| 国产女主播喷水视频在线观看 | 北岛玲一区二区| 国模大尺度一区二区三区| 欧美三级午夜理伦三级| 国内精品亚洲| 神马影院午夜我不卡| 国产精品成人自拍| 亚洲一区二区三区香蕉| 亚洲电影有码| 91国产视频在线| 国产网红在线观看| 久久综合五月天| 日韩专区一区二区| 精品人伦一区二区色婷婷| 国产老女人乱淫免费| 欧洲一区在线电影| www.国产一区二区| 亚洲天堂网中文字| 一级片黄色录像| 国产色综合一区| 日韩一级视频在线观看| av在线综合网| 日本美女视频网站| 国产毛片精品视频| 国产一级免费大片| 久久精品72免费观看| 日韩一区二区三区久久| 视频一区二区三区在线| 91精品91久久久中77777老牛| 亚洲一本二本| 香蕉视频在线网址| 亚洲一级淫片| 好吊色视频988gao在线观看| 亚洲中无吗在线| av动漫在线播放| 狠狠爱www人成狠狠爱综合网| 精品无码av无码免费专区| 久久中文亚洲字幕| 一区二区视频在线观看| 久久国产电影| 在线不卡视频一区二区| 91精品综合久久久久久久久久久 | 亚洲国产精久久久久久| 黄色美女一级片| 亚洲成av人片在线观看香蕉| 二区三区在线视频| 日韩禁在线播放| 青青草手机在线| 在线播放国产一区中文字幕剧情欧美| 福利视频在线看| 国产亚洲激情在线| 日本中文字幕在线看| 久久久国产视频| 欧美性猛片xxxxx免费中国| 久久久久亚洲精品成人网小说| 成人三级高清视频在线看| 97超级碰碰碰| 国产综合色区在线观看| 91精品国产自产在线观看永久| 激情综合婷婷| 国模精品一区二区三区| 久草成人资源| 亚洲 欧洲 日韩| 亚洲激情社区| 成熟老妇女视频| 麻豆精品国产91久久久久久| 97超碰人人看| 2欧美一区二区三区在线观看视频| 国产手机在线观看| 日韩一区欧美一区| 秋霞欧美一区二区三区视频免费| 亚洲精品国产高清久久伦理二区| 中日韩精品视频在线观看| 欧洲生活片亚洲生活在线观看| 亚洲熟妇无码久久精品| 日韩欧美一级精品久久| 免费在线黄色网址| 久久综合网hezyo| 日韩一级二级| 国产日产精品一区二区三区四区| 色综合蜜月久久综合网| 成人在线免费在线观看| 国产一区二区福利视频| 欧美黄色一级生活片| 亚洲图片欧美综合| 国产叼嘿视频在线观看| 中文字幕一区二区三区电影| 僵尸再翻生在线观看免费国语| 2014国产精品| 99精品网站| 亚洲三级视频网站| 91丨porny丨首页| 亚洲一区 视频| 精品国产精品一区二区夜夜嗨| 黄色成人影院| 国产精品自产拍在线观| av亚洲在线观看| 国产主播在线看| 不卡的av网站| www.99re7.com| 日韩美女主播在线视频一区二区三区| 日本欧美在线视频免费观看| 国产成人久久久| 免费久久精品| 国产第一页视频| 国产亚洲自拍一区| 亚洲欧美日韩激情| 日韩毛片在线看| 日本免费久久| 欧美大香线蕉线伊人久久| 香蕉久久夜色精品国产| aaaaaav| 欧美日韩一区二区免费视频| 手机在线不卡av| 91av成人在线| 欧美女优在线视频| 超碰影院在线观看| 国产日韩欧美a| 中文字幕 自拍偷拍| 最近的2019中文字幕免费一页| 亚洲电影有码| 欧美爱爱视频网站| 国产一区高清在线| 国产大学生自拍| 精品国产乱码久久久久久影片| 欧美xxxx黑人又粗又长| 国产九区一区在线| 亚洲一区自拍| 在线观看免费小视频| 欧美亚洲图片小说| 色影院视频在线| 亚洲自拍高清视频网站| 尤物在线精品| 国产福利短视频| 欧美日韩卡一卡二| 欧美卡一卡二| 久久视频在线观看中文字幕| 天堂蜜桃91精品| 成人精品一二三区| 精品三级在线看| 欧美电影h版| 椎名由奈jux491在线播放| 国产大陆精品国产| 全部毛片永久免费看| 中文字幕日韩在线观看| 伊色综合久久之综合久久| 国内性生活视频| 国产精品不卡一区| 色哟哟中文字幕| 国产精品久久久久久久久久久新郎| 久久大综合网| 插我舔内射18免费视频| 欧美自拍偷拍一区| 怡红院红怡院欧美aⅴ怡春院| 精品日本一区二区| 蜜臀av性久久久久蜜臀av麻豆| 成人在线观看免费完整| 日韩av网址在线观看| 欧美videos粗暴| 男女私大尺度视频| 中文字幕免费观看一区| 欧洲成人一区二区三区| 国产精品视频内| 亚洲国产综合在线看不卡| 成人18视频免费69| 亚洲精品福利免费在线观看| 欧美天堂一区| 欧美 丝袜 自拍 制服 另类| 一区在线中文字幕| 加勒比一区二区三区在线| 成人av免费看| 秋霞电影一区二区| 日韩三级视频在线|