精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

八張3090,1天壓縮萬億參數(shù)大模型!3.2TB驟降至160GB,壓縮率高達20倍

人工智能 新聞
最近,來自ISTA的研究人員提出了一種全新的模型量化方法QMoE,可以將1.6萬億個參數(shù)的SwitchTransformer壓縮到160GB以下(每個參數(shù)0.8位),且精度損失很小。

隨著GPT-4的架構(gòu)被知名業(yè)內(nèi)大佬「開源」,混合專家架構(gòu)(MoE)再次成為了研究的重點。

GPT-4擁有16個專家模型,總共包含1.8萬億個參數(shù)。每生成一個token需要使用大約2800億參數(shù)和560TFLOPs。

然而,模型更快、更準(zhǔn)確的代價,則是巨大的參數(shù)量,和隨之而來的高昂成本。

比如,1.6萬億參數(shù)的SwitchTransformer-c2048模型,需要3.2TB的GPU顯存才能有效運行。

為了解決這一問題,來自奧地利科技學(xué)院(ISTA)的研究人員提出了一種全新的壓縮和執(zhí)行框架——QMoE。

論文地址:https://arxiv.org/abs/2310.16795

通過采用專門設(shè)計的GPU解碼內(nèi)核,QMoE具備了高效的端到端壓縮推理——不僅可以實現(xiàn)高達20倍的壓縮率,而且只會產(chǎn)生輕微的精度損失。

具體而言,QMoE僅需單個GPU服務(wù)器,就可以在一天內(nèi)將1.6萬億參數(shù)的SwitchTransformer-c2048模型壓縮至不到160GB,相當(dāng)于每參數(shù)只有0.8位。

如此一來,就可以在4張英偉達RTX A6000或8張英偉達RTX 3090 GPU上運行,而推理時的開銷還不到未壓縮模型的5%。

MoE模型量化

混合模型(MoE)的核心理念是通過增加模型參數(shù)量,來提高網(wǎng)絡(luò)的建模能力,同時與標(biāo)準(zhǔn)的前饋架構(gòu)相比,保持計算成本幾乎不變。

由于處理每個輸入token時僅需調(diào)用網(wǎng)絡(luò)中的一小部分,因此這種設(shè)計可以利用100個甚至1000個「專家」來構(gòu)建超大規(guī)模的模型,并進行高效的訓(xùn)練和推理。

事實證明,在推理速度相當(dāng)?shù)那闆r下,MoE可以大幅提高準(zhǔn)確率和訓(xùn)練速度。但如此龐大的體積,也就意味著需要大量的顯存才能讓模型跑起來。

壓縮MoE的一個主要挑戰(zhàn)是需要維持龐大的激活集。

對此,可以通過精心安排模型執(zhí)行的方式,將需要計算的中間數(shù)據(jù)控制在一小部分。從而把主存儲從GPU卸載到價格更便宜、數(shù)量更多的CPU內(nèi)存中。

具體來說就是,維持一個大型緩沖區(qū)B,并按照以下步驟對Transformer塊的稠密部分進行更新:

1. 從CPU到GPU,抓取一個包含有幾百個token的「樣本」X;

2. 通過對應(yīng)的稠密層,得到結(jié)果Y;

3. 計算并存儲Y中token的專家分配;

4. 將Y發(fā)送回CPU并覆蓋B中的X。

對于稀疏部分:

1. 從CPU到GPU,抓取B中所有已分配給專家E的token,用X_E表示。

2. 利用它們生成壓縮的專家E'(例如,使用GPTQ)。

3. 通過E'運行X_E,得到Y(jié)_E'。

4. 將Y_E'送回CPU并覆蓋B中的X_E。

如圖2所示,這個過程最小化了內(nèi)存消耗和傳輸成本:只需一個B的副本,每個token在每個Transformer塊中只被讀寫了兩次。

更進一步的,研究人員設(shè)計了一個編碼方案和一個CUDA內(nèi)核,實現(xiàn)了每權(quán)重低于1位的壓縮,并將推理的GPU執(zhí)行開銷降至最低。

壓縮效果

精度

首先,研究人員將所有SwitchTransformer模型量化到2位和三元精度,然后評估其驗證損失。

對于128個專家,默認(rèn)的校準(zhǔn)樣本數(shù)為10K;對于2048個專家,默認(rèn)的校準(zhǔn)樣本數(shù)為160K。同時,研究人員也測試了0.5倍和2倍的樣本數(shù)。

結(jié)果顯示,使用數(shù)據(jù)依賴的量化,2位模型可以在最小的損失下實現(xiàn)(相對于c2048,損失為1.7%),而三元精度下的損失增加也很小(相對于c2048,損失為6.7%)。

這不僅證明了所提出的先進量化方法的有效性,而且還表明極低位寬的壓縮確實適用于大規(guī)模的MoE。

圖片

此外,研究人員還在來自RedPajama的arXiv、GitHub、StackExchange和Wikipedia的數(shù)據(jù)上進行了評估。

雖然校準(zhǔn)數(shù)據(jù)中只有<0.01%來自這些網(wǎng)站,但壓縮后的模型依然保持了幾乎與核心分布相同的性能。

就校準(zhǔn)數(shù)據(jù)而言,增加樣本數(shù)量通常會略微提高性能,在三元量化時最為明顯。但在此過程中也會出現(xiàn)一些噪聲,尤其是在2位時。

壓縮

測試中,研究人員同時考慮了僅MoE模塊的壓縮,以及相對于整個模型及其所有元數(shù)據(jù)的壓縮。

僅MoE本身的而言,所有規(guī)模都實現(xiàn)了>16倍的壓縮率,相當(dāng)于每個參數(shù)的存儲空間都<1位。

在c2048上,即使是包括所有未壓縮的稠密層在內(nèi),整體的壓縮率也達到了19.81倍,相當(dāng)于每個參數(shù)0.807位,從而將檢查點大小從3142GB減少到158.6GB。

此外,還可以觀察到壓縮率隨模型大小的增加而增加,這有兩個原因:

(a)自然稀疏性增加,且研究人員針對c2048優(yōu)化了編碼字典;

(b)層越大,權(quán)重分布越接近獨立。

運行時間

最后,研究人員評估了針對不同數(shù)量的校準(zhǔn)數(shù)據(jù),在單個A6000 GPU上生成壓縮模型所需的時間。

結(jié)果顯示,較小的模型可以在一小時內(nèi)壓縮完成,即便是c2048也能在不到一天的時間內(nèi)完成,這證實了QMoE的高效性。

從large128到c2048,運行時間的增加與大小的差異基本成正比,盡管后者使用了多16倍的樣本。這是因為每個專家的樣本數(shù)量保持不變,而專家規(guī)模僅略有增加。

運行結(jié)果

首先,將壓縮的矩陣-向量積內(nèi)核與PyTorch標(biāo)準(zhǔn)的(未壓縮)bfloat16 cuBLAS內(nèi)核進行直接(孤立)比較。

圖 5(左)顯示了壓縮內(nèi)核與bfloat16內(nèi)核相比,在兩款不同的GPU上,MoE發(fā)現(xiàn)矩陣形狀所耗費的時間。

雖然研究人員使用的儲存性能較差,但執(zhí)行壓縮內(nèi)核所需的時間,依然比接近理想的bfloat16基線少。在特定矩陣形狀下,速度最多可提高35%。

而這些操作的延遲也非常低,其中,最小的矩陣耗時<0.02毫秒,最大的耗時<0.05毫秒。

隨后,研究人員在HuggingFace中,利用壓縮MoE模型的實際權(quán)重,對內(nèi)核進行了端到端的基準(zhǔn)測試。

結(jié)果如圖5(右)所示,壓縮模型的端到端執(zhí)行速度只比標(biāo)準(zhǔn)(未壓縮)的慢了<5%。

盡管每層時序更快,但速度仍略有下降,這是因為編碼器有時會將多個token路由到同一個專家。

目前的實現(xiàn)方式是,對每個token執(zhí)行單獨的矩陣向量乘積,而基線執(zhí)行的是更高效的聯(lián)合矩陣乘法。

在一些應(yīng)用中,這是一個很大的瓶頸。對此,可以在內(nèi)核中引入token內(nèi)循環(huán),或者在token數(shù)量較多的情況下,先進行完全解壓縮,然后再執(zhí)行標(biāo)準(zhǔn)的矩陣乘法。

討論與局限性

總結(jié)而言, QMoE是一個開源的端到端壓縮和推理框架,用于解決MoE在推理過程中,內(nèi)存開銷過大的問題。

研究人員首次證明了,像SwitchTransformer c2048這樣的萬億參數(shù)模型,可以精確壓縮到每個參數(shù)小于1位,壓縮率接近20倍。并且,首次在單個消費級GPU服務(wù)器上,實現(xiàn)了此類模型的高效端到端執(zhí)行。

不過,由于只有少數(shù)大規(guī)模且精確的MoE可以被公開獲得,因此研究的模型集十分有限。

此外,由于其規(guī)模龐大,大多數(shù)MoE都是在不同的定制框架中訓(xùn)練和部署的,這就需要復(fù)雜的手動集成才能用于進一步研究。

盡管如此,研究人員還是涵蓋了一些規(guī)模最大、精度最高的MoE,特別是SwitchTransformer。

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2025-10-22 00:00:01

2009-01-12 09:42:11

固態(tài)硬盤SSD2.5寸固態(tài)盤

2025-01-08 13:15:02

2025-10-24 12:19:18

2023-05-24 07:47:23

ChatGPT參數(shù)模型

2023-05-26 07:47:41

ChatGPT模型AI

2025-05-26 09:41:26

2019-07-31 10:00:33

開源技術(shù) 軟件

2025-08-26 08:59:04

2023-09-25 15:24:49

F5可觀測性開源框架

2022-11-01 13:48:08

參數(shù)方法

2022-10-17 14:59:17

圖像算法

2024-08-05 13:30:00

2021-05-24 05:36:31

壓縮圖片應(yīng)用壓縮工具

2024-01-05 07:55:39

Linux虛擬內(nèi)存

2023-03-08 15:54:49

2021-01-20 06:02:24

數(shù)據(jù)分析驅(qū)動

2024-09-02 14:37:50

2025-06-10 04:11:00

2023-11-09 12:41:40

AI數(shù)據(jù)
點贊
收藏

51CTO技術(shù)棧公眾號

欧美黄色a视频| sese在线视频| 欧美一级专区| 久久亚洲影音av资源网| 美女伦理水蜜桃4| 超碰国产一区| 亚洲欧美一区二区三区国产精品 | 亚洲深夜福利网站| 手机在线国产视频| 蜜桃视频在线观看播放| 自拍av一区二区三区| 久久久国产精品一区二区三区| 少妇又紧又色又爽又刺激视频 | 男女视频在线看| 蜜臀av在线| 日本一区二区免费在线| 国产精品一区二区三区不卡 | 国产69精品久久久久毛片| 国产成+人+综合+亚洲欧美丁香花| 久久国产精品国语对白| 亚洲人成亚洲精品| 精品国产成人系列| 亚洲 国产 图片| 成人软件在线观看| 偷拍日韩校园综合在线| 久久久久久久久久久久久国产| 久久久久久久久亚洲精品| 国产成人av一区二区三区在线观看| 国产精品成人在线| 国产成人精品网| 在线免费观看欧美| 欧美黑人一级爽快片淫片高清| 免费在线观看a视频| 亚洲美女久久| 亚洲精品suv精品一区二区| 日本中文字幕有码| 免费欧美网站| 51精品久久久久久久蜜臀| 怡红院av亚洲一区二区三区h| 久久久123| 亚洲激情一二三区| 欧美日韩午夜爽爽| 91网在线看| 一区二区三区四区中文字幕| 黄色一级视频播放| 久操免费在线| 亚洲视频中文字幕| 天堂v在线视频| 老司机福利在线视频| 中国av一区二区三区| 色阁综合av| av福利在线播放| 中文字幕的久久| 亚洲午夜精品久久久久久浪潮| 成人在线观看免费| 国产精品女上位| 日本福利视频导航| 日本电影在线观看| 亚洲高清免费在线| 欧美精品一区二区三区三州| av岛国在线| 精品国产乱码久久久久酒店| 北条麻妃69av| 色综合一本到久久亚洲91| 91久久人澡人人添人人爽欧美| 日韩福利视频在线| 免费视频观看成人| 欧美一区午夜精品| 国内精品免费视频| 日本欧美韩国国产| 国产一区二区三区18| 婷婷综合在线视频| 一本一道久久综合狠狠老| 欧美国产日韩一区二区| 日韩欧美性视频| 丝袜美腿亚洲色图| 91免费在线视频网站| 亚洲精品97久久中文字幕| 99国内精品久久| 性欧美精品一区二区三区在线播放| 婷婷成人激情| 亚洲伊人色欲综合网| 欧美aⅴ在线观看| 久久69成人| 精品国产区一区| 欧美三级视频网站| 欧美午夜不卡| 国产精品va在线播放我和闺蜜| 亚洲一卡二卡在线| 成人激情午夜影院| 亚洲国产午夜伦理片大全在线观看网站 | 亚洲性视频在线| 精品亚洲一区二区三区在线观看| 1024手机在线观看你懂的| 图片小说视频色综合| 韩国福利视频一区| 在线观看亚洲国产| 成人黄色大片在线观看 | 日韩高清电影一区| 成人蜜桃视频| a视频网址在线观看| 亚洲国产精品天堂| 亚洲欧美日韩一级| 欧美日韩导航| 欧美成人h版在线观看| 久久国产视频一区| 国产成人亚洲综合a∨婷婷图片 | 97在线观看免费观看高清| 依依成人综合视频| 日本免费观看网站| 加勒比色老久久爱综合网| 日韩亚洲精品视频| 国语对白永久免费| 成人小视频免费观看| 伊人久久大香线蕉精品| 欧洲亚洲两性| 精品亚洲男同gayvideo网站| 国产亚洲精久久久久久无码77777| 蜜臀av性久久久久av蜜臀妖精 | 国产精品成人a在线观看| 欧美亚洲激情在线| 日本xxxx人| 亚洲欧美日韩国产中文在线| 999在线免费视频| 日韩精品导航| 97精品久久久| 可以免费看毛片的网站| 亚洲精品亚洲人成人网| 黄色手机在线视频| 国产亚洲第一伦理第一区| 国自在线精品视频| 亚洲经典一区二区三区| 亚洲精品免费在线观看| 色免费在线视频| 国产亚洲第一伦理第一区| 日韩av电影在线播放| 你懂的好爽在线观看| 五月激情六月综合| 成人h动漫精品一区| 一本色道久久综合亚洲精品高清| 国产精品乱码| www成人免费观看| 精品国产91亚洲一区二区三区婷婷 | 狠狠躁狠狠躁视频专区| 精品日韩毛片| 国产精品自拍视频| 国产在线二区| 日韩一区二区在线观看视频| 2021亚洲天堂| 成人激情动漫在线观看| 9久久9毛片又大又硬又粗| 激情小说亚洲图片| 日本免费久久高清视频| 免费国产在线观看| 欧美性受极品xxxx喷水| 18精品爽国产三级网站| 激情综合色综合久久| wwwjizzjizzcom| 91精品导航| 欧美一二三视频| 国产资源在线播放| 欧美日韩在线播| 免费成年人视频在线观看| 国产精品一区一区| 成人毛片100部免费看| 丁香综合av| 人人做人人澡人人爽欧美| 九色视频网站在线观看| 欧美精品v日韩精品v韩国精品v| 波多野结衣喷潮| 国产成人精品影视| 免费毛片网站在线观看| 神马久久一区二区三区| 91精品国产综合久久男男| 国产探花视频在线观看| 亚洲免费小视频| 亚洲一卡二卡在线| 亚洲成av人片在线观看无码| 精品人妻无码一区二区三区换脸| 理论电影国产精品| 国产精品成人久久电影| 国产成人1区| 亚洲a∨日韩av高清在线观看| 成年男女免费视频网站不卡| 中国china体内裑精亚洲片| 国产精品无码一区二区桃花视频| 亚洲成人黄色影院| 女女互磨互喷水高潮les呻吟| 国产精品自拍在线| 精品免费国产一区二区| 欧美黄色一区| 色姑娘综合网| 黄色欧美在线| 91精品综合视频| 神马午夜在线视频| 久久成人在线视频| 日韩一区av| 91精品国产一区二区三区| 精品人妻一区二区三区免费看 | 免费看国产一级片| 久久视频精品| 免费看国产精品一二区视频| 欧州一区二区三区| 国产精品极品美女粉嫩高清在线| 国产美女情趣调教h一区二区| 在线观看欧美日韩| 婷婷伊人综合中文字幕| 91精品免费在线观看| 一级片免费在线播放| 亚洲自拍偷拍综合| 日韩av手机在线免费观看| 久久人人97超碰com| 午夜福利三级理论电影| 琪琪一区二区三区| 黄色一级片播放| 国产综合亚洲精品一区二| 中文字幕在线中文字幕日亚韩一区 | 久久免费电影| 蜜臀久久99精品久久久无需会员 | 不卡一区综合视频| 久久99精品久久久久久水蜜桃| 日韩在线视频一区二区三区 | 国产精品一品二区三区的使用体验| 欧美日韩美女在线观看| 国产五月天婷婷| 亚洲精品第1页| 亚洲人做受高潮| 欧美激情一区二区三区不卡| 白白色免费视频| 久久天天做天天爱综合色| 性欧美成人播放77777| av综合在线播放| 插我舔内射18免费视频| 国产成人aaaa| 亚洲图片欧美另类| 国产激情视频一区二区三区欧美| 午夜免费一级片| 激情五月激情综合网| 色一情一区二区三区| 麻豆91精品91久久久的内涵| 亚洲欧美久久久久| 免费成人在线观看视频| 欧美婷婷精品激情| 美女一区二区三区| 毛片毛片毛片毛| 国内精品免费**视频| 国产精品久久久久久9999| 久久国产视频网| 天天干天天曰天天操| 国产精品乡下勾搭老头1| 国产在线a视频| 成人午夜av影视| yy6080午夜| 国产午夜精品美女毛片视频| 亚洲av成人无码久久精品| 欧美国产精品v| 精品一区二区在线观看视频| 亚洲免费观看高清完整版在线| 久草免费在线视频观看| 亚洲成人午夜电影| 国产一级精品视频| 欧美在线一区二区三区| 国产一区二区三区中文字幕| 欧美一区二区三区视频在线| 黄色aaa毛片| 亚洲精品影视在线观看| 国产免费a∨片在线观看不卡| 中文字幕在线精品| 亚洲七七久久综合桃花剧情介绍| 久久免费精品视频| 日韩国产网站| av成人在线电影| 岳的好大精品一区二区三区| 视频在线99| 欧美a级片网站| 欧美亚洲精品一区二区| 免费看黄色91| 日本一级大毛片a一| 久久蜜桃av一区二区天堂 | 国产精品一区二区在线免费观看| 久久这里只有精品视频网| www中文在线| 亚洲高清免费观看高清完整版在线观看 | 亚洲区综合中文字幕日日| 国产日韩欧美精品在线观看| 日产国产欧美视频一区精品| 男男受被啪到高潮自述| 91浏览器在线视频| 欧美手机在线观看| 精品日本高清在线播放| 亚洲视频久久久| 亚洲精品www| 97caopron在线视频| 国产xxx69麻豆国语对白| 精品午夜视频| 日韩av图片| 在线电影一区| 久久久久久综合网| 久久先锋影音av鲁色资源网| 欧美精品一区二区蜜桃| 欧美午夜免费电影| 神马午夜精品95| 欧美刺激性大交免费视频| 欧美一级二级视频| 精品一区二区久久久久久久网站| 久久久久蜜桃| 国产精品视频黄色| 久久影院午夜片一区| 久久黄色小视频| 欧美精品 日韩| 国产中文在线视频| 午夜精品久久久久久99热| 国产一区二区av在线| 欧美色欧美亚洲另类七区| 亚洲国产第一| 香蕉视频色在线观看| 国产精品久久综合| www.国产毛片| 精品无码久久久久久国产| 国产不卡人人| 成人免费在线看片| 你懂的一区二区| 91看片破解版| 国产精品福利一区| 国产精品露脸视频| 一区二区av在线| 成人软件在线观看| 欧美一区1区三区3区公司| 亚洲自啪免费| wwwwxxxx国产| 欧美日韩亚洲一区二区| 婷婷五月综合激情| 97免费视频在线| 国产精品对白| 高清欧美精品xxxxx| 国产mv日韩mv欧美| 精品人妻在线播放| 亚洲成人激情视频| 91吃瓜在线观看| 国产亚洲福利社区| 一本久道久久久| 欧美大片免费播放器| 精品久久久久久中文字幕一区奶水| 成人久久久精品国产乱码一区二区 | 男女免费视频网站| 亚洲成人网在线| free性护士videos欧美| 精品视频第一区| 亚洲主播在线| 免费看91的网站| 欧美日韩一区二区三区不卡| 午夜在线视频播放| 97超碰资源| 亚洲精品男同| 无码 人妻 在线 视频| 91福利视频网站| 日本三级在线播放完整版| 成人做爰www免费看视频网站| 亚洲精品国产成人影院| 一二三区视频在线观看| 图片区小说区国产精品视频| 精品三级久久久久久久电影聊斋| 国产精品久久久久久久久久| 亚洲免费二区| fc2成人免费视频| 91激情在线视频| 黄色一级大片在线免费看产| 91情侣在线视频| 国产精品嫩草99av在线| 亚洲一区 欧美| 日韩美女视频一区二区在线观看| 成年男女免费视频网站不卡| 日韩视频专区| 国产精品一区二区无线| 日本一级淫片色费放| 亚洲午夜精品久久久久久性色| 日韩福利影视| 97超碰在线人人| 亚洲国产精品成人综合| 超碰免费在线97| 奇米4444一区二区三区| 永久91嫩草亚洲精品人人| 黄色性生活一级片| 3d动漫精品啪啪一区二区竹菊| 9999热视频在线观看| 亚洲一区二区免费视频软件合集| 成人在线视频首页| 中文字幕 自拍偷拍| 欧美激情精品久久久久久变态| 中文字幕伦av一区二区邻居| www.午夜av| 色婷婷久久久亚洲一区二区三区| 成人影院在线观看| 奇米精品在线| 成人免费的视频| 国产农村妇女毛片精品久久| 欧洲成人午夜免费大片| 午夜国产精品视频| 免费黄在线观看| 国产视频综合在线|