精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

將330億參數(shù)大模型「塞進(jìn)」單個消費(fèi)級GPU,加速15%、性能不減

人工智能 新聞
個人終端設(shè)備跑大模型成為現(xiàn)實(shí)了。

預(yù)訓(xùn)練大語言模型(LLM)在特定任務(wù)上的性能不斷提高,隨之而來的是,假如 prompt 指令得當(dāng),其可以更好的泛化到更多任務(wù),很多人將這一現(xiàn)象歸功于訓(xùn)練數(shù)據(jù)和參數(shù)的增多,然而最近的趨勢表明,研究者更多的集中在更小的模型上,不過這些模型是在更多數(shù)據(jù)上訓(xùn)練而成,因而在推理時更容易使用。

舉例來說,參數(shù)量為 7B 的 LLaMA 在 1T token 上訓(xùn)練完成,盡管平均性能略低于 GPT-3,但參數(shù)量是后者的 1/25。不僅如此,當(dāng)前的壓縮技術(shù)還能將這些模型進(jìn)一步壓縮,在保持性能的同時還能大幅減少內(nèi)存需求。通過這樣的改進(jìn),性能良好的模型可以在終端用戶設(shè)備(如筆記本)上進(jìn)行部署。

然而,這又面臨另一個挑戰(zhàn),即想要將這些模型壓縮到足夠小的尺寸以適應(yīng)這些設(shè)備,怎樣才能兼顧生成質(zhì)量。研究表明,盡管壓縮后的模型生成的答案準(zhǔn)確率還可以,但現(xiàn)有的 3-4 位量化技術(shù)仍然會讓準(zhǔn)確性降低。由于 LLM 生成是順序進(jìn)行的,依賴于先前生成的 token,小的相對誤差不斷累積并導(dǎo)致嚴(yán)重的輸出損壞。為了確??煽康馁|(zhì)量,關(guān)鍵是設(shè)計出低位寬的量化方法,與 16 位模型相比不會降低預(yù)測性能。

然而,將每個參數(shù)量化到 3-4 位通常會導(dǎo)致中等程度、甚至是高等程度的準(zhǔn)確率損失,特別是那些非常適合邊緣部署的 1-10B 參數(shù)范圍內(nèi)的較小模型。

為了解決準(zhǔn)確性問題,來自華盛頓大學(xué)、蘇黎世聯(lián)邦理工學(xué)院等機(jī)構(gòu)的研究者提出了一種新的壓縮格式和量化技術(shù) SpQR(Sparse-Quantized Representation,稀疏 - 量化表征),首次實(shí)現(xiàn)了 LLM 跨模型尺度的近無損壓縮,同時達(dá)到了與以前方法相似的壓縮水平。

SpQR 通過識別和隔離異常權(quán)重來工作,這些異常權(quán)重會導(dǎo)致特別大的量化誤差,研究者將它們以更高的精度存儲,同時將所有其他權(quán)重壓縮到 3-4 位,在 LLaMA 和 Falcon LLMs 中實(shí)現(xiàn)了不到 1% 的困惑度相對準(zhǔn)確率損失。從而可以在單個 24GB 的消費(fèi)級 GPU 上運(yùn)行 33B 參數(shù)的 LLM,而不會有任何性能下降,同時還能提高 15% 的速度。

SpQR 算法高效,既可以將權(quán)重編碼為其他格式,也可以在運(yùn)行時進(jìn)行有效地解碼。具體來說,該研究為 SpQR 提供了一種高效的 GPU 推理算法,可以比 16 位基線模型更快地進(jìn)行推理,同時實(shí)現(xiàn)了超過 4 倍的內(nèi)存壓縮收益。

圖片

  • 論文地址:https://arxiv.org/pdf/2306.03078.pdf
  • 項目地址:https://github.com/Vahe1994/SpQR

方法

該研究提出一種混合稀疏量化的新格式 —— 稀疏量化表征(SpQR),可以將精確預(yù)訓(xùn)練的 LLM 壓縮到每個參數(shù) 3-4 位,同時保持近乎無損。

具體來說,該研究將整個過程分為兩步。第一步是異常值檢測:該研究首先孤立了異常值權(quán)重,并證明其量化會導(dǎo)致高誤差:異常值權(quán)重保持高精度,而其他權(quán)重以低精度(例如 3 位的格式)存儲。然后,該研究以非常小的組大小實(shí)現(xiàn)分組量化(grouped quantization)的變體,并表明量化尺度本身可以被量化為 3 位表征。

SpQR 極大地減少了 LLM 的內(nèi)存占用,而不會降低準(zhǔn)確性,同時與 16 位推理相比,LLM 的生成速度快了 20%-30%。

此外,該研究發(fā)現(xiàn),權(quán)重矩陣中敏感權(quán)重的位置不是隨機(jī)的,而是具有特定的結(jié)構(gòu)。為了在量化過程中突出顯示其結(jié)構(gòu),該研究計算了每個權(quán)重的敏感度,并為 LLaMA-65B 模型可視化這些權(quán)重敏感度。下圖 2 描繪了 LLaMA-65B 最后一個自注意力層的輸出投影。

圖片

該研究對量化過程進(jìn)行了兩個改變:一個用于捕捉小的敏感權(quán)重組,另一個用于捕捉單個的異常值。下圖 3 為 SpQR 的總體架構(gòu):

圖片

下表為 SpQR 量化算法,左邊的代碼片段描述了整個過程,右邊的代碼片段包含了二級量化和查找異常值的子程序:

圖片

實(shí)驗

該研究將 SpQR 與其他兩種量化方案進(jìn)行了比較:GPTQ、RTN(rounding-to-nearest),并用兩個指標(biāo)來評估量化模型的性能。首先是困惑度的測量,所用數(shù)據(jù)集包括 WikiText2、 Penn Treebank 以及 C4;其次是在五個任務(wù)上的零樣本準(zhǔn)確率:WinoGrande、PiQA、HellaSwag、ARC-easy、ARC-challenge。

主要結(jié)果。圖 1 結(jié)果顯示,在相似的模型大小下,SpQR 的性能明顯優(yōu)于 GPTQ(以及相應(yīng)的 RTN),特別是在較小的模型上。這種改進(jìn)得益于 SpQR 實(shí)現(xiàn)了更多的壓縮,同時也減少了損失退化。

圖片

表 1、表 2 結(jié)果顯示,對于 4 位量化,與 GPTQ 相比,SpQR 相對于 16 位基線的誤差減半。

圖片

圖片

表 3 報告了 LLaMA-65B 模型在不同數(shù)據(jù)集上的困惑度結(jié)果。

圖片

最后,該研究評估了 SpQR 推理速度。該研究將專門設(shè)計的稀疏矩陣乘法算法與 PyTorch(cuSPARSE)中實(shí)現(xiàn)的算法進(jìn)行了比較,結(jié)果如表 4 所示??梢钥吹剑M管 PyTorch 中的標(biāo)準(zhǔn)稀疏矩陣乘法并沒有比 16 位推理更快,但本文專門設(shè)計的稀疏矩陣乘法算法可以提高約 20-30% 的速度。

圖片

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2023-06-12 11:49:37

GPT-4 API論文

2022-08-20 07:52:56

語言模型參數(shù)PaLM

2009-03-20 09:56:41

2023-06-02 15:47:49

2024-02-21 12:10:00

模型數(shù)據(jù)

2023-09-04 12:58:05

2023-09-23 12:36:32

蘋果模型

2023-07-05 14:01:50

AI技術(shù)

2023-12-13 12:55:39

模型數(shù)據(jù)

2024-08-05 14:36:17

大型語言模型量化

2025-10-13 08:33:33

2023-04-04 13:17:00

GPUCMU開源

2020-04-30 13:30:30

Facebook 機(jī)器人開源

2022-06-25 21:17:15

人工智能訓(xùn)練

2023-07-18 15:05:00

開源大模型

2023-06-06 16:33:11

云計算人工智能

2022-01-20 15:56:14

AI訓(xùn)練GPU

2024-04-19 09:17:33

AI模型
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

日本欧美大码aⅴ在线播放| 加勒比色老久久爱综合网| 国产欧美精品一区二区色综合朱莉 | 日韩理论电影院| 日韩一区二区三区在线| 一区二区传媒有限公司| 337p日本欧洲亚洲大胆鲁鲁| 国产精品资源在线看| 97成人精品视频在线观看| 色噜噜噜噜噜噜| 国产精品极品在线观看| 精品视频在线免费看| 国产精品三级一区二区| 99riav在线| 99久久免费视频.com| 91久久国产婷婷一区二区| 亚洲午夜18毛片在线看| 欧美日韩91| 少妇av一区二区三区| 成人免费av片| 美女国产精品久久久| 欧美日韩一卡二卡三卡| 久久国产成人精品国产成人亚洲| а√资源新版在线天堂| 国产免费成人在线视频| 久久另类ts人妖一区二区| 亚洲成人av综合| 久久国产婷婷国产香蕉| 国产91精品在线播放| 日韩精品视频免费播放| 欧美精品国产| 久久精品视频99| 无码人中文字幕| 免费成人结看片| 日韩经典第一页| 久久精品女同亚洲女同13| 不卡的国产精品| 欧美人牲a欧美精品| 91看片就是不一样| 香蕉成人av| 在线亚洲+欧美+日本专区| 久久精品视频16| 麻豆蜜桃在线观看| 婷婷一区二区三区| 国产手机免费视频| 福利成人导航| 亚洲狠狠爱一区二区三区| 四虎4hu永久免费入口| а√天堂官网中文在线| 亚洲色图在线视频| 蜜臀在线免费观看| 日本大胆在线观看| 亚洲第一福利视频在线| 草b视频在线观看| 日本а中文在线天堂| 欧美日韩国产精品一区| 免费在线观看亚洲视频| 345成人影院| 欧美一a一片一级一片| 在线免费观看视频黄| 91精品国产66| 91精品福利在线一区二区三区 | 成人免费在线观看入口| 黄色免费高清视频| 国产精品剧情| 亚洲午夜免费视频| 国产最新免费视频| 巨胸喷奶水www久久久| 欧美三级一区二区| 制服下的诱惑暮生| 牛牛影视久久网| 亚洲色图第三页| 美国一级黄色录像| 午夜精品网站| 97热精品视频官网| 久久久久久无码精品大片| 日韩高清在线不卡| 成人精品视频久久久久| 蜜桃视频在线观看www| 不卡免费追剧大全电视剧网站| 久久久综合香蕉尹人综合网| av在线1区2区| 亚洲成人久久影院| 国内自拍视频一区| 日韩成人精品| 亚洲欧美成人在线| 岛国毛片在线观看| 久久一二三四| 亚洲综合大片69999| 亚洲区小说区图片区| 久久久不卡网国产精品二区| 欧美h视频在线观看| 91九色美女在线视频| 欧美色偷偷大香| 国产伦精品一区二区三区精品| 亚洲欧美tv| 欧美精品免费播放| 成人公开免费视频| 国产成人av网站| 神马影院一区二区| 日本在线视频www鲁啊鲁| 色综合天天视频在线观看| 日本黄色一级网站| 精品美女在线视频| 久久久中文字幕| 91国内精品视频| 91免费看片在线观看| 4444在线观看| 欧美性aaa| 亚洲人成欧美中文字幕| 久久精品一区二区三| 美女一区二区视频| 久久青青草综合| xxx.xxx欧美| 日韩亚洲欧美在线观看| 欧美性受xxxx黑人| 久久午夜激情| 精品无人乱码一区二区三区的优势| 日本在线天堂| 在线视频欧美区| 香港三级日本三级| 欧美特黄视频| 亚洲一区中文字幕在线观看| 成人在线免费看| 欧美午夜精品伦理| 一本加勒比波多野结衣| 黄色av日韩| 1区1区3区4区产品乱码芒果精品| 国产三级在线| 色综合色狠狠天天综合色| 大尺度做爰床戏呻吟舒畅| 中文字幕乱码亚洲无线精品一区| 国产精品视频免费在线观看| 九色在线播放| 色av综合在线| av男人的天堂av| 久久精品一区| 欧美日韩国产综合在线| 不卡一二三区| 亚洲成色777777女色窝| 18精品爽视频在线观看| 国产不卡视频在线观看| 国产精品久久成人免费观看| 日日夜夜精品| 久久影院模特热| 国产肥老妇视频| 亚洲精品伦理在线| 色综合久久久无码中文字幕波多| 你懂的成人av| 99中文字幕| 毛片网站在线看| 精品国产精品一区二区夜夜嗨| 国产对白videos麻豆高潮| 成人免费黄色大片| 毛片在线视频播放| 免费一区二区| 国产一区玩具在线观看| 快射av在线播放一区| 欧美一区二区三区人| 欧美人妻精品一区二区三区| 国产高清精品网站| 国产免费黄色一级片| 偷拍自拍一区| 国产精品成人在线| 日本在线免费看| 日韩一区二区免费高清| 国产午夜视频在线播放| www久久久久| 污版视频在线观看| 国产综合婷婷| 欧美精品欧美精品系列c| 日韩在线免费| 久久国产精品99国产精| 日韩中文字幕影院| 日本韩国一区二区| 波多野结衣喷潮| 成人精品电影在线观看| 日本在线视频www| 68国产成人综合久久精品| 国产精品二区二区三区| se01亚洲视频| 久久99国产精品自在自在app| 天天爽夜夜爽夜夜爽| 欧美日韩综合在线免费观看| 成年人一级黄色片| 久久综合久久综合久久| 日韩一级免费片| 亚洲国产日本| 亚洲视频小说| 日韩理论电影中文字幕| 国产一区二区色| 九色porny自拍视频在线播放 | 久久人人九九| 国产精品亚洲一区二区在线观看| 91国语精品自产拍在线观看性色| 久久天天躁狠狠躁夜夜爽蜜月| 亚洲字幕av一区二区三区四区| 亚洲一区二区三区中文字幕在线| 日韩精品电影一区二区| 国产电影一区在线| 五月婷婷之综合激情| 亚洲黄色大片| 精品国产无码在线| 国模精品一区| 精品久久久久久一区| 欧美视频在线视频精品| 欧美亚洲国产另类| 中文字幕伦理免费在线视频 | 18videosex性欧美麻豆| 亚洲图片制服诱惑| 色一情一乱一区二区三区| 欧美精品aⅴ在线视频| 亚洲综合久久网| 亚洲在线视频网站| 亚洲综合图片一区| 欧美极品美女视频| 三级电影在线看| 成人爱爱电影网址| 99热这里只有精品2| 欧美a级一区二区| 爱福利视频一区二区| 亚洲性人人天天夜夜摸| 中文字幕在线乱| 成人羞羞网站入口免费| 日本黑人久久| 久久97视频| 欧美精品成人一区二区在线观看| 看全色黄大色大片免费久久久| 91精品国产综合久久久久久丝袜| 国产91欧美| 国产精品丝袜一区二区三区| 男人最爱成人网| 欧美日韩高清影院| 国产伦精品一区二区三区免| 2021中文字幕在线| 欧美精品激情视频| 免费看电影在线| 欧美精品手机在线| 永久免费网站在线| 欧美精品在线播放| 图片区小说区亚洲| 欧美极品美女视频网站在线观看免费 | 久久精品亚洲国产| 求av网址在线观看| 久久精品91久久香蕉加勒比| 成人在线影视| 欧美裸身视频免费观看| 天堂成人av| 久久免费国产精品1| xxxcom在线观看| 欧美性做爰毛片| 亚洲国产尤物| 成人a在线观看| 国产免费区一区二区三视频免费| 亚洲自拍偷拍区| 精品国产18久久久久久洗澡| 国产亚洲激情| 91免费版看片| 99精品视频免费全部在线| 国产超级av在线| 久久人人精品| 久久久久xxxx| 国产99精品国产| 国产精品无码一区二区三区免费| 国产亚洲欧美中文| 亚洲欧美小视频| 亚洲成人午夜电影| 不卡av电影在线| 91精品国产综合久久久久久久| 精品久久无码中文字幕| 日韩激情av在线播放| 成人av一区| 欧美—级高清免费播放| 3d性欧美动漫精品xxxx软件| 成人精品视频久久久久| 国产精品色呦| 亚洲成人自拍视频| 午夜激情一区| 波多野结衣天堂| 国产精品一二三区在线| 国产中文字幕一区二区| 国产精品九色蝌蚪自拍| 国产精品第一页在线观看| 日韩欧美在线观看| 精品乱子伦一区二区| 亚洲人成网站色ww在线| www在线观看播放免费视频日本| 午夜免费日韩视频| 久久亚洲国产精品尤物| 国产伦精品一区| av中文一区| 成年女人18级毛片毛片免费| 日韩av在线免费观看不卡| 又色又爽又黄18网站| 国产亚洲成av人在线观看导航| 国产高潮国产高潮久久久91| 精品久久久久久久久中文字幕| 国产又粗又大又爽| 亚洲精品视频播放| 伊人影院蕉久影院在线播放| 日本精品免费一区二区三区| 日本成人精品| 亚洲欧美综合一区| 亚洲综合不卡| 无码人妻一区二区三区在线| 综合久久给合久久狠狠狠97色| youjizz在线视频| 精品国产乱码久久久久久影片| 91se在线| 日韩av快播网址| 福利在线一区| 黄色成人在线免费观看| 久久99久久99| jizz中文字幕| 日韩欧美精品中文字幕| 天堂在线资源库| 久久免费国产视频| 国产劲爆久久| 轻点好疼好大好爽视频| 国产一区不卡精品| 日本伦理一区二区三区| 欧洲中文字幕精品| 天堂a√在线| 97视频免费看| 国产精品45p| 男女激情免费视频| 国产成人精品免费网站| 亚洲二区在线播放| 欧美另类z0zxhd电影| 欧美激情午夜| 国产一区二区丝袜| 国产二区精品| 亚洲最大天堂网| 亚洲男同1069视频| 国产精品无码白浆高潮| 久久久精品在线| 97色婷婷成人综合在线观看| 亚洲一区美女| 久久69国产一区二区蜜臀| 很污很黄的网站| 制服丝袜日韩国产| 羞羞视频在线观看不卡| 99re视频在线播放| 国产主播精品| 免费在线观看成年人视频| 精品久久中文字幕| 欧美日本韩国一区二区| 国产精品久久久久福利| 91一区二区三区四区| 红桃视频 国产| 亚洲精品美国一| 日批免费在线观看| 国产91免费观看| 日本一区二区在线看| 国产亚洲视频一区| 一区二区三区在线观看视频| 亚洲免费国产视频| 91精品国产99| av中文一区| 中文字幕一二三区| 天天综合日日夜夜精品| 欧美午夜黄色| 国产精品中文字幕久久久| 中文字幕午夜精品一区二区三区| 自拍视频第一页| 日韩欧美中文字幕在线观看| 成人动漫在线播放| 97中文在线观看| 久久精品三级| 亚洲天堂网av在线| 亚洲成人久久网| 国产黄色一区| 丁香六月激情网| 久久久激情视频| 国产内射老熟女aaaa∵| 国语对白做受69| 热久久天天拍国产| 亚洲美女高潮久久久| 在线观看成人小视频| 怡红院av在线| 午夜精品美女久久久久av福利| 狠狠色狠狠色综合日日91app| 国产精品18p| 最近2019年手机中文字幕| 一本色道69色精品综合久久| 99久久久无码国产精品6| 亚洲欧美另类综合偷拍| 日本大片在线观看| 51成人做爰www免费看网站| 亚洲欧美日韩专区| 91九色丨porny丨极品女神| 精品视频—区二区三区免费| 激情综合婷婷| 国产福利一区视频| 亚洲一区二区三区中文字幕| www.亚洲视频| 免费一区二区三区| 国产ts人妖一区二区| 在线播放一级片| 5566成人精品视频免费|