精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

低比特量化的LLAMA3模型有多好? | 香港大學&北航最新研究發布

發布于 2024-4-24 10:10
瀏覽
0收藏

低比特量化的LLAMA3模型有多好? | 香港大學&北航最新研究發布-AI.x社區

論文鏈接:https://arxiv.org/pdf/2404.14047.pdf
項目鏈接:https://github.com/Macaronlin/LLaMA3-Quantization  
模型鏈接:https://huggingface.co/LLMQ


Meta的LLAMA系列已成為最強大的開源大語言模型(LLM)系列之一。值得注意的是,LLAMA3模型最近發布,并在超大規模的預訓練數據(超過15T tokens)上取得了令人印象深刻的性能。鑒于在資源有限的情況下低比特量化在LLMs中的廣泛應用,本文探索了LLAMA3在量化到低比特寬度時的能力。這一探索有可能揭示LLAMA3和其他即將推出的LLMs的低比特量化的新見解和挑戰,特別是在解決LLM壓縮中遇到的性能下降問題方面。

具體而言,本文評估了LLAMA3的10種現有的訓練后量化和LoRA微調方法,分別在1-8比特和各種數據集上,以全面揭示LLAMA3的低比特量化性能。本文的實驗結果表明,在這些場景中,LLAMA3仍然遭受了相當大的性能下降,尤其是在超低比特寬度下。這凸顯了未來發展中需要填補的低比特寬度下的顯著性能差距。


本文期望這項實證研究將有助于推動未來模型的發展,推動LLMs在更低的比特寬度上以更高的精度實用化。

介紹

由Meta于2023年2月推出的LLaMA系列代表了使用Transformer架構的自回歸大語言模型(LLMs)的突破。從其第一個版本開始,擁有130億參數的LLaMA系列就成功地超越了擁有1750億參數的更大的、閉源的GPT-3模型。2024年4月18日,Meta推出了LLAMA3模型,提供了80億和700億參數的配置。由于在超過15萬億數據tokens上進行了廣泛的預訓練,LLAMA3模型在各種任務中實現了最先進的性能,將LLaMA系列確立為可用于廣泛應用和部署場景的最優秀的開源LLMs之一。


盡管它們的性能令人印象深刻,但在許多場景中部署LLAMA3模型仍然面臨著重大挑戰,這主要是由于資源限制。幸運的是,低比特量化已經成為壓縮LLMs最流行的技術之一。這種技術在推斷期間降低了LLMs的內存和計算需求,使它們能夠在資源有限的設備上運行。

解決壓縮后性能下降的問題是當前LLM量化方法的主要關注點。雖然已經提出了許多低比特量化方法,但它們的評估主要集中在較早和能力較弱的LLaMA模型(LLAMA1和LLAMA2)上。因此,LLAMA3為LLM社區提供了一個新的機會,評估對最新LLM進行量化的性能,并了解現有方法的優勢和局限性。在這項實證研究中,目標是分析LLAMA3處理由于量化而導致的性能下降所面臨的挑戰的能力。

?

本文的研究確定了兩個主要的技術路線來量化LLMs:訓練后量化(PTQ)和LoRA-FineTuning(LoRA-FT)量化, 旨在全面評估LLAMA3模型的量化效果。本文在技術路線上探索了一系列前沿的量化方法(RTN、GPTQ、AWQ、SmoothQuant、PB-LLM、QuIP、DB-LLM和BiLLM用于PTQ;QLoRA和IR-QLoRA用于LoRA-FT),覆蓋了從1比特到8比特的廣泛范圍,并利用了多種評估數據集,包括WikiText2、C4、PTB、CommonSenseQA數據集(PIQA、ARC-e、ARC-c、HellaSwag、Winogrande)和MMLU基準


本文的研究概述如下圖1所示。這些評價評估了LLAMA3模型在當前LLM量化技術下的能力和限制,并為未來LLM量化方法的設計提供了靈感。專注于LLAMA3模型的選擇是由于其在各種數據集上的卓越性能,包括5-shot MMLU、0-shot GPQA、0-shot HumanEval、8-shot CoT GSM-8K和4-shot CoT MATH等,這使其成為當前所有開源指令調整型LLMs中表現最優秀的模型。此外,已經在https://github.com/Macaronlin/LLaMA3-Quantization和https://huggingface.co/LLMQ上向公眾提供了本文的項目和量化模型。這不僅有助于推動LLM量化社區內的研究,而且有助于更廣泛地理解和應用有效的量化技術。

低比特量化的LLAMA3模型有多好? | 香港大學&北航最新研究發布-AI.x社區

實驗評估

實驗設置

評估LLMs。 本文對預訓練的LLAMA3-8B和-70B進行了評估,通過官方倉庫獲取。

量化方法。 為了評估低比特量化的LLAMA3的性能,本文選擇了具有廣泛影響和功能的代表性LLM量化方法,包括8種PTQ方法和2種LoRA-FT方法。本文評估的量化方法的實現遵循它們的開源倉庫。本文還使用了八個具有80GB GPU內存的NVIDIA A800進行定量評估。


評估數據集。 對于PTQ方法,本文在WikiText2、PTB和C4數據集的一部分上評估量化的LLAMA3,使用困惑度(Perplexity,PPL)作為評估指標。隨后,本文進一步在五個 zero-shot 評估任務(PIQA、Winogrande、ARC-e、ARC-c和Hellaswag)上進行實驗,以充分驗證LLAMA3的量化性能。對于LoRA-FT方法,本文在5-shot MMLU基準上進行評估,同時還驗證了在前述五個 zero-shot 數據集的LoRA-FT方法。


為了評估的公平性,本文統一使用WikiText2作為所有量化方法的校準數據集,樣本大小為128,token 序列長度保持一致為2048。此外,對于需要通道分組的量化方法,本文采用塊大小為128,以平衡性能和推斷效率,這是現有工作中的常見做法。

技術路線1:訓練后量化

如下表1和下表2所示,本文分別提供了LLAMA3-8B和LLAMA3-70B在8種不同的PTQ方法下的性能,涵蓋了從1到8比特的廣泛比特寬度范圍。

低比特量化的LLAMA3模型有多好? | 香港大學&北航最新研究發布-AI.x社區

低比特量化的LLAMA3模型有多好? | 香港大學&北航最新研究發布-AI.x社區

其中,Round-To-Nearest(RTN)是一種基本的四舍五入量化方法。GPTQ是目前最有效率和有效的僅權重量化方法之一,它利用量化中的誤差補償。但在2-3比特下,GPTQ在量化LLAMA3時會導致嚴重的準確度下降。AWQ采用異常通道抑制方法來減少權重量化的難度,而QuIP通過優化矩陣計算來確保權重和Hessian之間的不一致性。它們兩者都能保持LLAMA3在3比特的性能,并且甚至可以將2比特量化推向前景。


最近出現的二值化LLM量化方法實現了超低比特寬度LLM權重壓縮。PB-LLM采用混合精度量化策略,在將大部分權重量化為1比特的同時保留了一小部分重要權重的完整精度。DB-LLM通過雙二值化權重分割實現了高效的LLM壓縮,并提出了一種基于偏差感知的蒸餾策略,進一步增強了2比特LLM的性能。


BiLLM通過突出權重的殘差逼近和非突出權重的分組量化,將LLM量化邊界進一步推至低至1.1比特。這些專為超低比特寬度設計的LLM量化方法可以在?2比特時獲得更高的LLAMA3-8B量化精度,在2比特以下遠遠超過了像GPTQ、AWQ和QuIP等方法(甚至在某些情況下超過3比特)。


本文還通過SmoothQuant對量化激活的LLAMA3進行評估,SmoothQuant將量化難度從激活轉移到權重上,以平滑激活的異常值。本文的評估顯示,SmoothQuant在8比特和6比特的權重和激活下可以保持LLAMA3的準確性,但在4比特時面臨性能下降。

此外,本文發現LLAMA3-70B模型在各種量化方法中表現出顯著的穩健性,即使在超低比特寬度下也是如此。

技術路線2:LoRA-FineTuning量化

除了PTQ方法之外,如下表3所示,本文還提供了4比特LLAMA3-8B使用2種不同LoRA-FT量化方法的性能,包括QLoRA和IR-QLoRA。

低比特量化的LLAMA3模型有多好? | 香港大學&北航最新研究發布-AI.x社區

在MMLU數據集上,LLAMA3-8B在LoRA-FT量化下最顯著的觀察是,Alpaca數據集上的低秩微調不僅不能彌補量化引入的錯誤,甚至使惡化更加嚴重。具體來說,與沒有LoRA-FT的4比特對應版本相比,各種LoRA-FT量化方法在4比特下獲得的性能更差的量化LLAMA3。這與LLAMA1和LLAMA2上類似的現象形成鮮明對比,對于前者,在MMLU上,4比特的低秩微調量化版本甚至可以輕松超過原始的FP16對應版本。



直覺分析,這種現象的主要原因是由于LLAMA3通過其大規模預訓練帶來的強大性能,這意味著原始模型的量化帶來的性能損失無法通過在低秩參數的小數據集上進行微調來彌補(可以看作是原始模型的一個子集)。盡管無法通過微調來彌補量化帶來的顯著下降,但4比特LoRA-FT量化的LLAMA3-8B在各種量化方法下明顯優于LLAMA1-7B和LLAMA2-7B。例如,使用QLoRA方法,4比特LLAMA3-8B的平均準確度為57.0(FP16:64.8),超過了4比特LLAMA1-7B的38.4(FP16:34.6)18.6,以及超過了4比特LLAMA2-7B的43.9(FP16:45.5)13.1。這意味著在LLAMA3時代需要一種新的LoRA-FT量化范式。

類似的現象也在CommonSenseQA基準測試中發生。與沒有LoRA-FT的4比特對應版本相比,使用QLoRA和IR-QLoRA微調的模型的性能也下降了(例如,QLoRA平均下降了2.8%,而IR-QLoRA平均下降了2.4%)。這進一步證明了在LLAMA3中使用高質量數據集的優勢,因為一般數據集Alpaca并不對模型在其他任務中的性能做出貢獻。

結論

Meta最近發布的LLAMA3模型迅速成為最強大的LLM系列,引起了研究人員的極大興趣。借助這一勢頭,本文的研究旨在全面評估LLAMA3在各種低比特量化技術下的性能,包括訓練后量化和LoRA微調量化。本文的目標是通過利用現有的LLM量化技術,評估LLAMA3在資源有限的情況下的能力邊界。本文的研究發現表明,盡管LLAMA3在量化后仍然表現出優越的性能,但與量化相關的性能下降是顯著的,甚至在許多情況下可能導致更大的下降。這一發現突顯了在資源受限環境中部署LLAMA3的潛在挑戰,并強調了在低比特量化背景下增長和改進的充足空間。本文研究的實證洞見預計將對未來LLM量化技術的發展具有價值,特別是在縮小與原始模型之間的性能差距方面。通過解決低比特量化引起的性能下降,預計隨后的量化范式將使LLMs能夠以更低的計算成本實現更強大的能力,最終推動生成式人工智能的進步,如LLMs所代表的,達到新的高度。


本文轉自 AI生成未來 ,作者:Wei Huang等


原文鏈接:??https://mp.weixin.qq.com/s/KQdaPvpbWyXza-8__4iAeg??

標簽
收藏
回復
舉報
回復
相關推薦
日韩在线播放av| 色综合视频在线观看| 91成人在线看| 五月天综合激情网| 精品国产中文字幕第一页 | 免费拍拍拍网站| 国产小视频在线| 国产成人在线电影| 国产suv精品一区二区三区88区| 永久免费未视频| 美女一区二区在线观看| 欧美日韩视频在线观看一区二区三区| 日韩人妻一区二区三区蜜桃视频| 深夜影院在线观看| 国产一区二区在线视频| 日韩av日韩在线观看| 九九视频免费观看| 久久精品高清| 亚洲日本成人女熟在线观看| 中文字幕欧美视频| 成人午夜亚洲| 富二代精品短视频| 免费的一级黄色片| 精品黄色免费中文电影在线播放| 久久伊人蜜桃av一区二区| 动漫3d精品一区二区三区| 亚洲视频在线观看免费视频| 99精品视频网| 欧美黑人国产人伦爽爽爽| 国产福利在线导航| 国产影视一区| 亚洲欧美一区二区激情| 美女扒开腿免费视频| 欧美9999| 717成人午夜免费福利电影| 性生交免费视频| 中文字幕成在线观看| 午夜影视日本亚洲欧洲精品| 真人做人试看60分钟免费| 国产黄色小视频在线| 国产精品进线69影院| 欧美午夜精品久久久久久蜜| 午夜在线观看视频18| 丁香激情综合五月| av在线不卡一区| www久久久com| 国产99精品国产| 成人动漫在线观看视频| 亚洲成人一级片| 国产成人午夜电影网| 成人激情av| 丰满少妇在线观看bd| 成人激情黄色小说| 国产一区二区三区高清视频| 天堂网av在线播放| 成人av电影在线观看| 国产在线精品二区| 亚洲 欧美 自拍偷拍| 26uuu亚洲综合色欧美| 久久久久se| 国产精品ⅴa有声小说| 国产欧美日韩中文久久| 亚洲一区二区精品在线| 亚洲精品承认| 亚洲精品视频一区| 国产www免费| 欧美在线极品| 91成人看片片| 五月天视频在线观看| 精品一区二区三区免费看| 欧美电影精品一区二区| 色呦呦一区二区| jvid福利在线一区二区| www国产精品com| 久久精品一区二区三| 亚洲美女91| 国产成人综合精品在线| 91激情在线观看| 国产精品亚洲专一区二区三区| 99国产高清| 亚洲av成人精品毛片| 中文子幕无线码一区tr| 四虎4hu永久免费入口| 久草免费在线色站| 91福利资源站| 涩多多在线观看| 午夜a一级毛片亚洲欧洲| 亚洲新中文字幕| 欧美精品久久久久性色| 亚洲伊人观看| 国产在线精品自拍| 深夜福利视频网站| 国产精品毛片无遮挡高清| 91精品国产毛片武则天| 欧美成人精品一区二区男人小说| 欧美日本乱大交xxxxx| 亚洲av永久无码精品| 经典一区二区| 久久久久久综合网天天| 欧美一级黄视频| 成人高清伦理免费影院在线观看| 日韩亚洲视频| 123区在线| 在线电影一区二区三区| 一卡二卡三卡四卡| 欧美视频成人| 国产日韩一区在线| 亚州视频一区二区三区| 亚洲卡通动漫在线| 欧美伦理片在线看| 久久精品福利| 欧美精品在线网站| 亚洲一级av毛片| 91麻豆产精品久久久久久| 只有这里有精品| 成人精品国产| 日韩成人xxxx| 精品肉丝脚一区二区三区| 久久99久久99| 日本高清不卡三区| 三级在线观看视频| 亚洲精品一线二线三线无人区| 美国黄色片视频| 日韩—二三区免费观看av| 国产精品免费一区二区三区四区| 免费网站成人| 欧美日韩国产中文| 山东少妇露脸刺激对白在线| 先锋影音久久| 精品在线观看一区二区| 伦理在线一区| 精品久久久久久久人人人人传媒 | 亚洲777理论| 99热这里只有精品2| 欧美3p在线观看| 国产精品一区久久久| 春暖花开成人亚洲区| 色综合中文字幕| 欧美老熟妇乱大交xxxxx| 国产精品夜夜夜| 久久国产精品精品国产色婷婷| 日本理论片午伦夜理片在线观看| 日韩欧美国产1| 1024手机在线视频| 国产成人亚洲综合a∨婷婷图片| 欧美日韩一级在线| 日韩欧美高清一区二区三区| 美女精品视频一区| www精品国产| 亚洲电影一级黄| 少妇被狂c下部羞羞漫画| 伊人久久大香线蕉综合热线| 狠狠干一区二区| 午夜伦理福利在线| 国产一区二区三区在线视频| 最新黄色网址在线观看| 国产精品麻豆视频| 韩国一区二区在线播放| 欧美日韩福利| 精品一区二区三区视频日产| 中文字幕这里只有精品| 尤物yw午夜国产精品视频| 在线视频 中文字幕| 亚洲精品免费在线观看| 久久精品视频在线观看免费| 黄色国产精品| 欧美成人综合一区| 国产精品久久乐| 欧美精品在线免费| 视频一区二区在线播放| 91电影在线观看| 国产免费美女视频| av成人动漫在线观看| 国产成人手机视频| 久久久久蜜桃| 精品久久久久久乱码天堂| 欧美日韩五码| 久久久国产一区| 日韩av免费观影| 欧美久久久一区| 亚洲国产综合久久| 欧美激情一二三区| 国产精品偷伦视频免费观看了 | 亚洲男人的天堂在线aⅴ视频| 熟女人妻一区二区三区免费看| 亚洲欧美日韩国产一区二区| 亚洲一区二区在线看| 国产主播性色av福利精品一区| 国产精品xxx视频| 亚洲91av| 最近免费中文字幕视频2019| 好吊色在线观看| 欧美日韩国产免费一区二区| 国产一级淫片免费| 国产精品麻豆一区二区| 欧美大片免费播放器| 久久成人久久鬼色| 日日碰狠狠躁久久躁婷婷| 在线免费观看日本欧美爱情大片| 欧美精品一区二区三区四区五区| avtt久久| 国产精品女人久久久久久| sm在线播放| 欧美成人中文字幕| 91精彩视频在线观看| 日韩成人黄色av| 亚洲黄色一级大片| 欧美久久久久久久久| 在线天堂中文字幕| 一区二区三区精品在线观看| 天堂av网手机版| www国产精品av| 性感美女一区二区三区| 国产一区二区在线电影| 九九热精品在线播放| 久久午夜精品| 欧美视频在线播放一区| 国产综合激情| 国产a级片免费看| 日韩片欧美片| 日韩av电影免费播放| 久久97精品| 国产精品日韩欧美一区二区三区| 在线视频成人| 国产日本欧美视频| 成人在线免费av| 青青精品视频播放| 亚洲美女炮图| 欧美一级黑人aaaaaaa做受| 国产探花在线观看| 久久久久久久久国产精品| a免费在线观看| 欧美大奶子在线| 主播国产精品| 欧美国产日产韩国视频| 综合久久2019| 欧美激情视频在线观看| 久久久123| 国内揄拍国内精品少妇国语| 波多野结衣中文在线| 久久久久久久久国产| 捆绑调教日本一区二区三区| 国内精品400部情侣激情| 波多野结衣中文字幕久久| 97高清免费视频| 午夜激情电影在线播放| 日韩女优在线播放| 亚洲爱爱视频| 国产日本欧美在线观看| 电影91久久久| 亚洲综合在线做性| 极品一区美女高清| 鲁丝一区二区三区免费| 女厕嘘嘘一区二区在线播放| 日韩国产在线一区| 久久影院100000精品| 国产精品一区在线免费观看| 欧美日韩免费| 免费看的黄色大片| 日韩福利电影在线观看| 日韩成人av免费| 国产91精品入口| 久久丫精品国产亚洲av不卡| 国产调教视频一区| 久久99久久99精品免费看小说| 一区二区三区日本| 天天插天天操天天干| 在线亚洲免费视频| 国产精品久久久久久69| 日韩精品中文字幕在线一区| 天堂在线观看视频| 国产亚洲精品成人av久久ww| 免费**毛片在线| 国模gogo一区二区大胆私拍| 性欧美18一19sex性欧美| 成人久久精品视频| 精品一区二区男人吃奶| 日本在线播放一区| 欧美在线二区| 久久婷婷国产精品| 国产综合色在线| 亚洲国产精品成人综合久久久| 国产日韩欧美a| 免费中文字幕在线观看| 在线一区二区视频| www.久久色| 亚洲区中文字幕| 丝袜美腿av在线| 国产精品成人在线| 成人香蕉社区| 亚洲电影一二三区| 亚洲精选一区| 欧美一级小视频| 91色|porny| 久草资源在线视频| 精品视频一区二区不卡| 天堂网2014av| 不卡伊人av在线播放| 欧美一级大黄| 肥熟一91porny丨九色丨| 日韩精品免费一区二区在线观看| 欧美成人高潮一二区在线看| 国产一区二区三区四区五区美女| 丝袜美腿中文字幕| 亚洲综合视频在线| 国产一区二区波多野结衣| 亚洲欧美成人精品| 182在线播放| 69174成人网| 第一会所亚洲原创| 精品中文字幕av| 成人av在线一区二区三区| 日韩欧美综合视频| 欧美日韩久久一区| 国产高清免费av在线| 欧美中文字幕视频| 国产精品白浆| 日韩a级黄色片| 久久成人av少妇免费| 精品无码国产污污污免费网站| 亚洲国产欧美在线| 99视频免费看| 久久成人精品一区二区三区| 九九九精品视频| 丝袜足脚交91精品| 美女久久一区| 久久精品国产亚洲AV熟女| 午夜电影久久久| 人妻偷人精品一区二区三区| 久久国产加勒比精品无码| av日韩一区| 中文字幕一区二区中文字幕| 久久精品国产精品青草| 手机看片国产日韩| 欧美在线|欧美| 国产黄在线观看| 国产精品91在线| 精品国产一区二区三区小蝌蚪 | www.久久精品视频| 亚洲免费影视第一页| 成人免费短视频| 欧洲一区二区在线| 久久综合影视| 久久视频一区二区三区| 欧美日韩国产精品自在自线| 日韩子在线观看| 91九色视频在线| 欧美区亚洲区| 尤物网站在线观看| 懂色aⅴ精品一区二区三区蜜月| 天堂中文在线视频| 国产成人a亚洲精品| 欧美精品一二| 性生活免费在线观看| 亚洲欧美一区二区三区久本道91| 精品国产亚洲AV| 国内精品久久久| 亚洲+变态+欧美+另类+精品| 日本三级免费观看| 中文字幕电影一区| 国产精品一二三四五区| 欧美激情va永久在线播放| 天天做夜夜做人人爱精品| 黄色a级片免费| 国产精品国产三级国产aⅴ入口| 国产视频手机在线| 国模精品一区二区三区色天香| 精品中文一区| 国产一级免费大片| 亚洲r级在线视频| 99精品老司机免费视频| 97自拍视频| 美女日韩在线中文字幕| 五月综合色婷婷| 日韩av网址在线| 国产欧美自拍| 婷婷五月综合缴情在线视频| 久久精品亚洲乱码伦伦中文| 国产免费不卡视频| 91国产精品电影| 9999国产精品| 青青草视频网站| 欧美日韩中文字幕一区二区| 日本色护士高潮视频在线观看| 欧美一区二区三区四区五区六区 | 国产伦精品一区二区三区免| 久久一区视频| 九九久久免费视频| 在线日韩日本国产亚洲| 91亚洲无吗| www.久久91| 精品久久久久久亚洲精品| 日本美女在线中文版| 久久综合久久综合这里只有精品| 韩国成人福利片在线播放| 久久久久久久黄色片| 久久久电影免费观看完整版| 国产欧美日韩精品一区二区免费| 26uuu国产| 欧美精品 日韩|