精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

模型壓縮到70%,還能保持100%準確率,無損壓縮框架DFloat11來了

人工智能 新聞
本文,來自萊斯大學等機構的研究者提出了一種解決方案,可以將任何 BFloat16 模型壓縮到原始大小的 70%,同時還能在任務上保持 100% 的準確性。

大型語言模型(LLMs)在廣泛的自然語言處理(NLP)任務中展現出了卓越的能力。然而,它們迅速增長的規模給高效部署和推理帶來了巨大障礙,特別是在計算或內存資源有限的環境中。

例如,Llama-3.1-405B 在 BFloat16(16-bit Brain Float)格式下擁有 4050 億個參數,需要大約 810GB 的內存進行完整推理,超過了典型高端 GPU 服務器(例如,DGX A100/H100,配備 8 個 80GB GPU)的能力。因此,部署該模型需要多個節點,這使得它昂貴且難以獲取。

本文,來自萊斯大學等機構的研究者提出了一種解決方案,可以將任何 BFloat16 模型壓縮到原始大小的 70%,同時還能在任務上保持 100% 的準確性。

圖片


  • 論文標題: 70% Size, 100% Accuracy: Lossless LLM Compression for Efficient GPU Inference via Dynamic-Length Float 
  • 論文地址:https://arxiv.org/pdf/2504.11651
  • 項目地址:https://github.com/LeanModels/DFloat11

為了應對 LLM 不斷增長的模型尺寸,通常會采用量化技術,將高精度權重轉換為低位表示。這顯著減少了內存占用和計算需求,有助于在資源受限的環境中實現更快的推理和部署。然而,量化本質上是一種有損壓縮技術,引入了一個基本缺點:它不可避免地改變了 LLMs 的輸出分布,從而影響模型的準確性和可靠性。

相比之下,無損壓縮技術在有效減少 LLM 規模的同時,保留了精確的原始權重,確保模型的輸出分布與未壓縮表示(例如 BFloat16)完全相同。然而,現有的無損方法主要集中在提高 LLMs 的存儲效率上,例如縮小模型檢查點或優化針對專用硬件如 FPGA 的性能上。

本文提出了 DFloat11(Dynamic-Length Float),這是一種無損壓縮框架,可以在保持與原始模型完全相同的輸出的情況下,將 LLM 的規模減少 30%

DFloat11 的提出源于當前 LLM 模型中 BFloat16 權重表示的低熵問題,這暴露出現有存儲格式存在顯著的低效性。通過應用熵編碼技術,DFloat11 根據權重出現頻率為其分配動態長度編碼,在不損失任何精度的情況下實現了接近信息理論極限的壓縮效果。

為了支持動態長度編碼的高效推理,該研究還開發了定制化的 GPU 內核來實現快速在線解壓縮。其設計包含以下內容:

  • 將內存密集型查找表(LUT)分解為適應 GPU SRAM 的緊湊型查找表;
  • 采用雙階段內核設計,通過輕量級輔助變量協調線程讀寫位置;
  • 實現 Transformer 塊級解壓縮以最小化延遲。

該研究在 Llama-3.1、Qwen-2.5 和 Gemma-3 等最新模型上進行了實驗:DFloat11 能在保持比特級(bit-for-bit)精確輸出的同時,將模型體積縮減約 30%。與將未壓縮模型部分卸載到 CPU 以應對內存限制的潛在方案相比,DFloat11 在 token 生成吞吐量上實現了 1.9–38.8 倍的提升。在固定 GPU 內存預算下,DFloat11 支持的上下文長度是未壓縮模型的 5.3–13.17 倍。

值得一提的是,基于該方法 Llama-3.1-405B(810GB)在配備 8×80GB GPU 的單節點上實現了無損推理。

方法介紹

LLM 的權重通常使用浮點數表示,包括 BFloat16 或 BF16,其在數值精度和內存效率之間取得了平衡。然而,BFloat16 表示信息并不高效。

針對 BFloat16 表示法中存在的信息效率低下問題,本文提出了一種無損壓縮框架,通過熵編碼技術對浮點參數進行壓縮。

具體實現包括:基于語言模型線性投影矩陣中所有 BFloat16 權重的指數分布構建霍夫曼樹,對指數部分采用霍夫曼編碼壓縮,同時保留原始符號位和尾數位。壓縮后的指數經過緊密比特打包存入字節數組 EncodedExponent,而未壓縮的符號位和尾數則存儲在獨立字節數組 PackedSignMantissa 中。圖 2 展示了 DFloat11(Dynamic-Length Float)或 DF11,該格式可實現模型參數的高效緊湊表示。

圖片

雖然動態長度浮點數能有效實現 LLM 的無損壓縮,但關鍵挑戰依然存在:如何利用這些壓縮權重進行高效的 GPU 推理。接下來,文章詳細介紹了解決方案,其中包括三個關鍵組成部分:

  1. 將一個龐大的無前綴查找表(LUT)分解為多個適合 GPU SRAM 的緊湊 LUTs;
  2. 引入一個兩階段的內核設計,利用輕量級輔助變量來高效協調線程的讀寫操作;
  3. 在 transformer 塊級別執行解壓縮,以提高吞吐量并最小化延遲。

算法 1 是將 DFloat11 解壓縮為 BFloat16 的 GPU 內核過程。

圖片

實驗

研究人員評估了 DF11 壓縮方法在 GPU 上的有效性及推理效率,將多個主流大語言模型(包括 LLaMA、Qwen、Gemma 等)從 BFloat16 壓縮為 DF11 格式,并報告其壓縮比和性能表現。

在軟硬件環境方面,研究人員使用 CUDA 和 C++ 實現了 DF11 解壓縮內核,并集成至 Transformers 推理框架。實驗基于 HuggingFace Accelerate 框架評估未壓縮模型在 CPU 分流(CPU offloading)和多 GPU 場景下的性能。

為全面分析 DF11 內核在不同硬件配置下的表現,團隊在多種 GPU 和 CPU 組合的機器上進行實驗。

實驗結果 

DF11 壓縮比:DF11 將大語言模型壓縮至原始大小的約 70%(等效位寬為 11 位)。

圖片

表 2 展示了 DF11 在 LLaMA、Qwen、Gemma 等模型上的壓縮效果。所有模型的線性投影層參數均被壓縮為 DF11 格式,壓縮比穩定在 70%。

無損特性驗證:為驗證 DF11 的無損特性,研究人員使用 lm-evaluation-harness 工具在 MMLU、TruthfulQA、WikiText 和 C4 數據集上評估模型性能。

結果表明,壓縮后的模型在準確率和困惑度(Perplexity)上與原始 BFloat16 模型一致(見表 3)。此外,研究人員逐位對比 DF11 解壓后的權重矩陣與原始矩陣,確認其完全相同。

圖片

推理性能:研究人員在多個硬件平臺上比較了 DF11 與 BFloat16 模型的推理效率。對于 BFloat16 模型,當模型超出單 GPU 顯存時,需將部分計算分流至 CPU,而 DF11 模型可完全加載至單 GPU。

評估指標包括延遲(Latency)和吞吐量(Throughput),結果顯示 DF11 模型的性能顯著優于 BFloat16 模型,延遲減少 1.85 至 38.83 倍(見圖 3)。

圖片

節省的顯存可支持更長生成序列:DF11 的顯存節省使模型能夠支持更長的生成序列。如圖 4 所示,在 batch size 為 1 時,DF11 模型的顯存消耗顯著降低,相比 BFloat16 模型最多可生成 5.33 至 13.17 倍的 tokens。

圖片

消融研究 

延遲分析:研究團隊以 Llama-3.1-8B-Instruct 為例,對比了其在 BFloat16 與 DF11 格式下不同 batch 大小時的延遲組成,結果如圖 5 所示。

圖片

相比原始模型,DF11 壓縮模型因解壓 Transformer 模塊與語言建模頭引入了額外延遲但該開銷與 batch size 無關,因此通過提升 batch size 可有效攤銷解壓延遲,使總推理時間之間的差距顯著縮小。

解壓性能對比:研究人員將 DF11 解壓內核的延遲與吞吐表現分別與兩種基線方案進行對比:

  • 將模型權重存儲于 CPU 內存并在需要時傳輸到 GPU;
  • 使用 NVIDIA 的 nvCOMP 庫中的 ANS(不對稱數值系統,Asymmetric Numeral System)解壓方法。

實驗以 Llama-3.1-8B-Instruct 語言建模頭權重矩陣為例,結果如圖 6 所示,DF11 的解壓吞吐量最高分別為 CPU-GPU 傳輸和 ANS 解碼的 24.87 倍和 15.12 倍。此外,DF11 的壓縮比為 70%,優于 nvCOMP 的 78%。值得注意的是,隨著權重矩陣規模的增大,DF11 的解壓吞吐呈上升趨勢,原因是更好的 GPU 線程利用率。


責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-10-11 18:05:23

AI大模型工具

2025-04-27 09:15:40

2023-10-10 08:52:43

PNG類型Chinchilla

2022-06-30 10:38:53

Lepton無損壓縮圖片圖片質量

2022-06-08 16:29:45

無損壓縮方案分布式

2022-04-22 10:29:46

機器學習數據集計算

2015-08-31 10:10:48

Dropbox無損壓縮算法云存儲

2022-06-15 16:06:29

LZ4 算法硬件加速

2023-10-26 08:40:15

模型隱私推理

2022-06-15 15:44:21

無損數據壓縮鴻蒙

2023-02-09 09:38:32

算法壓縮

2024-07-02 11:30:00

存儲壓縮算法

2025-10-24 12:14:32

2024-09-29 16:00:26

2023-01-04 20:00:02

SparseGPT降低算力成本

2024-07-15 00:30:00

MetaAI 模型大語言模型

2020-11-20 17:03:11

AI 數據人工智能

2023-05-04 09:39:16

AI模型

2018-06-12 07:15:18

阿里巴巴技術語音識別

2023-11-08 08:38:43

點贊
收藏

51CTO技術棧公眾號

日本久久一二三四| 日本欧美一区| 99精品偷自拍| 国产精品wwww| 一区二区国产精品精华液| 亚洲午夜免费| 在线视频一区二区三区| 国产精品亚洲天堂| 熟妇高潮一区二区高潮| 美国毛片一区二区三区| 国内精品久久久久久中文字幕| 亚洲理论片在线观看| 美女国产精品久久久| 欧美日韩一区免费| 蜜桃视频成人在线观看| 亚洲日本香蕉视频| 国产麻豆一精品一av一免费 | 天使と恶魔の榨精在线播放| 97se亚洲国产综合自在线观| 91九色露脸| 无码人妻精品一区二区三区不卡| 中文字幕一区二区精品区| 亚洲欧洲在线播放| 国产清纯白嫩初高中在线观看性色| 日韩高清成人| 第一福利永久视频精品| 亚洲爆乳无码精品aaa片蜜桃| 成人午夜影视| 久久综合色一综合色88| 99在线国产| 91久久精品国产91性色69| 久久经典综合| 7777kkkk成人观看| 久久网免费视频| 91偷拍一区二区三区精品| 亚洲欧洲高清在线| 国产精品第七页| 好吊妞视频这里有精品| 日韩视频在线永久播放| 小明看看成人免费视频| 一呦二呦三呦精品国产| 一本到三区不卡视频| 国产精品999视频| 国产99re66在线视频| 一区二区三区丝袜| 国产av第一区| 在线中文字幕电影| 亚洲欧美日韩中文播放| 人人妻人人澡人人爽精品欧美一区| 阿v免费在线观看| 国产日韩视频一区二区三区| 欧美福利一区二区三区| 色播色播色播色播色播在线| 99天天综合性| 精品午夜一区二区| 日本免费不卡| 国产无人区一区二区三区| 日本不卡二区| 亚洲麻豆精品| 自拍偷拍欧美精品| 亚洲AV无码成人精品一区| www.久久久久.com| 亚洲精品久久7777| 日韩成人午夜影院| 黄色的视频在线观看| 午夜精品久久久| 免费成人午夜视频| 成人免费黄色| 337p亚洲精品色噜噜噜| 无码国产精品一区二区高潮| 高潮久久久久久久久久久久久久 | 国产日韩精品在线播放| 一级特黄录像免费看| 国产精品一区二区黑丝| 国产一区二区自拍| 黄色影院在线播放| 亚洲欧洲国产日韩| 老司机激情视频| 亚洲校园激情春色| 欧美网站一区二区| www.欧美com| 色天下一区二区三区| 这里只有精品久久| 免费在线观看日韩| 亚洲永久网站| 91精品视频观看| 欧洲av在线播放| 国产欧美一区二区精品性| 99久re热视频精品98| 福利在线免费视频| 欧美日韩视频专区在线播放| 精品少妇人妻av一区二区三区| 啪啪国产精品| 另类视频在线观看| 欧美特黄aaaaaa| 狠狠色综合播放一区二区| 国产尤物99| 老司机精品影院| 天天色 色综合| 色呦色呦色精品| 欧美久久精品| 久久这里只有精品99| 91在线视频在线观看| 国产在线播放一区二区三区| 久久精品日产第一区二区三区乱码| av黄色在线观看| 舔着乳尖日韩一区| 中文av字幕在线观看| 免费精品国产| 高清一区二区三区四区五区| 91成人国产综合久久精品| 99久久精品免费看| 中文字幕欧美人与畜| 亚洲va中文在线播放免费| 精品国产凹凸成av人网站| 欧美肥妇bbwbbw| 老司机午夜精品视频在线观看| 99爱精品视频| 日本韩国在线视频爽| 91成人免费在线视频| 折磨小男生性器羞耻的故事| 亚洲最新av| 国产美女91呻吟求| 蜜桃成人在线视频| 天天综合色天天综合色h| 欧美色图校园春色| 99re6这里只有精品| 国产91在线播放| 五月婷中文字幕| 婷婷国产v国产偷v亚洲高清| av影片在线播放| 欧美日韩18| 91香蕉电影院| 国产精品剧情| 欧美精品v日韩精品v韩国精品v| 69xxx免费| 日韩成人免费电影| 欧美人与性禽动交精品| 欧产日产国产精品视频| 亚洲黄色av网站| 日韩男人的天堂| 99久久精品国产麻豆演员表| 日韩精品在线视频免费观看| 97久久精品| 久久久亚洲国产| 亚洲va久久久噜噜噜无码久久| 亚洲猫色日本管| 四虎国产精品永久免费观看视频| 综合激情视频| 亚洲一区二区三区四区在线播放| 老司机精品视频在线观看6| 欧美精品免费视频| 2025国产精品自拍| 国产高清一区日本| 久草视频这里只有精品| 大型av综合网站| 97成人精品区在线播放| 免费一级毛片在线观看| 在线精品视频免费播放| 天天操天天舔天天射| 久久99精品久久只有精品| 天天在线免费视频| 91免费精品国偷自产在线在线| 欧美精品www在线观看| 三级小视频在线观看| 欧美午夜丰满在线18影院| 一区二区精品免费| 蜜臀久久99精品久久久久久9| 亚洲精品白虎| 国产日韩在线观看视频| 午夜精品一区二区三区在线| 黄色软件在线观看| 欧美片在线播放| 免费一级黄色大片| 久久综合久久综合久久| 人人干人人干人人| 在线国产一区二区| 国产三区精品| 国产在视频一区二区三区吞精| 久久成人精品视频| 午夜在线视频免费| 欧美精品成人一区二区三区四区| 国产一级二级三级| www久久精品| www.久久91| 影音先锋亚洲精品| 日韩欧美亚洲在线| 麻豆国产一区| 国产成人综合久久| 超碰在线观看免费版| 亚洲精品黄网在线观看| 中文字幕人成人乱码亚洲电影| 亚洲人精品午夜| 亚洲精品乱码久久久久久久| 麻豆精品视频在线观看视频| 无码人妻少妇伦在线电影| 成人在线免费观看91| 激情视频在线观看一区二区三区| 第四色男人最爱上成人网| 欧美国产乱视频| 成人性生交大片免费看午夜| 欧美精品一区二区三区四区| 亚洲中文字幕在线一区| 精品久久久久久| 男女性高潮免费网站| 国产亚洲欧美激情| 欧美大喷水吹潮合集在线观看| 美女网站在线免费欧美精品| 精品久久一二三| 欧美日韩一区二区国产| 亚洲精品成人自拍| 欧美人与物videos另类xxxxx| 亚洲自拍中文字幕| 国产亚洲精彩久久| 国产精品678| 高潮在线视频| 久久久久久久久亚洲| www视频在线看| yellow中文字幕久久| 免费一级在线观看| 日韩精品高清视频| 丰满肉嫩西川结衣av| 欧美精品少妇一区二区三区| 在线观看毛片av| 一本色道亚洲精品aⅴ| 日韩美女视频网站| 一区二区成人在线观看| 免费国产羞羞网站美图| 国产精品久久久久久久久搜平片 | 国产麻豆一区二区三区精品视频| 国产精品露出视频| 99亚洲乱人伦aⅴ精品| 444亚洲人体| 四虎永久精品在线| 成人a级免费视频| 国产精品黄色片| 国产精品美女主播在线观看纯欲| 亚洲精品**中文毛片| 91av在线看| 色一区二区三区| 欧美中在线观看| 亚洲天堂一区二区| 国产精品久久久久久久久久尿 | 美国黄色一级毛片| 成人aa视频在线观看| youjizz.com日本| jvid福利写真一区二区三区| 亚洲天堂成人av| 久久久精品国产免大香伊 | 成人午夜免费在线观看| 欧美一区二区三区人| h片在线免费看| 欧美www视频| 深爱五月激情五月| 亚洲欧洲偷拍精品| 国产69久久| 久久久成人的性感天堂| 二区三区在线观看| 欧美精品性视频| 丁香花电影在线观看完整版| 97人人模人人爽人人喊中文字| 台湾佬中文娱乐网欧美电影| 日韩免费在线播放| 日韩专区视频| 99re在线视频观看| 天堂网av成人| 偷拍视频一区二区| 综合久久一区| 久久国产亚洲精品无码| 日韩激情一二三区| 97人人爽人人| av一区二区三区在线| 调教驯服丰满美艳麻麻在线视频| 最新高清无码专区| 国产手机在线视频| 欧美日韩日本视频| 亚洲AV午夜精品| 一区二区三区美女xx视频| 黄网站在线播放| 91福利视频网| 亚洲伦理网站| 精品免费日产一区一区三区免费| 精品盗摄女厕tp美女嘘嘘| 亚洲精品少妇一区二区| 性欧美videos另类喷潮| 男生操女生视频在线观看| 成人爽a毛片一区二区免费| 非洲一级黄色片| 一区二区三区四区蜜桃 | 亚洲图区一区| 国产精品99蜜臀久久不卡二区| 日韩免费成人| 婷婷五月色综合| 亚洲人成免费| 91视频这里只有精品| 2020国产精品自拍| 国产日产精品一区二区三区的介绍| 婷婷久久综合九色综合绿巨人| 精品少妇人妻av一区二区| 男男激情在线| 久久久精品国产亚洲| 国产伦理精品| 91影视免费在线观看| 欧美激情在线精品一区二区三区| 亚洲第一页在线视频| 久久综合九色| 尤物网站在线观看| 综合久久给合久久狠狠狠97色| 天天爽夜夜爽夜夜爽精品| 欧美一卡二卡三卡| 成人网视频在线观看| 韩国国内大量揄拍精品视频| vam成人资源在线观看| 日本成人看片网址| 亚洲日产国产精品| 九九九九九九九九| 久久精品视频一区二区三区| 国产一级一片免费播放放a| 欧美日韩激情一区二区三区| 你懂的在线视频| 91国产视频在线| 国产精品流白浆在线观看| japanese在线视频| 蜜桃久久久久久| 老熟妇一区二区| 精品久久久在线观看| 开心激情综合网| 欧美成人精品激情在线观看| 日韩毛片网站| 亚洲欧洲日韩精品| 久久午夜激情| 西西444www无码大胆| 天涯成人国产亚洲精品一区av| 亚洲免费成人网| 欧美高清视频在线播放| 中文字幕久久精品一区二区| 日本国产中文字幕| 狠狠久久亚洲欧美| 神马久久精品综合| 欧美疯狂party性派对| 欧美一级大胆视频| 成人高潮视频| 日韩网站在线免费观看| 成人午夜在线视频| 国产午夜福利精品| 日韩av在线精品| 色呦呦在线视频| 国产精品裸体一区二区三区| 激情一区二区| 欧美成人三级伦在线观看| 午夜精品久久久久久久99水蜜桃 | 亚洲最大的免费视频网站| 特级西西444www大精品视频| 日韩精品欧美成人高清一区二区| 无码 人妻 在线 视频| 欧美在线观看视频一区二区| av午夜在线| 91精品啪在线观看麻豆免费| 欧美韩日精品| 国产原创剧情av| 欧美午夜影院在线视频| 国产中文在线| 国产在线视频一区| 欧美在线91| 精品人妻一区二区三区日产| 欧美午夜精品久久久久久久| 国产免费av高清在线| 国产日韩欧美综合| 最新国产精品久久久| 你懂的在线观看网站| 欧美亚洲一区三区| 黄色视屏免费在线观看| 国产成人精品福利一区二区三区| 一本色道精品久久一区二区三区 | 精品一级毛片| 性欧美在线视频| 午夜精品一区二区三区免费视频| 免费在线超碰| 91日本视频在线| 亚洲久久视频| 91n在线视频| 亚洲激情视频在线播放| 久久人体av| 霍思燕三级露全乳照| 国产丝袜美腿一区二区三区| 99国产成人精品| 欧美一级视频在线观看| 久久久综合色| 91视频在线免费| 欧美性一区二区| 免费在线观看的电影网站| 欧美专区一二三 | 欧美成人三级伦在线观看| 欧美日本视频在线| www.51av欧美视频| 天天干天天操天天干天天操| 91色婷婷久久久久合中文| 99热这里只有精品9| 热99在线视频| 黑人一区二区|