精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

CPU反超NPU,llama.cpp生成速度翻5倍!LLM端側部署新范式T-MAC開源

人工智能 新聞
T-MAC是一種創新的基于查找表(LUT)的方法,專為在CPU上高效執行低比特大型語言模型(LLMs)推理而設計,無需權重反量化,支持混合精度矩陣乘法(mpGEMM),顯著降低了推理開銷并提升了計算速度。

為增強設備上的智能性,在邊緣設備部署大型語言模型(LLMs)成為了一個趨勢,比如微軟的Windows 11 AI + PC。

目前部署的大語言模型多會量化到低比特。然而,低比特LLMs在推理過程中需要進行低精度權重和高精度激活向量的混合精度矩陣乘法(mpGEMM)。現有的系統由于硬件缺乏對mpGEMM的原生支持,不得不將權重反量化以進行高精度計算。這種間接的方式導致了顯著的推理開銷,并且無法隨著比特數進一步降低而獲得加速。

為此,微軟亞洲研究院、中國科學技術大學、中國科學院大學的研究人員聯合開發了T-MAC。T-MAC采用基于查找表(LUT)的計算范式,無需反量化,直接支持混合精度矩陣乘,其高效的推理性能以及其統一且可擴展的特性為在資源受限的邊緣設備上實際部署低比特LLMs鋪平了道路。

圖片

代碼:https://github.com/microsoft/T-MAC

論文:https://www.arxiv.org/pdf/2407.00088

此外,當前大模型的部署普遍依賴于專用加速器,如NPU和GPU等,而T-MAC可以擺脫專用加速器的依賴,僅利用CPU部署LLMs,推理速度甚至能夠超過同一片上的專用加速器,使LLMs可以部署在各類包括PC、手機、樹莓派等邊緣端設備。T-MAC現已開源。

在CPU上高效部署低比特大語言模型

T-MAC的關鍵創新在于采用基于查找表(LUT)的計算范式,而非傳統的乘累加(MAC)計算范式。T-MAC 利用查找表直接支持低比特計算,從而消除了其他系統中必須的反量化(dequantization)操作,并且顯著減少了乘法和加法操作的數量。經過實驗,T-MAC展現出了卓越的性能:在配備了最新高通Snapdragon X Elite芯片組的Surface AI PC 上,3B BitNet-b1.58模型的生成速率可達每秒48個token,2bit 7B llama模型的生成速率可達每秒30個token,4bit 7B llama模型的生成速率可達每秒20個token。這甚至超越了NPU的性能!當部署llama-2-7b-4bit模型時,盡管使用NPU可以生成每秒10.4個token,但CPU在T-MAC的助力下,僅使用兩核便能達到每秒12.6個token,最高甚至可以飆升至每秒22個token。這些都遠超人類的平均閱讀速度,相比于原始的llama.cpp框架提升了4至5倍。

即使在較低端的設備如Raspberry Pi 5上,T-MAC針對3B BitNet-b1.58也能達到每秒11個token的生成速率。T-MAC也具有顯著的功耗優勢:達到相同的生成速率,T-MAC所需的核心數僅為原始llama.cpp的1/4至1/6,降低能耗的同時也為其它應用留下計算資源。

值得注意的是,T-MAC的計算性能會隨著比特數的降低而線性提高,這一現象在基于反量化去實現的GPU和NPU中是難以觀察到的。但T-MAC能夠在2比特下實現單核每秒10個token,四核每秒28個token,大大超越了NPU的性能。

圖片圖1 BitNet on T-MAC vs llama.cpp on Apple M2

圖片

圖2 在不同端側設備CPU(Surface Laptop 7, NVIDIA AGX Orin, Apple M2-Ultra)的各核數下T-MAC和llama.cpp的token生成速度可達llama.cpp的4-5倍。達到相同的生成速率,T-MAC所需的核心數僅為原始llama.cpp的1/4至1/6

矩陣乘不需乘,只需查表 (LUT)

對于低比特參數 (weights),T-MAC將每一個比特單獨進行分組(例如,一組4個比特),這些比特與激活向量相乘,預先計算所有可能的部分和,然后使用LUT進行存儲。

之后,T-MAC采用移位和累加操作來支持從1到4的可擴展位數。通過這種方法,T-MAC拋棄了CPU上效率不高的FMA(乘加)指令,轉而使用功耗更低效率也更高的TBL/PSHUF(查表)指令。

圖片

圖3 混合精度GEMV基于現有反量化的實現范式vs T-MAC基于查找表的新范式

以比特為核心的計算,取代以數據類型為核心的計算

傳統的基于反量化的計算,實際上是以數據類型為核心的計算,這種方式需要對每一種不同的數據類型單獨定制。

每種激活和權重的位寬組合,如W4A16(權重int4激活float16) 和W2A8,都需要特定的權重布局和計算內核。

舉個例子,W3的布局需要將2位和另外1位分開打包,并利用不同的交錯或混洗方法進行內存對齊或快速解碼。然后,相應的計算內核需要將這種特定布局解包到硬件支持的數據類型進行執行。

而T-MAC通過從比特的視角觀察低比特矩陣乘計算,只需為單獨的一個比特設計最優的數據結構,然后通過堆疊的方式擴展到更高的2/3/4比特。

同時,對于不同精度的激活向量(float16/float32/int8),僅有構建表的過程需要發生變化,在查表的時候不再需要考慮不同的數據結構。

圖4 以比特為核心的查表計算混合精度GEMV

同時,傳統基于反量化的方法,從4-比特降低到3/2/1-比特時,盡管內存占用更少,但是計算量并未減小,而且由于反量化的開銷不減反增,性能反而可能會更差。

但T-MAC的計算量隨著比特數降低能夠線性減少,從而在更低比特帶來更好加速,為最新的工作BitNet,EfficientQAT等發布的1-比特/2-比特模型提供了高效率的部署方案。

圖5 使用不同端側設備CPU的單核,T-MAC在4到1比特的混合精度GEMV算子相較llama.cpp加速3-11倍。T-MAC的GEMM耗時能隨著比特數減少線性減少,而基于反量化的llama.cpp無法做到(1比特llama.cpp的算子性能由其2比特實現推算得到)

高度優化的算子實現

基于比特為核心的計算具有許多優勢,但將其實現在CPU上仍具有不小的挑戰:

(1)與激活和權重的連續數據訪問相比,表的訪問是隨機的。表在快速片上內存中的駐留對于最終的推理性能尤為重要;

(2)然而,片上內存是有限的,查找表(LUT)方法相比傳統的mpGEMV增大了片上內存的使用。這是因為查找表需要保存激活向量與所有可能的位模式相乘的結果。這比激活本身要多得多。

圖6 T-MAC與llama.cpp在計算數據流上的不同

為此,微軟亞洲研究院的研究員們深入探究了基于查表的計算數據流,為這種計算范式設計了高效的數據結構和計算流程,其中包括:

1. 將LUT存入片上內存,以利用CPU上的查表向量指令(TBL/PSHUF)提升隨機訪存性能。

2. 改變矩陣axis計算順序,以盡可能提升放入片上內存的有限LUT的數據重用率。

3. 為查表單獨設計最優矩陣分塊(Tiling)方式,結合autotvm搜索最優分塊參數

4. 參數weights的布局優化

a)weights重排,以盡可能連續訪問并提升緩存命中率

b)weights交錯,以提升解碼效率

5. 對Intel/ARM CPU 做針對性優化,包括

a)寄存器重排以快速建立查找表

b)通過取平均數指令做快速8-比特累加

研究員們在一個基礎實現上,一步步應用各種優化,最終相對于SOTA低比特算子獲得顯著加速:

圖7:在實現各種優化后,T-MAC 4-比特算子最終相對于llama.cpp 獲得顯著加速

責任編輯:張燕妮 來源: 新智元
相關推薦

2023-07-10 13:46:58

PythonLlama.cppLLM

2025-01-20 07:58:51

2019-09-17 14:16:57

工具代碼開發

2023-08-17 16:07:16

模型優化

2023-07-26 00:34:45

JavaOracle模式

2025-04-29 07:47:27

2022-04-26 15:24:03

開源框架

2023-06-30 09:00:00

Falcon LLM開源

2012-10-30 14:08:59

Titan超級計算機NVIDIA

2025-03-07 10:02:10

2023-09-27 23:21:34

2025-05-21 13:52:39

LLM模型

2024-12-13 14:03:44

模型訓練AI

2024-03-28 12:53:00

AI數據

2020-07-08 11:35:59

云計算5G技術

2021-01-13 15:16:45

谷歌架構開發者

2024-12-17 12:30:00

2012-08-06 13:28:25

Wi-Fi

2025-10-11 04:00:00

2024-09-18 09:40:00

大模型LLMAI
點贊
收藏

51CTO技術棧公眾號

亚洲女人天堂av| 欧美日韩国产中文字幕| 亚洲一区二区三区视频| 国产亚洲欧美久久久久| 亚洲免费毛片| 欧美在线一二三四区| 在线视频不卡国产| 日本高清视频www| 日韩中文字幕麻豆| 久久久www成人免费精品| 亚洲欧美日韩偷拍| 999国产精品亚洲77777| 一区二区三区在线高清| 久久综合久久久| 国产情侣激情自拍| 三级一区在线视频先锋| 精品中文字幕在线观看| 受虐m奴xxx在线观看| 久久久久久爱| 欧美影视一区二区三区| 91九色丨porny丨国产jk| 国产人成在线视频| 成人福利视频在线看| 国产日韩在线视频| 亚洲国产成人无码av在线| 欧美精品麻豆| 色偷偷噜噜噜亚洲男人的天堂 | 喷水一区二区三区| 97久久久久久| 久久久久成人精品无码| 色爱综合网欧美| 亚洲视频欧美视频| 一区二区三区少妇| jizz18欧美18| 宅男噜噜噜66一区二区66| 韩国日本在线视频| 白浆视频在线观看| 一区二区国产视频| 欧洲美女和动交zoz0z| jizz在线免费观看| 久久久精品欧美丰满| 国产美女精品久久久| 国产日韩一级片| 久久草av在线| 国产中文字幕日韩| 中文字幕乱码人妻二区三区| 久久一区视频| 69视频在线播放| 日本一区二区免费在线观看| 精品电影一区| 久久国产色av| 国产suv一区二区三区| 99视频精品全国免费| 日日骚久久av| 超碰人人干人人| 国产欧美日韩在线观看视频| 亚洲欧美日韩精品久久| 精品成人av一区二区三区| 午夜精品福利影院| 亚洲欧美日韩中文在线| 97人妻精品一区二区免费| 粉嫩的18在线观看极品精品| 精品国内片67194| 性农村xxxxx小树林| 国产欧美自拍一区| 日韩精品在线免费| 微拍福利一区二区| 成人在线免费小视频| 爽爽爽爽爽爽爽成人免费观看| 国产精品视频一区二区在线观看| 亚洲国产精品久久久天堂| 九九热精品视频| 国产无遮挡又黄又爽| 国产日韩欧美三区| 日韩美女福利视频| 一级黄色片在线看| 成人综合在线网站| 女同一区二区| 在线播放毛片| 亚洲综合免费观看高清完整版 | 久久99精品久久久久久水蜜桃| 亚州av在线播放| 亚洲国产精品成人综合| 特级黄色录像片| 99riav视频在线观看| 91电影在线观看| 欧美日韩久久婷婷| 久久香蕉精品香蕉| 在线成人一区二区| 久久久久久久久艹| 久久精品综合| 91国产在线播放| 蝌蚪视频在线播放| 亚洲人精品午夜| 日韩精品一区二区三区久久| 黄色成人小视频| 日韩欧美的一区二区| 中文字幕在线看高清电影| 911精品美国片911久久久| 69av成年福利视频| 国产三级视频在线播放| 91麻豆.com| 人妻激情另类乱人伦人妻| 92国产精品| 欧美大片一区二区三区| 娇妻被老王脔到高潮失禁视频| 欧美另类亚洲| 国产精品久久久久av免费| 亚洲第一成年人网站| 国产片一区二区| 青青青青草视频| 成年永久一区二区三区免费视频| 亚洲精品福利免费在线观看| 99热这里只有精品4| 亚洲欧美成人综合| av日韩中文字幕| 国产天堂在线| 欧美日韩精品在线播放| 欧美熟妇另类久久久久久多毛| 国产成人ay| 国内精品久久久久久中文字幕| 亚洲天堂aaa| 91免费看视频| 日韩视频在线视频| 麻豆精品久久| 日韩中文综合网| 亚洲 日本 欧美 中文幕| av资源站一区| 免费高清一区二区三区| 99久久这里有精品| 色婷婷久久一区二区| 黄色污污网站在线观看| 97精品国产露脸对白| 欧美狂野激情性xxxx在线观| 成人黄色91| 日韩在线观看免费高清| 国语对白做受69按摩| 久久女同互慰一区二区三区| 国产va亚洲va在线va| 亚洲一区二区三区免费| 久久夜色精品亚洲噜噜国产mv| 中文字幕一区二区免费| 国产欧美一二三区| 无码日韩人妻精品久久蜜桃| 久久91麻豆精品一区| 啪一啪鲁一鲁2019在线视频| 婷婷五月综合久久中文字幕| 亚洲成av人**亚洲成av**| 91成人在线观看喷潮蘑菇| 欧美成人一品| 不卡日韩av| 9999在线视频| 亚洲精品在线视频| 99re国产在线| 国产精品美女www爽爽爽| 亚洲天堂2018av| 午夜av一区| 成人av蜜桃| 久草在线中文最新视频| 日韩经典一区二区三区| 黄色污污网站在线观看| 欧美激情一二三区| 日本中文字幕观看| 欧美精品国产| 久久日韩精品| 日本少妇一区| 久久精品电影一区二区| a级片在线免费看| 亚洲一二三专区| 中文字幕在线观看网址| 日韩黄色片在线观看| 一区二区三区在线观看www| 国产高清精品二区| 久久久噜噜噜久久| 黄色的视频在线免费观看| 欧美日本一区二区三区| 国产精选第一页| 久久久国产精品午夜一区ai换脸| 污污动漫在线观看| 欧美精品一卡| 欧美日韩天天操| 成人短视频软件网站大全app| 久久久久久久久久久成人| 午夜国产在线视频| 欧美色电影在线| 久久99久久98精品免观看软件| 99精品国产热久久91蜜凸| 免费看污污网站| 国产精品videosex极品| 欧美一区二区三区四区在线观看地址 | www.成人黄色| 日韩视频不卡| 亚洲综合激情五月| 久久午夜影院| 91精品在线观看视频| 欧美男男激情videos| 中文字幕国产精品久久| 亚洲精品成av人片天堂无码| 色av综合在线| 日产欧产va高清| 亚洲欧美一区二区三区久本道91 | www.五月婷| 色菇凉天天综合网| 国产一级一片免费播放| 国产精品另类一区| 国产高清自拍视频| 国产高清久久久| 色哟哟精品视频| 99av国产精品欲麻豆| 影音先锋男人的网站| 精品国产a一区二区三区v免费| www久久99| 成人在线精品| 国产精品久久久久久久av电影 | 男人天堂亚洲二区| 精品国产网站在线观看| 一级片一区二区三区| 欧美天天综合色影久久精品| 九九九在线视频| √…a在线天堂一区| 免费人成又黄又爽又色| 99精品欧美一区二区三区综合在线| 五月天六月丁香| 久久99精品国产91久久来源| 亚洲成人性视频| 欧美做受高潮6| 成人午夜视频福利| 国产精品探花在线播放| 日韩激情在线观看| 无码人妻丰满熟妇区毛片18| 亚洲视频综合| 欧美 亚洲 视频| 国产精品久久久久久麻豆一区软件| 欧美视频1区| 色狼人综合干| 就去色蜜桃综合| 欧美巨大xxxx| 国产自产在线视频一区| y111111国产精品久久久| 亚洲一区中文字幕在线观看| 欧美性生活一级| 国产精品99久久久久久久久| 超级碰碰久久| 热久久这里只有精品| 免费一二一二在线视频| 国语自产精品视频在线看抢先版图片| 青春草在线视频| 欧美激情精品久久久久久| 91麻豆国产福利在线观看宅福利| 免费av一区二区| 欧美人与禽猛交乱配| 欧美黑人极品猛少妇色xxxxx| 2024最新电影在线免费观看| 欧美大成色www永久网站婷| wwwav在线| 欧美激情视频免费观看| heyzo高清中文字幕在线| 国内精品免费午夜毛片| 蜜桃麻豆影像在线观看| 欧美整片在线观看| 日韩和的一区二在线| 国产美女久久精品| 精品国产一区二区三区2021| av电影成人| 天堂成人娱乐在线视频免费播放网站 | 日韩av片在线播放| 色激情天天射综合网| 一本色道久久综合精品婷婷| 日韩一卡二卡三卡国产欧美| 三级小视频在线观看| 亚洲精品一二区| 日本视频不卡| 欧美精品videos性欧美| 涩涩涩视频在线观看| 国产精品va在线| 欧美片网站免费| 韩日午夜在线资源一区二区| 国内精品久久久久久久影视简单| 伊人情人网综合| 亚洲激情视频| 污污网站免费看| 成人久久18免费网站麻豆| 成都免费高清电影| 亚洲色图清纯唯美| 国产精品老女人| 欧美群妇大交群的观看方式| 六月婷婷中文字幕| 在线观看欧美日韩国产| 91在线中文| 国产91在线高潮白浆在线观看| 欧洲大片精品免费永久看nba| 精品国产一区二区三区麻豆小说 | 欧美大片va欧美在线播放| 激情国产在线| 成人免费视频a| 私拍精品福利视频在线一区| 一区二区精品在线| 国产日韩欧美在线播放不卡| 中文字幕第22页| 久久久久久久一区| 久久老司机精品视频| 欧洲av在线精品| 少妇人妻一区二区| 久久精品国产精品亚洲| 成人国产二区| 成人在线资源网址| 日本不卡二三区| 男人天堂1024| 国产成人aaa| 国产91在线播放九色| 日韩欧美精品网址| 亚洲av永久无码国产精品久久| 中文字幕最新精品| 亚洲国产欧美日本视频| 成人在线免费网站| 91精品国产调教在线观看| 国产成人综合一区| 97精品久久久久中文字幕| 久久久久亚洲av成人片| 欧美精品三级日韩久久| 国产一级在线观看| 68精品久久久久久欧美| 成人激情自拍| 乱熟女高潮一区二区在线| 久草中文综合在线| 亚洲精品国产精品国自| 色就色 综合激情| 欧美女v视频| 欧美亚洲国产精品| 欧美1区2区3区4区| 黄页网站在线观看视频| 国产成人一区二区精品非洲| 亚洲天堂网av在线| 欧美精品第1页| 欧美成人hd| 91精品国产综合久久香蕉最新版| 不卡在线一区| 九热视频在线观看| 国产蜜臀av在线一区二区三区| 欧美 日韩 精品| 精品亚洲男同gayvideo网站| 韩国成人二区| 蜜桃麻豆91| 久久亚洲色图| 欧美人妻一区二区三区| 欧美自拍偷拍一区| 91xxx在线观看| 国产精品永久免费| 天堂中文字幕在线| 大胆欧美人体视频| 国产精品久久久久久av公交车| 亚洲欧美日韩精品久久久 | 欧美日韩裸体免费视频| 欧美自拍偷拍第一页| 久久久久久一区二区三区| 一区二区三区在线免费看| 超碰10000| 成人av网址在线| 欧美h在线观看| 中日韩午夜理伦电影免费 | 久久大胆人体| 国内精品二区| 久久精品一本| 天堂а√在线中文在线鲁大师| 欧美一区二区在线视频| 亚洲图区一区| 久久国产手机看片| 日韩精品每日更新| 91视频青青草| 亚洲精品一区二区三区在线观看 | 精品人妻无码一区二区三区| 日韩欧美国产黄色| 在线观看免费网站黄| 亚洲一区免费网站| 亚洲一卡久久| 999精品久久久| 日韩精品中午字幕| 中老年在线免费视频| 亚洲高清视频一区| 国产麻豆成人传媒免费观看| 国产福利拍拍拍| 中文字幕亚洲无线码a| 香蕉成人app| 日本在线观看a| 亚洲人成网站色在线观看| 日本xxxxxwwwww| 国产欧美一区二区三区在线 | 一区在线播放视频| 国产成人自拍一区| 国产精品久久久av| 欧美三级视频| 色噜噜噜噜噜噜| 亚洲成人动漫在线播放| 97人人做人人爽香蕉精品| 国产自产在线视频| 国产精品对白交换视频 | 国产乱码在线观看| 国色天香2019中文字幕在线观看| 精品久久综合| 完美搭档在线观看|