精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI架構(gòu)系列:picoLLM 大模型的量化魔術(shù)師 原創(chuàng)

發(fā)布于 2025-3-27 09:30
瀏覽
0收藏

Picovoice首席執(zhí)行官Alireza Kenarsari指出,“picoLLM是Picovoice 深度學(xué)習(xí)研究人員和量產(chǎn)工程師共同努力的成果。前者研究出X 位量化算法,而后者構(gòu)建了跨平臺(tái)的LLM 推理引擎。目的還是在于將LLM遍及到任何設(shè)備且將控制權(quán)交還給企業(yè)”。

picoLLM Inference可以免費(fèi)使用,沒(méi)有任何使用限制。無(wú)論是在概念驗(yàn)證上工作,還是為數(shù)百萬(wàn)用戶提供服務(wù)。只需幾行代碼即可部署。


注:其余的產(chǎn)品線有非商用免費(fèi)版,也有收費(fèi)版


1.認(rèn)識(shí)量化(Quantization)

大模型有個(gè)基本的指標(biāo)就是模型參數(shù)規(guī)模,客觀而言參數(shù)規(guī)模越大,效果越佳,但是所需的內(nèi)存越多。例如,要部署 7.7GB 大小的Mistral 7B,需要GPU的VRAM大小要超過(guò)8GB才能在GPU完全加載。因此意味著運(yùn)行更大規(guī)模的模型將需要具有更大規(guī)格的硬件,從而增加成本。

量化是一種壓縮技術(shù),將高精度值映射到低精度值。對(duì)于任意的大模型,這意味著它們的權(quán)重和激活精度會(huì)被調(diào)整,肯定會(huì)對(duì)影響模型的能力。在實(shí)際的運(yùn)用過(guò)程中發(fā)現(xiàn),某些情況下雖然明顯的減低精度,然而卻又能獲得和原來(lái)不相上下的結(jié)果。

量化通過(guò)降低內(nèi)存帶寬需求和提高緩存利用率來(lái)提高性能,不同精度級(jí)別的量化過(guò)程能夠更多的設(shè)備上運(yùn)行大模型。

LLMs通常使用全精度(float32)或半精度(float16)的浮點(diǎn)數(shù)進(jìn)行訓(xùn)練。一個(gè)float16有16位,即2個(gè)字節(jié)。因此在 FP16上訓(xùn)練參數(shù)規(guī)模為1B的大模型則至少需要2GB的內(nèi)存,這還不包括訓(xùn)練過(guò)程中的優(yōu)化器內(nèi)存、激活內(nèi)存和梯度內(nèi)存。

量化其實(shí)就是想找到一種方法,將FP32權(quán)重的值的范圍([最小值,最大值])表示為較低精度的值,例如FP16甚至INT4(整數(shù) 4 位)的數(shù)據(jù)類型。典型的情況是從FP32到INT8。

下圖為一個(gè)具體的例子,將FP16格式的數(shù)組量化為INT8的過(guò)程,當(dāng)然最后可以從INT8再次還原為FP16。這樣一來(lái)原來(lái)模型的存儲(chǔ)大小就被有效的降低了。

AI架構(gòu)系列:picoLLM 大模型的量化魔術(shù)師-AI.x社區(qū)

其實(shí)換個(gè)思路來(lái)講,就是將數(shù)軸進(jìn)行壓縮。這里的難題在于如何的量化才能降低存儲(chǔ)開(kāi)銷,但是又能表達(dá)出原來(lái)的意思。

AI架構(gòu)系列:picoLLM 大模型的量化魔術(shù)師-AI.x社區(qū)

目前有不少的量化思路,均勻量化是模型量化中常用的一種技術(shù),用于降低深度學(xué)習(xí)模型中權(quán)重和激活的精度。在量化過(guò)程中將值的范圍劃分為固定數(shù)量的等距區(qū)間,然后將每個(gè)值映射到最近區(qū)間的中心。此過(guò)程有助于減少表示每個(gè)值所需的位數(shù)。

與更復(fù)雜的量化技術(shù)相比,均勻量化的主要優(yōu)勢(shì)之一是其簡(jiǎn)單易用。然而,均勻量化可能并不總是能捕捉到數(shù)據(jù)分布的細(xì)微差別。想象一下原始參數(shù)的取值在[3.5,  3.9],若都被量化到4,的確會(huì)導(dǎo)致潛在的信息丟失和性能下降。

另一方面,非均勻量化允許量化步距不均勻分布,從而能更準(zhǔn)確和更靈活。量化過(guò)程由離散量化水平 (Xi) 和相應(yīng)的量化步驟 (?i) 定義。當(dāng)實(shí)數(shù)落在特定的量化步驟范圍 (?i, ?i+1) 內(nèi)時(shí),量化器將其分配到相應(yīng)的量化級(jí)別 (Xi)。非均勻量化方法(如對(duì)數(shù)分布)側(cè)重于以指數(shù)而不是線性方式調(diào)整量化步驟和水平,這可以通過(guò)有效捕獲重要值區(qū)域來(lái)提高準(zhǔn)確性。

AI架構(gòu)系列:picoLLM 大模型的量化魔術(shù)師-AI.x社區(qū)


左圖為對(duì)稱量化,右圖為非對(duì)稱量化

2.微調(diào)中的量化

AI架構(gòu)系列:picoLLM 大模型的量化魔術(shù)師-AI.x社區(qū)



左圖為QAT,右圖為PTQ,兩者的區(qū)別在于量化的位置。



PTQ是一種流行的技術(shù),模型參數(shù)(通常以FP32等高精度格式存儲(chǔ))被轉(zhuǎn)換為較低位精度的INT8。此轉(zhuǎn)換過(guò)程允許在計(jì)算資源有限的硬件(如移動(dòng)設(shè)備和嵌入式系統(tǒng))上更高效地部署模型。PTQ 可以應(yīng)用于神經(jīng)網(wǎng)絡(luò)的權(quán)重和激活,從而減小模型大小并提高推理速度,而不會(huì)顯著降低準(zhǔn)確性。

QAT具有在部署期間將應(yīng)用的量化效應(yīng)的意識(shí)。當(dāng)對(duì)訓(xùn)練模型進(jìn)行量化時(shí),可能會(huì)導(dǎo)致模型參數(shù)出現(xiàn)擾動(dòng),從而可能導(dǎo)致模型偏離訓(xùn)練期間以浮點(diǎn)精度實(shí)現(xiàn)的收斂點(diǎn)。

為了解決這個(gè)問(wèn)題,QAT使用量化參數(shù)重新訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型,使模型能夠收斂到損失減少的點(diǎn)。在QAT期間,在浮點(diǎn)對(duì)量化模型執(zhí)行正向和后向傳遞,而模型參數(shù)在每次梯度更新后進(jìn)行量化,類似于預(yù)測(cè)梯度下降。在浮點(diǎn)權(quán)重更新后執(zhí)行投影對(duì)于防止零梯度或高誤差梯度至關(guān)重要,尤其是在低精度場(chǎng)景中。

在QAT的反向傳播過(guò)程中,處理不可微分的量化算子是一個(gè)挑戰(zhàn)。一種常用方法是使用直通估計(jì)器 (STE) 通過(guò)將量化算子視為恒等函數(shù)來(lái)近似量化算子的梯度。

3.picoLLM

picoLLM Compression是Picovoice內(nèi)部開(kāi)發(fā)的一種新型大型語(yǔ)言模型量化算法。給定一個(gè)特定于任務(wù)的成本函數(shù),picoLLM Compression 會(huì)自動(dòng)學(xué)習(xí)跨權(quán)重和權(quán)重內(nèi)LLM的最佳位分配策略。而目前現(xiàn)有技術(shù)方案都是固定分配。

picoLLM提供了一個(gè)全面的開(kāi)源基準(zhǔn)測(cè)試結(jié)果,例如下圖,當(dāng)應(yīng)用于 Llama-3-8b ,picoLLM在2、3和 4位的量化設(shè)置下在MMLU的評(píng)測(cè)分?jǐn)?shù)中,將采用GPTQ算法的正確率下降消滅于無(wú)形之中。隨著量化位數(shù)的下降,幾乎保持堅(jiān)挺。

AI架構(gòu)系列:picoLLM 大模型的量化魔術(shù)師-AI.x社區(qū)

現(xiàn)有方法依賴于跨模型權(quán)重的固定位分配。但是,picoLLM 在量化過(guò)程中學(xué)習(xí)最優(yōu)分配。每個(gè)模型最理想的量化位數(shù)取決于自身的架構(gòu)和壓縮比。例如,下面的三張圖顯示了壓縮比為 3、5 和 7 時(shí) Llama-2-7b不同組件之間的位最佳分布:

AI架構(gòu)系列:picoLLM 大模型的量化魔術(shù)師-AI.x社區(qū)

在MMLU (5-shot)任務(wù)上采用picoLLM的效果對(duì)比。

AI架構(gòu)系列:picoLLM 大模型的量化魔術(shù)師-AI.x社區(qū)

PicoLLM 框架支持Gemma、Llama、Mistral、Mixtral和Phi系列模型,并在Windows、macOS 和Linux上跨平臺(tái)運(yùn)行(包括Raspberry Pi 4和 5 上的Raspberry Pi OS)以及 Android 和 iOS。下次將詳細(xì)地介紹內(nèi)在原理。

本文轉(zhuǎn)載自??魯班模錘??,作者:魯班模錘

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請(qǐng)注明出處,否則將追究法律責(zé)任
已于2025-3-27 09:31:25修改
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
视频一区在线观看| av毛片午夜不卡高**水| 麻豆国产一区二区| 欧美成人免费播放| 国产精品麻豆入口| 国产精品第一国产精品| 夜夜操天天操亚洲| 日产精品久久久一区二区| 国产美女明星三级做爰| 亚洲欧洲午夜| 久久精品国产69国产精品亚洲| 色哟哟网站在线观看| 国产极品久久久久久久久波多结野| 亚洲精品成人悠悠色影视| 国产精品视频免费一区| 一区二区日韩在线观看| av成人天堂| 久久久国产一区| 亚洲a v网站| 黑色丝袜福利片av久久| 欧美精品aⅴ在线视频| cao在线观看| 超碰在线caoporn| 国产日韩欧美不卡在线| 含羞草久久爱69一区| 国产女人18毛片水18精| 日本不卡视频一二三区| 欧洲一区二区视频| 久久香蕉精品视频| 久久久久久久久丰满| 在线a欧美视频| 亚洲激情视频小说| 欧美一区自拍| 亚洲国产日韩欧美在线图片| 天堂在线精品视频| 欧美爱爱视频| 欧美日韩亚洲综合| www.激情小说.com| 国产日韩另类视频一区| 色综合咪咪久久| 女性女同性aⅴ免费观女性恋| 四虎亚洲成人| 亚洲天堂中文字幕| 在线免费观看成人网| 国产视频福利在线| 久久久精品黄色| 免费看污久久久| 你懂的在线观看视频网站| av综合在线播放| 国产精品免费视频一区二区| 亚洲xxx在线| 成人夜色视频网站在线观看| 99国精产品一二二线| 国产精品嫩草影院桃色| 国产又黄又大久久| 亚洲自拍在线观看| 国产黄色片av| 成人综合激情网| 国产青春久久久国产毛片| 亚洲爱爱综合网| 成人av资源网站| 久久精品aaaaaa毛片| 日本中文字幕电影在线观看| 99久久久久久| 欧美日韩精品免费看| 国产精品一二三区视频| 国产精品天美传媒| 麻豆md0077饥渴少妇| 污的网站在线观看| 午夜成人免费视频| 欧美三级午夜理伦三级| 亚洲精品一区三区三区在线观看| 欧美日韩国产精品自在自线| 欧美丝袜在线观看| 中文字幕一区二区三区日韩精品| 亚洲第一网站免费视频| 一区二区视频观看| 经典一区二区| 久久久精品一区二区| 久操视频免费在线观看| 国产一区二区高清| 国产精品青草久久久久福利99| 国产又粗又大又黄| 成人免费三级在线| 日韩视频在线播放| а√天堂资源地址在线下载| 亚洲高清视频在线| 国产精品天天av精麻传媒| www.久久爱.com| 亚洲精品www久久久| 国产真人做爰视频免费| 欧美粗暴jizz性欧美20| 欧美在线视频网| 国产精品亚洲lv粉色| fc2成人免费人成在线观看播放| 欧美久久在线| 亚洲奶水xxxx哺乳期| 日韩欧美中文免费| 四虎1515hh.com| 综合色就爱涩涩涩综合婷婷| 久久中文字幕视频| 亚洲天堂男人av| 国产另类ts人妖一区二区| 久久久精品动漫| 超碰在线最新| 在线观看一区二区视频| 善良的小姨在线| 国产日产一区| 亚州国产精品久久久| 亚洲图片中文字幕| 91免费视频观看| 大地资源网在线观看免费官网| 中文字幕这里只有精品| 欧美一区二区三区视频在线| 亚洲自拍偷拍图| 亚洲第一网站| 91免费观看| 永久免费av在线| 欧美日韩中文字幕在线| 亚洲丝袜在线观看| 日韩在线观看电影完整版高清免费悬疑悬疑| 久久久久亚洲精品| 国产福利第一视频| 国产精品毛片大码女人| 免费午夜视频在线观看| 超碰成人福利| 欧美多人乱p欧美4p久久| 亚洲在线精品视频| 久久精品视频一区二区| 成年女人18级毛片毛片免费| 国产欧美视频在线| www.亚洲男人天堂| av手机天堂网| 国产色91在线| 国产一区亚洲二区三区| 日韩av系列| 久久久女人电视剧免费播放下载| 99精品视频在线播放免费| 亚洲欧洲av另类| 国产成人美女视频| 日韩在线第七页| 国产主播在线一区| 日本综合在线| 91精品国产综合久久久久久久久久| 一级片黄色录像| 久久国产精品99久久久久久老狼 | 全黄性性激高免费视频| 精品国产亚洲一区二区三区在线 | a v视频在线观看| 成人avav在线| 99爱视频在线| 国产不卡一二三区| 国产精品国产三级国产专播精品人| 免费在线稳定资源站| 日韩欧美国产高清91| 国产小视频自拍| 免费观看在线综合| 桥本有菜av在线| 亚洲国产一区二区三区网站| 免费av在线一区| 成人久久精品人妻一区二区三区| 亚洲网友自拍偷拍| 亚洲精品女人久久久| 亚洲神马久久| 色99中文字幕| av在线成人| 久久久久久中文字幕| 香蕉视频免费看| 91福利在线免费观看| 很污很黄的网站| 国产精品一区二区果冻传媒| 日本熟妇人妻xxxx| 自拍自偷一区二区三区| 国产日韩欧美在线| 性欧美ⅴideo另类hd| 精品av综合导航| 在线观看 亚洲| 亚洲欧洲av另类| 中文字幕免费在线播放| 久久精品盗摄| 视频一区二区视频| 欧美精品密入口播放| 国产精品国产三级国产专播精品人| h视频在线免费| 欧美成人综合网站| 尤物视频免费观看| 亚洲黄色性网站| 爱爱免费小视频| 国产一区二区三区四| 欧美 日韩 激情| 四虎成人av| 美乳视频一区二区| 国产高清视频一区二区| 欧美一区在线直播| 日本h片在线| 亚洲人成在线免费观看| 国产sm主人调教女m视频| 欧美日韩亚洲91| 青青草手机视频在线观看| 久久久无码精品亚洲日韩按摩| 少妇网站在线观看| 一区二区三区导航| 日韩不卡一二区| 欧美亚洲国产一区| 国产日韩一区二区三区| 欧美一区=区三区| 欧美影院在线播放| 激情av在线| 日韩在线播放视频| 久久电影视频| 亚洲成人中文字幕| 国产精品自拍电影| 欧美视频一区在线观看| 日韩 欧美 综合| 亚洲黄色小说网站| 黄色录像一级片| 亚洲国产经典视频| 午夜理伦三级做爰电影| 成人午夜视频免费看| 污污的网站免费| 日韩精品欧美成人高清一区二区| 每日在线观看av| 午夜国产精品视频免费体验区| 杨幂一区欧美专区| 自拍亚洲一区| 欧美大陆一区二区| 成人性生交大片免费看视频直播 | 黄色小说在线播放| 久热爱精品视频线路一| 中文字幕在线观看日本| 亚洲视频999| 番号集在线观看| 亚洲欧洲自拍偷拍| 麻豆影视在线| 精品视频偷偷看在线观看| 三级在线观看网站| 亚洲第一av网| 人妻精品一区一区三区蜜桃91| 欧美一区二区三区免费观看视频| 一区二区www| 欧美日韩夫妻久久| 亚洲熟妇av乱码在线观看| 欧美日韩在线不卡| 一二区在线观看| 欧美日韩一卡二卡三卡| 亚洲精品国产精品乱码视色| 欧美亚洲一区二区在线| 91视频久久久| 欧美日韩三级视频| 国产精品久久久久久免费播放| 在线不卡的av| 国产激情久久久久久熟女老人av| 欧美一区二区成人| 刘玥91精选国产在线观看| 亚洲第一av网站| 日本国产在线| 亚洲系列中文字幕| 日日夜夜精品一区| 欧美成在线视频| xxxx成人| 日韩美女在线观看一区| 日韩一区二区三区免费视频| 国产欧美欧洲在线观看| 国产一区2区在线观看| 俄罗斯精品一区二区| 日韩欧美ww| 日日骚一区二区网站| 综合久久亚洲| 欧美 日本 亚洲| 麻豆视频一区二区| 在线免费黄色小视频| 99麻豆久久久国产精品免费 | 欧美一级性视频| 亚洲乱码一区二区| 日本成人网址| 国精产品一区一区三区有限在线| 中文在线а√在线8| 国产欧美一区二区三区视频| 亚洲精品一二三**| 欧美日韩免费高清| 中文字幕免费一区二区三区| 男人添女人下部高潮视频在观看| 亚洲在线成人| 亚洲网中文字幕| 91一区二区三区在线观看| 日本高清黄色片| 亚洲一区二区精品视频| 天天综合久久综合| 欧美成人精品高清在线播放| 天堂中文在线资| 久久这里有精品视频| 咪咪网在线视频| 91免费在线视频网站| 天天躁日日躁狠狠躁欧美巨大小说 | 中文字幕自拍偷拍| 精品国产一区二区三区久久久蜜月 | 在线观看精品自拍私拍| 国产福利在线免费观看| 国产精品一区二区久久国产| 欧美成人一区在线观看| 一区二区三区四区| 亚洲欧美日韩在线观看a三区 | 成人国产亚洲欧美成人综合网| 日韩视频在线观看免费视频| 亚洲午夜私人影院| 亚洲一二区视频| 国产丝袜精品第一页| 深夜国产在线播放| 国产精品永久免费视频| 亚洲第一二三区| 日韩精品一区在线视频| 狠狠v欧美v日韩v亚洲ⅴ| 中文字字幕码一二三区| 亚洲国产一区二区三区青草影视| 一区二区日韩视频| 在线成人激情黄色| 欧美中文字幕精在线不卡| 翡翠波斯猫1977年美国| 国产精品99久久| 妓院一钑片免看黄大片| 久久伊人蜜桃av一区二区| 国产亚洲欧美精品久久久久久| 欧美精品电影在线播放| 国产粉嫩一区二区三区在线观看| 91黑丝在线观看| 成人动态视频| 男女啪啪免费观看| 国产一区二区久久| 欧美性x x x| 欧美人与性动xxxx| 99riav在线| 国产精品欧美日韩久久| 精品视频免费在线观看| 婷婷无套内射影院| 成年人网站91| 国产成人免费观看视频| 亚洲国模精品一区| 国产激情在线播放| 久久精品美女| 免费久久99精品国产自在现线| 亚洲欧美在线不卡| 狠狠操狠狠色综合网| 五月婷在线视频| 91精品国产色综合久久不卡98口| 丁香婷婷成人| 黄页免费在线观看视频| 99热99精品| 无码一区二区三区在线观看| 亚洲嫩模很污视频| avav成人| 人人妻人人澡人人爽精品欧美一区| 国产在线视频一区二区三区| www欧美com| 精品精品国产高清a毛片牛牛| 啪啪免费视频一区| 国产乱码精品一区二区三区不卡| 在线精品观看| ass精品国模裸体欣赏pics| 91久久线看在观草草青青| av影片免费在线观看| 亚洲va久久久噜噜噜久久天堂| 欧美激情视频一区二区三区在线播放 | 日韩电影中文字幕一区| 欧美电影h版| 亚洲在线色站| 大陆成人av片| 无码人妻一区二区三区免费| 日韩综合中文字幕| 日韩成人在线观看视频| 免费av观看网址| 日本一区二区三区高清不卡| 91久久国语露脸精品国产高跟| 色综合视频网站| 精品久久久久久久久久久下田| 五月婷婷之婷婷| 午夜精品久久久久久久| 久久精品色图| 444亚洲人体| 免费亚洲网站| 国产免费久久久久| 亚洲成年人在线| 成人黄色毛片| 18禁网站免费无遮挡无码中文| 国产日产欧美精品一区二区三区| 国产美女主播在线观看| 国模精品系列视频| 日韩一区二区在线| 色哟哟视频在线| 欧美日韩在线免费视频| 牛牛电影国产一区二区| 日韩av不卡播放| 国产不卡在线播放| 免费在线观看av的网站| 欧美高清videos高潮hd| av一区二区在线播放| 欧美午夜精品一区二区| 欧美日韩小视频| 校园春色亚洲| 欧美一区二区三区综合| 国产目拍亚洲精品99久久精品|