精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

只激活3.8B參數,性能比肩同款7B模型!訓練微調都能用,來自微軟

人工智能 新聞
在極大規模下,稀疏激活模型有可能達到與密集模型相當的性能,為設計和訓練大規模稀疏激活模型提供了一個有用的參考。

只需激活60%的參數,就能實現與全激活稠密模型相當的性能。

微軟亞洲研究院的一項新研究,實現了模型的完全稀疏激活,讓推理成本大幅下降。

而且適用范圍廣泛,無論是從頭訓練、繼續訓練還是微調,都能提供有效支持。

圖片

該方法名為Q-Sparse在神經元級別上實現了模型稀疏化,相比于其他方式粒度更細,在相同推理開銷下,無論性能還是稀疏率都更好。

名稱之中,Q指的是量化(Quantization),意味著它除了普通模型之外,也兼容量化技術,適用于各種量化方式的模型。

作者進一步表示,如果把Q-Sparse與模型量化技術結合,還可以實現更大程度的降本增效。

另外在研究Q-Sparse的同時,團隊也對參數規模、稀疏率和模型性能三者之間的關系進行了深入探尋,并發現了適用于模型推理優化的“Scaling Law”

有網友認為,這項技術確實不錯,而且比ReLU要更好。

圖片

還有人開啟了許愿模式,表示如果(AMD的)ROCm能比英偉達更快支持這項技術就好了。

圖片

用Top-K函數實現稀疏化

Q-Sparse所做的最核心的操作,是對輸入的張量應用Top-K稀疏化函數

具體來說,Transformer架構在注意力層和前饋層中都使用nn.Linear線性層(矩陣乘法)進行投影,可以表示為Y=X·W^T。(其中X就是輸入張量,W代表其權重,Y為輸出張量)

Q-Sparse中,對于一個輸入激活張量X,首先會計算其絕對值|X|并進行排序,找出其中絕對值最大的K個元素

這里的K是預先設定的超參數,決定了稀疏化的程度。

之后Q-Sparse會創建一個與X形狀相同的二進制掩碼張量M,對于一系列|X|中絕對值最大的K個元素對應的位置,將M中的相應位置設置為1,其余位置設置為0。

接著,將輸入張量X與掩碼張量M進行Hadamard積(逐元素相乘)運算,就得到了稀疏化的張量X_sparse

在前向傳播過程中,稀疏化后的張量X_sparse將代替原始的輸入張量X參與后續的計算(如矩陣乘法)

由于X_sparse中大部分元素已經被設置為零,因此可以顯著減少計算量和內存帶寬需求。

圖片

在反向傳播過程中,Q-Sparse使用了直通估計器(Straight-Through Estimator,STE)來計算Top-K函數的梯度。

傳統的訓練方式中,通常需要計算損失函數對網絡參數的梯度,并使用梯度下降法更新參數以最小化損失。

但當網絡中存在量化、Top-K等一些不可微的操作時,梯度的計算就會遇到問題,因為這些操作的輸出對輸入的梯度在大多數點上都是0,導致梯度無法有效傳播。

STE通過直接將梯度傳遞給稀疏化之前的張量,避免了梯度消失的問題。

一般的反向傳播中,損失函數L對x的梯度?L/?x=?L/?y??y/?x,但由于不可微分無法直接計算。

STE的解決方案是只計算損失函數對稀疏化張量y的梯度,然后將其直接復制給原始張量x,也就是直接將?L/?y作為?L/?x的估計。

圖片

△有/無STE時的梯度比較

對于前饋層,Q-Sparse使用平方ReLU函數代替常規的ReLU激活函數,平方運算可以進一步提高激活的稀疏性(⊙表示Hadamard積)

圖片

另外,為了適配量化模型,Q-Sparse在應用Top-K稀疏化之前,會先對輸入張量進行量化,以確保稀疏化操作與量化表示兼容,其函數表示如下:

圖片

其中,ε是一個小常數,用于避免出現分母為零的情況。

特別的,對于1-bit量化的權重,Q-Sparse使用以下量化函數,其中α是權重張量W的平均絕對值。

圖片

60%激活參數達到相同效果

對比實驗表明,無論是稀疏率還是模型表現,Q-Sparse都顯著優于此前的ReLU方法。

圖片

針對Q-Sparse的具體效果,作者對其在從頭訓練、繼續訓練和微調三項任務上的性能進行了評估。

從頭訓練實驗使用的模型為Llama,結果在700M和7B模型上,使用70% top-K(即40%的整體稀疏率)的Q-Sparse可以達到與密集baseline相當的訓練損失。

圖片

繼續訓練的目的是將稠密模型稀疏化,這里的實驗對象是Mistral-7B。

結果,在激活參數為2.9B和3.8B的情況下,模型在ARC、MMLU等數據集中的得分均未發生明顯下降。

圖片

微調實驗中,對于Qwen-7B和Mistral-7B兩種模型,Q-Sparse顯示出了與繼續訓練相似的結果,用60%左右的激活參數實現了與密集模型十分接近的表現。

圖片

這些結果意味著,在相同的性能下,與密集模型相比,稀疏激活模型在推理過程中可以顯著減少激活參數,進而降低消耗FLOPS的數量。

對于量化模型,團隊在自研的BitNet b1.58模型上應用了Q-Sparse,并在多個數據集上進行了訓練和評估。

可以看到,在700M和7B兩種規模下,使用Q-Sparse的量化模型的收斂速度和最終損失函數值與未使用Q-Sparse的量化模型(BitNet b1.58)相當。

這說明Q-Sparse可以無縫集成到量化模型中,而不會顯著影響模型的訓練和收斂。

據此作者認為,將Q-Sparse與量化技術相結合,可以進一步提高大語言模型在推理階段的效率。

圖片

發現推理優化新“Scaling Law”

除了測評這些模型采取稀疏激活時的表現,作者也對模型性能、規模和稀疏率三者之間的關系進行了探究,并有了一些新的發現。

稀疏激活模型的性能縮放定律: 作者發現,與密集模型類似,稀疏激活模型的性能也遵循一個冪律縮放關系。

具體來說,給定稀疏率S,模型在收斂時的損失函數值L(N,S)可以用以下公式近似:

圖片

其中,N是模型參數的數量;E是一個常數,表示模型在無限大時的損失;A(S)是一個與稀疏率S有關的縮放因子。

這個縮放定律表明,稀疏激活模型的性能隨著模型規模的增大而提高,但提高的速度會逐漸變慢

圖片

同時作者發現,模型的性能也會受到稀疏率的影響。

在參數規模與性能之間關系的部分提到,A(S)是一個與稀疏率S有關的縮放因子,可以用以下公式近似:

圖片

其中B和C是常數,β是一個控制指數衰減速度的參數。

這個公式表明,當稀疏率S增大(模型變得更稀疏)時,意味著更高的稀疏率會導致性能的下降,下降的速度是指數級的。

圖片

基于上述發現,作者得出了一個推理最優的稀疏率S*,能在預算(推理時的浮點操作數)一定時,實現模型損失函數值的最小化。

對于全精度(FP32)模型,最優稀疏率約為45.58%;而低精度(如1.58-bit)模型的最優稀疏率則更高,約為61.25%。

圖片

作者觀察到,隨著模型規模的增大,稀疏激活模型與密集模型之間的性能差距逐漸縮小。

這可以從縮放定律中得到解釋:當模型規模N趨于無窮大時,稀疏激活模型的損失函數值趨于L(∞,S)=E,而密集模型的損失函數值趨于L(∞,0)=E。

這意味著,在極大規模下,稀疏激活模型有可能達到與密集模型相當的性能,為設計和訓練大規模稀疏激活模型提供了一個有用的參考。

論文地址:https://arxiv.org/abs/2407.10969

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-03-25 08:00:00

2024-05-07 09:33:03

模型手機

2024-06-03 10:43:34

2024-07-23 10:20:57

2025-02-27 13:45:00

2023-03-14 13:45:14

模型AI

2024-08-13 15:40:00

2025-03-10 07:00:00

阿里開源QwQ-32B

2024-03-18 07:01:42

2025-03-17 12:13:26

AI模型生成

2025-08-14 10:25:11

2025-10-28 15:40:01

AI模型訓練

2025-02-17 12:30:00

2025-07-21 09:07:00

模型訓練視頻

2023-12-17 13:07:11

訓練數據

2024-02-19 14:09:00

模型Eagle 7BRNN

2024-07-17 13:40:01

2023-10-13 19:58:33

Mistral7B模型

2024-02-04 08:00:00

Zephyr 7B大語言模型算法

2023-06-28 21:47:54

點贊
收藏

51CTO技術棧公眾號

一本到在线视频| 91丨九色丨蝌蚪| 手机av在线网站| 少妇被躁爽到高潮无码文| 成人交换视频| 亚洲主播在线观看| 欧美最大成人综合网| 国产精品无码一区| 黄色成人在线网址| 一区二区三区视频在线| 色欲无码人妻久久精品| 亚洲欧美se| 亚洲欧美日韩国产一区二区三区| 九九热久久66| 国产精品老熟女视频一区二区| 亚洲黄色影院| 久热精品视频在线观看| 野外性满足hd| 99久久香蕉| 欧美喷潮久久久xxxxx| 国产树林野战在线播放| 国产在线视频网站| 成人aaaa免费全部观看| 国产精品一区二区三区成人| 久久国产精品免费看| 国产精品久久久久久久久久10秀| 亚洲免费成人av电影| avtt中文字幕| 久久人人视频| 一本一道综合狠狠老| 激情小视频网站| 国产黄网站在线观看| 国产午夜亚洲精品羞羞网站| 国产伦精品一区二区三区照片 | 亚洲午夜视频在线| 在线观看成人一级片| 国产三级电影在线| 久久你懂得1024| 狠狠久久综合婷婷不卡| 国产按摩一区二区三区| 美腿丝袜亚洲综合| 国产精品日韩电影| 无码人妻aⅴ一区二区三区有奶水| 黄色av一区| 欧美高清在线播放| 成人在线观看小视频| 精品国产一区二区三区| 亚洲美女av网站| 亚洲成人av免费在线观看| 99精品中文字幕在线不卡| 91 com成人网| 欧美性受xxxxxx黑人xyx性爽| 91九色综合| 欧美少妇性性性| 性生交免费视频| 777午夜精品电影免费看| 色婷婷激情综合| 欧美成人xxxxx| 亚洲天堂av影院| 日韩人体视频一二区| 日韩av资源在线| 日本高清不卡一区二区三区视频| 日韩欧美在线第一页| 男女午夜激情视频| 色猫猫成人app| 欧美午夜电影在线播放| 亚洲天堂国产视频| av在线国产精品| 日韩视频永久免费| 污污免费在线观看| 欧美理论电影在线精品| 亚洲欧美国产va在线影院| 瑟瑟视频在线观看| 日韩.com| 欧美成人激情在线| 日韩大片免费在线观看| 国产一区91| 国产激情久久久久| 国产免费久久久| 国产激情一区二区三区桃花岛亚洲| 99在线视频播放| 午夜小视频在线播放| 久久精品欧美一区二区三区不卡| 日韩妆和欧美的一区二区| 中文字幕在线免费| 亚洲免费av高清| 久久国产精品网| 欧美成人精品三级网站| 6080亚洲精品一区二区| 无码国产69精品久久久久网站 | 色女人综合av| 中文字幕在线播放网址| 午夜精品福利一区二区蜜股av| 欧美v在线观看| 成人永久在线| 日韩精品极品在线观看播放免费视频 | 久草综合在线视频| 在线综合亚洲| 成人xxxx视频| 午夜在线观看视频18| 国产精品理论片| 日本午夜激情视频| 国产一区二区三区四区五区3d| 日韩欧美一卡二卡| 日本一级免费视频| 欧美激情视频一区二区三区免费| 欧美一级片在线播放| 日本50路肥熟bbw| 成人免费网站www网站高清| 欧美三级在线视频| 国产精品一级无码| 美女少妇全过程你懂的久久 | 亚洲精品国产精品国自产在线| 国产精品国产三级国产专业不| 678在线观看视频| 懂色aⅴ精品一区二区三区蜜月| 成人性生生活性生交12| 黄色毛片在线看| 26uuu亚洲综合色| 曰韩不卡视频| 中文在线资源天堂| 成人av在线观| 97视频在线观看免费高清完整版在线观看| 国产精品男女视频| 丁香啪啪综合成人亚洲小说 | 久久精品久久久久久久| 久久99深爱久久99精品| 色综合伊人色综合网| 91久热免费在线视频| 91久久在线视频| 男人操女人动态图| 亚洲第一影院| 国产精品日产欧美久久久久| 亚洲国产另类av| 9l视频白拍9色9l视频| 久久爱91午夜羞羞| 欧美午夜一区二区三区免费大片| theav精尽人亡av| 亚洲国产第一| 亚洲综合精品伊人久久| 免费在线观看av| 在线观看亚洲精品视频| 丰满少妇高潮一区二区| 国产精品久久久免费| 古典武侠综合av第一页| 日韩av毛片| 欧美一区二区三区思思人| 波兰性xxxxx极品hd| 免费在线一区观看| 日韩电影在线播放| 2019年精品视频自拍| 一区二区在线视频| 日本一区二区三区久久| 中文字幕精品一区二区精品绿巨人| 欧美一级黄色影院| 精品亚洲成人| 国产精品网站入口| 思思99re6国产在线播放| 欧美绝品在线观看成人午夜影视| 亚洲女人毛茸茸高潮| 精品在线你懂的| 一级特黄妇女高潮| caoporn成人| 91爱爱小视频k| 青青青草原在线| 色婷婷一区二区| 日韩精品免费电影| 国产一级片视频| 成人h精品动漫一区二区三区| 精品人妻人人做人人爽| 电影一区二区在线观看| 国模吧一区二区| 婷婷婷国产在线视频| 91国产丝袜在线播放| 18啪啪污污免费网站| 国产一区二区三区不卡在线观看| 9色视频在线观看| 久久久久97| 国产精品国产三级国产aⅴ浪潮| 日本中文字幕电影在线免费观看| 欧美一区永久视频免费观看| 国产亚洲欧美久久久久| 26uuu精品一区二区在线观看| 一级在线免费视频| 中文字幕一区二区三区欧美日韩| 国产欧美综合精品一区二区| 日本免费久久| 欧美插天视频在线播放| 天堂av中文字幕| 欧美又粗又大又爽| 欧美日韩亚洲国产另类| 91蜜桃在线观看| 五月天av在线播放| 最新国产乱人伦偷精品免费网站| 日韩av电影在线观看| 欧美一区一区| 啪一啪鲁一鲁2019在线视频| 欧美18一19xxx性| 日韩激情视频在线| 国产精品高潮呻吟久久久| 精品高清美女精品国产区| 91香蕉视频污在线观看| www.在线成人| 毛片毛片毛片毛| 国产精品亚洲欧美| 超碰在线免费观看97| 色婷婷精品视频| 91视频婷婷| 精品欧美一区二区三区在线观看| 欧美巨大黑人极品精男| 黄色av网站在线免费观看| 欧美精品一区二| 中文字幕日日夜夜| 色综合久久88色综合天天免费| 少妇久久久久久被弄高潮| 欧美激情中文字幕| 免费在线观看成年人视频| 国产成人av网站| 久久婷五月综合| 久久久国产亚洲精品| www.av91| 亚洲精品一二三区区别| 欧美一区二区三区四区在线观看地址| 136福利精品导航| 成人精品视频久久久久| 欧美三级精品| 2019亚洲日韩新视频| 人妖欧美1区| 蜜臀久久99精品久久久无需会员| 国产原创av在线| 亚洲毛片一区二区| 污污视频在线观看网站| 精品捆绑美女sm三区| 国产人妖在线播放| 69堂国产成人免费视频| 中文字幕免费在线看| 91国产福利在线| 国产高清中文字幕| 欧美日韩免费观看中文| 亚洲国产综合久久| 亚洲成av人综合在线观看| 妺妺窝人体色www婷婷| 曰韩精品一区二区| 永久久久久久久| 亚洲美女在线一区| 在线观看成人毛片| 一区二区视频在线| 免费中文字幕视频| 亚洲综合一二区| 国产第一页在线播放| 亚洲午夜免费福利视频| 国产午夜精品无码| 亚洲国产一区二区a毛片| 欧美一级高潮片| 亚洲va欧美va国产va天堂影院| 国产黄色片视频| 亚洲成人免费电影| www.国产com| 一本一道综合狠狠老| 丰满人妻一区二区三区四区| 欧美三级三级三级| 国产男女猛烈无遮挡| 日韩一区二区三区精品视频| 成人高潮片免费视频| 精品国产一区二区精华| 亚洲aⅴ在线观看| 亚洲人永久免费| 无遮挡动作视频在线观看免费入口| zzijzzij亚洲日本成熟少妇| www.欧美日本韩国| 久久久久久久久电影| 久久男人av资源站| 国产精品久久久久久久久久ktv | 亚洲第一av色| 国产精品久久久久久久久久精爆| 欧美在线视频不卡| 国产福利免费视频| 亚洲精品国产suv| 成人高清免费观看mv| www国产精品com| 色婷婷视频在线观看| 欧美亚洲视频在线看网址| 97精品国产99久久久久久免费| 成人一区二区电影| 久久97久久97精品免视看秋霞| 欧美国产二区| 91精品啪在线观看国产81旧版| 777777av| 激情综合五月婷婷| 老鸭窝一区二区| 亚洲色图另类专区| 天天综合网久久综合网| 欧美日韩久久久一区| 亚洲免费黄色片| 最近中文字幕2019免费| bl在线肉h视频大尺度| 国产男女猛烈无遮挡91| 久久婷婷国产| 亚洲最新免费视频| 亚洲自拍另类| 免费高清视频在线观看| 久久久噜噜噜久久人人看| 国产在线一卡二卡| 色爱区综合激月婷婷| 精品久久国产视频| 在线观看日韩专区| 136福利第一导航国产在线| 国产日韩精品入口| 亚洲国产精品嫩草影院久久av| 午夜探花在线观看| 天堂蜜桃91精品| 天天躁日日躁狠狠躁av麻豆男男| 国产精品乱码一区二三区小蝌蚪| 成人免费视频毛片| 日韩欧美一区二区视频| 一区二区高清不卡| 欧洲一区二区视频| 久久午夜影院| 久久手机在线视频| 精品制服美女丁香| 美女av免费看| 日韩欧美精品网址| 五月天激情开心网| 欧美极品xxxx| 精品三级国产| av不卡在线免费观看| 日韩av一区二区在线影视| 精品中文字幕在线播放| 亚洲成人免费av| 亚洲精品18在线观看| 裸体女人亚洲精品一区| 国产精品久久久久久吹潮| 色一情一乱一伦一区二区三区丨 | 国产精品毛片久久久久久| 国产精品久免费的黄网站| 亚洲激情自拍图| 成人观看网址| 国产麻豆乱码精品一区二区三区 | 搡女人真爽免费午夜网站| 91视频在线看| 在线观看免费国产视频| 欧美mv日韩mv亚洲| 免费毛片在线看片免费丝瓜视频| 99热99热| 激情亚洲成人| 中文字幕乱码一区| 欧美日韩另类在线| 欧美xxx.com| 国产999精品视频| 国产精品日韩精品中文字幕| av动漫免费看| 欧美激情一二三区| 最近中文字幕在线观看视频| 中文字幕视频在线免费欧美日韩综合在线看 | 久久久精品在线视频| 2020国产精品久久精品美国| 黄色片网站在线免费观看| 亚洲网站视频福利| 日本精品在线一区| 在线视频欧美一区| 国产乱码一区二区三区| 一级黄色录像视频| 亚洲成在人线av| 欧美成人影院| 亚洲一卡二卡| 丁香六月综合激情| 天天操天天操天天操天天| 国产亚洲一区二区在线| 欧美亚洲综合视频| www.99riav| 99久久99久久精品免费观看| 亚洲国产精品无码久久久| 中文字幕亚洲图片| 91久久偷偷做嫩草影院电| 男人添女人下面高潮视频| 久久久精品人体av艺术| 一卡二卡在线视频| 欧美激情一二三| 国产探花在线精品| 亚洲一二区在线观看| 婷婷夜色潮精品综合在线| 毛片在线播放网址| 91色琪琪电影亚洲精品久久| 亚洲天堂男人| 国产黄色大片免费看| 欧美一区二区私人影院日本| av在线最新| 亚洲日本欧美在线| 成人v精品蜜桃久久一区| 久久国产香蕉视频| 久久91精品国产| 国产一卡不卡| 一起草最新网址| 色综合激情久久| 91福利国产在线观看菠萝蜜| 欧美日韩精品久久久免费观看| 精品中文字幕一区二区小辣椒| 国产一级做a爱片久久毛片a| www.久久色.com| 亚洲资源网你懂的|