精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

LLM省錢大測評!48塊GH200,首個百億級參數(shù)量實(shí)證

人工智能 新聞
EfficientLLM項(xiàng)目聚焦LLM效率,提出三軸分類法和六大指標(biāo),實(shí)驗(yàn)包攬全架構(gòu)、多模態(tài)、微調(diào)技術(shù),可為研究人員提供效率與性能平衡的參考。

近年來,大型語言模型(LLM)如GPT系列取得了革命性進(jìn)展,在自然語言處理、內(nèi)容創(chuàng)作、多語言翻譯乃至科學(xué)研究等眾多領(lǐng)域展現(xiàn)出驚人能力。

然而,模型參數(shù)量(如DeepseekR1的671B參數(shù))和上下文窗口的急劇膨脹,帶來了巨大的計(jì)算力(GPT-3訓(xùn)練約需3640Petaflop/s-days)、能源消耗和資金投入(GPT-3訓(xùn)練成本估計(jì)超460萬美元)。

高昂的成本已成為制約LLM進(jìn)一步發(fā)展和廣泛應(yīng)用的關(guān)鍵瓶頸。

EfficientLLM項(xiàng)目應(yīng)「效率測評」需求而生,也是首個針對LLM效率技術(shù)進(jìn)行端到端、百億級參數(shù)規(guī)模的系統(tǒng)性實(shí)證研究。

圖片

項(xiàng)目詳情:https://dlyuangod.github.io/EfficientLLM/

模型庫:https://huggingface.co/Tyrannosaurus/EfficientLLM

研究人員在配備了48塊GH200和8塊H200 GPU的生產(chǎn)級集群上執(zhí)行效率測評,確保了對真實(shí)世界中LLM性能與能耗權(quán)衡的精確測量。

EfficientLLM的核心目標(biāo)是為學(xué)術(shù)界和工業(yè)界的研發(fā)人員提供一個清晰、數(shù)據(jù)驅(qū)動的導(dǎo)航圖,幫助研究人員在下一代基礎(chǔ)模型的「效率-性能」復(fù)雜地貌中找到最佳路徑。

圖片

EfficientLLM的三維評測框架與核心指標(biāo)

研究人員創(chuàng)新性地提出了一個統(tǒng)一的三軸分類法來系統(tǒng)評估LLM效率,覆蓋模型生命周期的關(guān)鍵階段:

架構(gòu)預(yù)訓(xùn)練(Architecture Pretraining)

此部分專注于為模型設(shè)計(jì)者和研究者在構(gòu)建新型LLM架構(gòu)時,提供關(guān)于計(jì)算資源和能源成本預(yù)算的精確分析,并深入評估了多種高效注意力機(jī)制變體(如多查詢注意力MQA、分組查詢注意力GQA、多頭潛在注意力MLA、原生稀疏注意力NSA)以及稀疏混合專家模型(MoE)的效率表現(xiàn)。

微調(diào)(Fine-tuning)

針對需要將預(yù)訓(xùn)練基礎(chǔ)模型適配到特定下游任務(wù)或?qū)I(yè)領(lǐng)域的實(shí)踐者,研究人員提供了參數(shù)高效微調(diào)(PEFT)方法的效率基準(zhǔn)。評估涵蓋了LoRA、RSLORA、DoRA等主流PEFT技術(shù)。

位寬量化(Bit-width Quantization)

面向模型部署工程師,研究人員評估了如何通過模型壓縮技術(shù)(特別是無需重訓(xùn)即可直接部署的訓(xùn)練后量化方法,如int4和float16)有效降低服務(wù)成本和推理延遲。

評估指標(biāo)

為全面刻畫效率,EfficientLLM還引入了六個相互正交的細(xì)粒度評估指標(biāo):

1. 平均內(nèi)存利用率(Average-Memory-Utilization,AMU)

2. 峰值計(jì)算利用率(Peak-Compute-Utilization,PCU)

3. 平均延遲(Average-Latency,AL)

4. 平均吞吐量(Average-Throughput,AT)

5. 平均能耗(Average-Energy-Consumption,AEC)

6. 模型壓縮率(Model-Compression-Rate,MCR)這些指標(biāo)共同捕捉了硬件飽和度、延遲與吞吐量的平衡,以及碳排放成本等關(guān)鍵因素。

基準(zhǔn)測試涵蓋了超過100個「模型-技術(shù)」組合,納入從0.5B到72B參數(shù)規(guī)模的多種LLM。

圖片

EfficientLLM的三大核心洞見

效率優(yōu)化是「沒有免費(fèi)午餐」的量化權(quán)衡(Efficiency Involves Quantifiable Trade-offs)

百余項(xiàng)實(shí)驗(yàn)清晰地表明,不存在一種能在所有維度上都達(dá)到最優(yōu)的通用效率技術(shù)。

每一種被評估的方法,在提升至少一個效率指標(biāo)的同時,幾乎總會在其他某個或某些指標(biāo)上有所妥協(xié)。

圖片

以稀疏混合專家模型(MoE)為例,能有效降低推理時的FLOPs(浮點(diǎn)運(yùn)算次數(shù))并提升下游任務(wù)的準(zhǔn)確率,但其代價是峰值顯存需求增加約40%(因?yàn)樾枰鎯λ袑<揖W(wǎng)絡(luò)的參數(shù))。

int4量化技術(shù)則展現(xiàn)了另一面:可以將模型的內(nèi)存占用和能耗降低高達(dá)3.9倍,模型壓縮率表現(xiàn)優(yōu)異,但根據(jù)實(shí)測數(shù)據(jù),通常伴隨著約3-5%的任務(wù)平均得分下降。

最優(yōu)效率策略高度依賴于具體任務(wù)和模型規(guī)模(Optima are Task- and Scale-Dependent)

效率的「最優(yōu)解」并非一成不變,而是高度依賴于應(yīng)用場景、模型規(guī)模和硬件環(huán)境。

高效注意力機(jī)制:在架構(gòu)預(yù)訓(xùn)練階段,對于內(nèi)存資源極度受限的設(shè)備(如端側(cè)推理),MQA(多查詢注意力)因其共享鍵值頭設(shè)計(jì),展現(xiàn)出最佳的內(nèi)存占用和延遲特性。

而當(dāng)追求極致的語言生成質(zhì)量時(以困惑度PPL為衡量標(biāo)準(zhǔn)),MLA(多頭潛在注意力)則表現(xiàn)更優(yōu)。若目標(biāo)是最低能耗部署,NSA(原生稀疏注意力)則是首選。

圖片

PEFT方法的規(guī)模效應(yīng):在微調(diào)階段,對于1B到3B參數(shù)規(guī)模的較小模型,LoRA及其變體(如DoRA,統(tǒng)稱LoRA-plus)在特定的內(nèi)存約束下能達(dá)到最低的性能損失(即最佳的任務(wù)表現(xiàn))。

然而,當(dāng)模型規(guī)模擴(kuò)展到14B參數(shù)以上時,RSLORA在效率上反超LoRA,展現(xiàn)出更低的延遲和功耗。

對于超大規(guī)模模型的微調(diào),參數(shù)凍結(jié)(僅更新部分層或組件)策略雖然可能犧牲少量任務(wù)精度,但能提供最佳的端到端微調(diào)延遲。

量化精度選擇:在推理階段,測試(涵蓋Llama-3,DeepSeek,Qwen等1.5B至34B模型)表明,int4訓(xùn)練后量化能顯著提升資源效率。

內(nèi)存占用減少接近理論上的4倍,吞吐量(每秒處理詞元數(shù))在內(nèi)存受限條件下可提升三倍,而平均任務(wù)性能得分僅有小幅下降(例如DeepSeek-R1-Distill-Qwen-14B的平均分從bf16的0.4719降至int4的0.4361)。

在16位浮點(diǎn)格式中,bfloat16在Hopper架構(gòu)GPU(GH200/H200)上,相較于float16,始終在平均延遲和能耗方面表現(xiàn)更優(yōu),這得益于現(xiàn)代NVIDIA GPU對bfloat16運(yùn)算的原生硬件加速。

LLM效率技術(shù)可廣泛遷移至跨模態(tài)模型(Broad ApplicabilityAcrossModalities)

研究人員將EfficientLLM的評估框架成功擴(kuò)展到了大型視覺模型(LVMs)和視覺語言模型(VLMs),如Stable Diffusion3.5、Wan2.1和Qwen2.5-VL等。

圖片

實(shí)驗(yàn)結(jié)果令人鼓舞:在LLM上得到驗(yàn)證的效率技術(shù),如MQA/GQA等高效注意力機(jī)制,能夠有效地遷移并改進(jìn)LVM的生成質(zhì)量(以FID分?jǐn)?shù)為衡量標(biāo)準(zhǔn));PEFT方法同樣在LVM和VLM上取得了良好的性能-效率權(quán)衡,表明針對LLM的效率優(yōu)化研究成果具有更廣泛的適用性。

開放共享,賦能未來

研究人員即將開源完整的評估流程代碼以及排行榜,在為全球的學(xué)術(shù)研究者和企業(yè)工程師在探索下一代基礎(chǔ)模型的效率與性能平衡時,提供一個堅(jiān)實(shí)的、可復(fù)現(xiàn)的、值得信賴的「指南針」。

研究成果可以為從業(yè)者提供基于嚴(yán)謹(jǐn)實(shí)證數(shù)據(jù)的可操作建議,幫助研究人員在具體的任務(wù)需求和資源限制下,做出更明智、更高效的模型和技術(shù)選型決策,而不是僅僅依賴?yán)碚撏蒲莼蛴邢薜慕?jīng)驗(yàn)。

LLM的效率優(yōu)化是一個持續(xù)演進(jìn)的系統(tǒng)工程,EfficientLLM的探索也僅是其中的一部分,諸如訓(xùn)練基礎(chǔ)設(shè)施優(yōu)化、基于強(qiáng)化學(xué)習(xí)的訓(xùn)練后對齊、測試時擴(kuò)展策略等重要議題,開發(fā)團(tuán)隊(duì)計(jì)劃在未來進(jìn)行深入研究。

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2023-05-29 15:57:41

新型AI超級計(jì)算機(jī)NVIDIA

2023-09-01 15:22:49

人工智能數(shù)據(jù)

2023-11-14 13:39:57

2024-02-05 13:37:35

AI數(shù)據(jù)

2024-05-22 08:36:30

2023-08-09 17:19:54

服務(wù)器計(jì)算

2024-11-05 11:14:05

2025-07-28 09:06:00

2025-05-14 00:55:00

英偉達(dá)命名規(guī)則體系

2018-12-17 09:02:25

百億大表維度查詢

2023-07-08 23:20:41

2025-02-27 13:45:00

2022-06-25 21:17:15

人工智能訓(xùn)練

2025-01-24 15:09:43

2016-01-25 13:42:24

云之家

2025-10-16 08:59:00

2023-07-03 14:49:39

2023-09-19 21:09:18

百度人工智能

2022-12-27 13:36:09

2014-12-01 17:04:44

外包服務(wù)IT桌面
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

亚洲高清二区| 91中文字幕在线视频| 麻豆传媒在线观看| 男女男精品视频网| 一本色道久久综合亚洲精品小说| 欧美自拍第一页| 99热国内精品永久免费观看| 欧美一区二区三区免费| 无码熟妇人妻av在线电影| 色窝窝无码一区二区三区| 久久精品首页| 美女少妇精品视频| 国产精品1000部啪视频| 9999精品免费视频| 亚洲成人激情综合网| 日本一区二区三区免费观看| 国产夫妻在线观看| 久久中文精品| 久久久久国产精品免费| 精品无码在线观看| eeuss国产一区二区三区四区| 色88888久久久久久影院野外| 妞干网这里只有精品| 日韩av视屏| 韩国精品一区二区| 日本中文字幕久久看| 可以直接看的黄色网址| 精品国产美女| 亚洲精品suv精品一区二区| 欧美伦理片在线观看| av资源一区| 亚洲欧美日本在线| 日韩欧美亚洲日产国产| 天天操天天干天天爽| 国产精品亚洲午夜一区二区三区 | 欧美激情四色| 中文字幕av日韩| 亚洲av片不卡无码久久| 美女日韩一区| 欧美精品九九99久久| 玩弄japan白嫩少妇hd| 97在线视频免费观看完整版| 亚洲欧美日韩国产成人精品影院 | 日韩欧亚中文在线| 国产精品久久..4399| 自由的xxxx在线视频| 中文字幕制服丝袜一区二区三区| 欧美一级爽aaaaa大片| 五月天久久久久久| 国产成人av网站| 2014国产精品| 国产黄色高清视频| 久久se精品一区二区| 国产精品视频免费在线| 精品一区二区无码| 日韩一区欧美二区| 国产成人avxxxxx在线看| 久久99国产综合精品免费| 亚洲国产日本| 2021国产精品视频| 天天爽夜夜爽夜夜爽精品| 亚洲激情不卡| 性日韩欧美在线视频| 国产在线观看99| 亚洲韩日在线| 欧美一级黄色网| 欧美激情黑白配| 久久精品一区| 国产精品日韩欧美| 国产精品久久久久久久成人午夜| 麻豆国产91在线播放| 成人福利网站在线观看11| 国产精品九九九九| 国产精品1024| 国产日本一区二区三区| 四虎影院在线播放| 久久影音资源网| 奇米精品在线| 欧美尤物美女在线| 亚洲精品你懂的| 少妇久久久久久被弄到高潮| 色综合伊人色综合网| 国产午夜精品理论片在线| 欧美搞黄网站| 欧美亚洲第一区| 中文字幕av免费观看| 九九久久精品视频| 动漫一区二区在线| 欧美理论在线观看| 国产精品久久久久久亚洲毛片 | 国产欧美一区二区三区在线观看视频 | 欧洲精品视频在线观看| 在线观看免费av网址| 国产精品一区三区在线观看| 亚洲第一网中文字幕| 在线不卡av电影| 欧美3p视频| 久久久久久久久电影| 天天爽夜夜爽人人爽| 美女在线一区二区| 国产欧美日韩一区| 北条麻妃在线| 国产精品视频一二| 成人网站免费观看入口| 成人在线不卡| 亚洲国产黄色片| 中国女人特级毛片| 精品白丝av| 国产精品精品视频| 丰满少妇被猛烈进入| 久久久精品免费观看| 美女在线免费视频| 成人免费网站www网站高清| 狠狠躁天天躁日日躁欧美| 久久久久久久久久久久久久久国产 | 久久日韩视频| 色婷婷一区二区三区四区| 日本中文字幕在线不卡| 国产精品免费不| 久久91亚洲人成电影网站| 瑟瑟视频在线免费观看| av电影天堂一区二区在线 | 免费在线观看黄| 欧美日韩国产影院| 999这里有精品| 国产成人短视频在线观看| 欧美寡妇偷汉性猛交| 中文字幕第315页| 26uuu国产一区二区三区| 蜜桃日韩视频| tube8在线hd| 欧美一区二区三区公司| 免费看91的网站| 久久精品道一区二区三区| 国产九色91| 免费污视频在线观看| 欧美一三区三区四区免费在线看| 超碰97av在线| 日韩高清不卡一区二区三区| 久久一区免费| 成人bbav| 精品亚洲精品福利线在观看| 久久免费小视频| 国产精品99久| 天天综合中文字幕| 台湾天天综合人成在线| 日韩一区二区久久久| 姑娘第5集在线观看免费好剧| 久久一日本道色综合| 国产黄页在线观看| 欧美高清视频看片在线观看| 久久久久久久久久久网站| 99在线精品视频免费观看软件| 亚洲欧洲av色图| 老司机久久精品| 99精品全国免费观看视频软件| 国产精品视频26uuu| 国产露出视频在线观看| 在线观看免费一区| 内射毛片内射国产夫妻| 久久精品国内一区二区三区| 一区二区冒白浆视频| 亚洲精品大全| 欧美日韩成人网| 亚洲伦理在线观看| 亚洲国产综合视频在线观看| 亚洲激情 欧美| 午夜在线精品| 日本视频一区二区不卡| 日韩电影免费观看高清完整版在线观看| 综合国产在线视频| 国产白浆在线观看| 亚洲成人综合在线| 在线免费观看麻豆| 奇米在线7777在线精品| 国产精品久久成人免费观看| 青青草av免费在线观看| 欧美高清在线视频| 热久久久久久久久| 日韩欧美视频在线播放| 亚洲一区二区日本| 在线观看av网页| av成人影院在线| 日韩精品在线看| 中文字幕观看在线| 亚洲精品免费在线| 无码熟妇人妻av| 日韩国产在线观看| 91看片淫黄大片91| 亚洲裸色大胆大尺寸艺术写真| 国产999在线观看| 国产中文字幕免费| 成人激情文学综合网| 韩国黄色一级大片| 国产精品久久久久av蜜臀| 国产亚洲免费的视频看| 一本一道人人妻人人妻αv| 中文字幕日本乱码精品影院| 免费欧美一级片| 91久久久精品国产| 国产精品对白一区二区三区| 中文字幕在线视频网站| 色婷婷久久一区二区| 色婷婷在线观看视频| 国产亚洲精品aa| 伊人国产精品视频| 中文字幕人妻一区二| 欧美a级网站| 国产精品亚洲片夜色在线| 成人免费看片| 精品伊人久久97| 亚洲AV无码一区二区三区少妇| 国产精品妹子av| 浮妇高潮喷白浆视频| 久久在线播放| 国产精品免费一区二区| 日本成人片在线| 一本色道久久88亚洲综合88| 亚洲av无码乱码国产精品fc2| 性欧美1819sex性高清大胸| 亚洲人成毛片在线播放女女| 欧美亚洲日本网站| 美女av在线播放| 日韩午夜精品视频| 超碰手机在线观看| 国产激情一区二区三区四区| 日本女优爱爱视频| 91日韩在线| 深田咏美在线x99av| 精品国产影院| 久久综合给合久久狠狠狠97色69| 久久综合九色欧美狠狠| 99久久人爽人人添人人澡| 国产精品视频网| 欧美裸体视频| 久久久噜噜噜久久久| 尤物网在线观看| 日韩国产高清视频在线| 亚洲熟女乱色一区二区三区久久久| 午夜日韩在线电影| 国产人与禽zoz0性伦| 国产精品中文字幕欧美| 欧美精品久久久久久久久久久| 欧美精品福利| 台湾成人av| 精品影片在线观看的网站| 国内精品视频久久| 最新真实国产在线视频| 亚洲欧洲激情在线| 色一情一乱一区二区三区| 国产精品传媒在线| 无码人妻aⅴ一区二区三区69岛| www.视频一区| 三上悠亚在线一区| 午夜精品视频一区二区三区在线看| 日韩av影视| 最新国产精品视频| 久久福利电影| 久9久9色综合| 午夜不卡在线视频| 天天操天天爽天天射| 亚洲福利电影| 亚洲最大成人免费视频| 中文在线最新版地址| 亚洲女人天堂成人av在线| 熟妇人妻中文av无码| 日本大香伊一区二区三区| 在线能看的av| 91黄视频在线观看| www.日韩一区| 欧美视频一二三区| 亚洲大尺度在线观看| 亚洲日本在线天堂| 在线观看成人毛片| 最近中文字幕一区二区三区| 欧美做爰爽爽爽爽爽爽| 亚洲欧美另类小说| 一本加勒比波多野结衣| 国产精品一区二区三区乱码 | 男的操女的网站| 一区二区三区日韩精品| 一级黄色片毛片| 日本熟妇毛茸茸丰满| thepron国产精品| 国产喷水theporn| 极品少妇xxxx精品少妇| 任你躁av一区二区三区| 精品亚洲免费视频| 女女调教被c哭捆绑喷水百合| 国产乱码精品一区二区三区四区| 中文字幕视频一区二区在线有码| 在线免费看黄| 久久天堂av综合合色| аⅴ资源新版在线天堂| 久久国产精品99国产精| 爱啪视频在线观看视频免费| 欧美在线国产精品| 欧美伊人亚洲伊人色综合动图| 亚洲综合第一页| 欧美在线导航| 亚洲精品成人三区| 亚洲视频中文| 国产福利一区视频| 国产精品综合一区二区| 国产夫妻性爱视频| 中文字幕一区二区不卡| 久久精品久久精品久久| 日本高清成人免费播放| 国产伦精品一区二区三区免.费| 亚洲成人精品视频在线观看| 日本综合在线| 91国在线精品国内播放| 日韩欧美专区| 欧美日韩精品不卡| 欧美私人啪啪vps| 国产理论在线播放| 91美女精品福利| 私库av在线播放| 欧美婷婷六月丁香综合色| 天天干天天干天天干| www.国产一区| 成人欧美大片| av蓝导航精品导航| 天天射综合网视频| 日本成人中文字幕在线| 成人午夜在线免费| 午夜精品福利在线视频| 在线欧美日韩国产| 人妻偷人精品一区二区三区| 欧美日韩爱爱视频| 麻豆久久久久| 欧美高清性xxxxhdvideosex| 99视频精品免费观看| 杨幂一区二区国产精品| 国产精品久久夜| 中文字幕人妻一区二区在线视频| 亚洲国产成人av在线| av黄色在线网站| 久久电影网站中文字幕 | 国产在线视频卡一卡二| 欧美精品成人一区二区三区四区| 日本精品专区| 美女av一区二区| 99久久久国产| 一区二区av| 日日摸夜夜添夜夜添亚洲女人| 久久人人妻人人人人妻性色av| 一区二区成人在线视频| 国产精品一级视频| 久久久精品国产一区二区| 91精品国产66| 欧洲精品久久| 久久激情综合网| 狂野欧美性猛交| 欧美日韩一区二区在线观看视频| 番号集在线观看| 国产精品国产三级国产aⅴ9色| 亚洲国产网址| 国产激情在线观看视频| 国产偷国产偷精品高清尤物| 无码人妻精品一区二区三区蜜桃91 | 精品久久ai电影| www.九色.com| 91麻豆精品在线观看| 成年人视频在线免费看| 亚洲开心激情网| 国产精品99久久久久久董美香 | 久久亚洲AV成人无码国产野外| 午夜视频在线观看一区二区三区| 天堂国产一区二区三区| 777777777亚洲妇女| 亚洲成a人片77777在线播放| 亚洲精品一二三四五区| 国产精品国产三级国产专播品爱网 | 97人人精品| 性鲍视频在线观看| 午夜精品久久久久久久久久| 日韩精品视频无播放器在线看| 国产成人+综合亚洲+天堂| 无需播放器亚洲| 女人扒开双腿让男人捅| 亚洲高清免费视频| 黄色大片在线免费观看| 国产美女久久精品香蕉69| 91精品国产自产在线观看永久∴| 精品国产aⅴ一区二区三区东京热| 午夜精品影院在线观看| 免费人成黄页在线观看忧物| 成人精品一区二区三区| 好看的日韩av电影| 亚洲午夜福利在线观看| 91.com在线观看| 2020国产在线| 蜜桃成人在线| 狠狠色丁香婷综合久久| 久久精品免费在线| 丝袜国产日韩另类美女| 久久国产精品无码一级毛片| 在线视频国内自拍亚洲视频| 里番在线播放|