精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

LLM新巔峰||北大提出mllm-NPU,賦能1000字/秒的設備端LLM預填充

發布于 2024-10-10 15:45
瀏覽
0收藏

本文提出了mllm-NPU,這是第一個有效利用設備上神經處理單元(NPU)卸載的LLM推理系統。mllm-NPU的主要設計目標是減少預填充延遲和能耗。它針對主流的僅解碼器的變壓器架構的LLM(例如LlaMA、GPT等)。關鍵思想是最大限度地在移動NPU上執行預填充,以加速整數計算,同時保持在CPU/GPU上執行必要的浮點操作以保持準確性。為了克服上述挑戰并提高NPU卸載效率,mllm-NPU在三個層面上重構了提示和模型:(1)在提示層面:mllm-NPU將可變長度的提示分割成多個固定大小的塊,同時保持數據依賴性;(2)在張量層面:mllm-NPU識別并提取重要的異常值以在CPU/GPU上運行;(3)在塊層面:mllm-NPU根據硬件親和性和對準確性的敏感度將變壓器塊調度到CPU/GPU和NPU。

??https://arxiv.org/pdf/2407.05858??


LLM新巔峰||北大提出mllm-NPU,賦能1000字/秒的設備端LLM預填充-AI.x社區

LLM新巔峰||北大提出mllm-NPU,賦能1000字/秒的設備端LLM預填充-AI.x社區

mllm-NPU系統設計概述

mllm-NPU是一個創新的大型語言模型(LLM)推理系統,專為移動設備上的神經處理單元(NPU)優化。該系統的主要設計目標是減少預填充(prefill)階段的延遲和能耗,同時保持推理精度。mllm-NPU通過在算法和系統設計上的協同優化,有效地解決了LLM架構與現代NPU設計之間的語義差異。


mllm-NPU的工作流程包括準備階段和執行階段。在準備階段,mllm-NPU使用增強的張量級量化算法將LLM量化為W8A8格式,并生成固定長度的分塊共享圖,以高效處理變長提示。在執行階段,mllm-NPU將接收到的提示分割成固定大小的塊,并按照因果關系處理這些塊。這些塊圖會根據它們的數據格式被分割成子圖,并根據硬件親和性和精度敏感性在CPU/GPU和NPU之間進行調度。

LLM新巔峰||北大提出mllm-NPU,賦能1000字/秒的設備端LLM預填充-AI.x社區


三大創新技術詳解

1. 分塊共享圖

mllm-NPU通過引入分塊共享圖來應對動態提示長度的挑戰。這種方法基于對LLM操作符的兩種分類:靜態操作符和動態操作符。靜態操作符如線性層和層歸一化,可以跨不同塊共享;而動態操作符如注意力機制,依賴于塊長度和序列,不能共享。通過這種方式,mllm-NPU將LLM分解為多個子圖,共享子圖一次構建和優化,非共享子圖則針對不同塊單獨構建。這種方法顯著減少了內存開銷,并提高了可擴展性。

LLM新巔峰||北大提出mllm-NPU,賦能1000字/秒的設備端LLM預填充-AI.x社區

2. 影子離群值執行

為了在不犧牲LLM精度的前提下實現NPU友好的張量級激活量化,mllm-NPU采用了影子離群值執行技術。該技術在運行時將具有離群值的激活通道提取到一個更緊湊的張量中,在CPU上執行,并將結果合并回NPU上的原始操作符結果中。這種設計不僅解決了離群值的問題,還優化了內存使用,并減少了CPU和NPU之間的同步開銷。

3. 無序子圖執行

mllm-NPU采用無序子圖執行策略來優化執行效率。通過在塊和子圖級別進行分區后,LLM子圖可以不按塊序列順序執行。這種策略顯著擴大了調度空間,最小化了由于CPU/GPU浮點操作引起的執行泡沫。mllm-NPU利用在線啟發式算法,在保證正確性的前提下,動態選擇執行順序,從而最大化NPU的利用率并最小化CPU/GPU的工作負載影響。

實現與評估

1. 實現

mllm-NPU的實現涉及多個關鍵技術,包括分塊共享圖、陰影異常執行和亂序子圖執行。這些技術共同優化了移動NPU的加載效率,顯著提高了預填充速度和能效。

  • 分塊共享圖:通過將變長提示分解為多個固定大小的塊,并為每個塊構建預優化的計算圖,mllm-NPU顯著減少了圖構建和優化的時間。此外,通過共享不依賴于塊序列的靜態運算符,減少了內存占用,提高了擴展性。
  • 陰影異常執行:為了在不犧牲精度的情況下實現對NPU友好的張量激活量化,mllm-NPU采用了陰影異常執行技術。通過在CPU上并行處理稀疏的異常激活通道,mllm-NPU能夠在保持NPU計算效率的同時,減少由于異常值引起的量化誤差。LLM新巔峰||北大提出mllm-NPU,賦能1000字/秒的設備端LLM預填充-AI.x社區
  • 亂序子圖執行:mllm-NPU通過亂序執行子圖來優化計算流程,減少由于CPU/GPU上的浮點運算導致的執行泡沫。這種策略擴大了調度空間,使得可以更靈活地管理各個子圖的執行順序,從而最大化NPU的利用率和減少總體執行時間。

LLM新巔峰||北大提出mllm-NPU,賦能1000字/秒的設備端LLM預填充-AI.x社區

2. 評估

mllm-NPU的性能通過與多個基線系統的比較得到驗證。實驗結果顯示,無論是在預填充速度、能耗還是端到端推理延遲方面,mllm-NPU都顯著優于現有技術。

  • 預填充性能:在1024個令牌的提示長度下,mllm-NPU在Xiaomi 14設備上的預填充速度比使用CPU的llama.cpp快18.17-38.4倍,比使用GPU的TFLite快1.27-2.34倍。
  • 能耗:在Redmi K60 Pro設備上,mllm-NPU在1024令牌提示長度下的能耗比使用CPU的llama.cpp低35.63-59.52倍,比使用GPU的TFLite低1.85-4.32倍。
  • 端到端性能:在實際的移動應用場景中,mllm-NPU在端到端推理延遲上也展現出了優越性,特別是在UI自動化和自動電子郵件回復的任務中,mllm-NPU的表現遠超其他基線系統。

性能分析

mllm-NPU的性能優勢主要源于其創新的設計和優化策略。通過在移動NPU上最大化整數運算的執行,同時在CPU/GPU上處理必要的浮點運算,mllm-NPU不僅提高了執行速度,還降低了能耗。

  • 內存消耗:盡管mllm-NPU引入了額外的內存開銷(主要是由于陰影異常執行技術),但這一開銷相對較小,僅占總內存的一小部分。這得益于其高效的內存管理策略,如分塊共享圖技術,有效減少了不必要的內存占用。
  • 精度保持:mllm-NPU在保持高效NPU執行的同時,幾乎不損失推理精度。通過動態處理異常值位置,mllm-NPU能夠在元素級別上提供比傳統量化方法更高的精度,從而保證了模型的輸出質量。
  • 系統兼容性:mllm-NPU支持標準的LLM格式,并可以與現有的解碼引擎兼容,使其能夠靈活地集成到各種移動設備和應用中。此外,mllm-NPU的設計允許與其他算法級優化技術結合使用,進一步提升性能。

總之,mllm-NPU通過一系列創新技術,顯著提高了移動設備上大型語言模型的推理性能,為實現高效、低能耗的移動設備端LLM推理提供了有效解決方案。

準確性與內存消耗

1. 準確性保持

mllm-NPU系統在實現高效的NPU卸載的同時,保持了較高的準確性。與FP16相比,準確性損失不到1%,這在實際應用中是可接受的。這得益于其創新的技術,如影子離群值執行(shadow outlier execution),它允許在CPU上以浮點精度處理離群值,從而保持了高準確性。此外,mllm-NPU與其他基線模型相比,在保持準確性的同時,顯著提高了執行效率。

2. 內存消耗

盡管mllm-NPU引入了一些額外的內存開銷,例如為離群值執行加載的浮點權重,但這些開銷相對較小,僅占總內存的0.6%至1%。此外,通過共享圖(chunk-sharing graph)技術,mllm-NPU顯著減少了內存需求,因為它允許在不同的執行塊之間共享靜態操作符。這種方法不僅減少了內存占用,還提高了內存使用的效率。

本文轉載自 ??AI論文解讀??,作者:柏企

收藏
回復
舉報
回復
相關推薦
亚洲精品mv| 少妇av在线播放| 女同性一区二区三区人了人一| 日韩视频在线观看一区二区| www.亚洲视频.com| 国产福利小视频在线| 狠狠色丁香久久婷婷综合丁香| 欧美极品少妇xxxxⅹ裸体艺术 | 日本中文字幕在线免费观看| 欧美日韩在线观看视频小说| 精品欧美乱码久久久久久1区2区| 日韩欧美xxxx| 日韩激情美女| 国产精品久久久久久久第一福利| av蓝导航精品导航| 中文字幕乱码在线观看| 国产专区一区| 在线视频欧美日韩| 国产黄色三级网站| 国产成人视屏| 欧美日韩在线播放一区| 国产成人黄色片| 91精品久久| 中文字幕在线一区二区三区| 国产欧美丝袜| 国产av一区二区三区| 人人爽香蕉精品| 91国产美女视频| 一级性生活免费视频| 妖精视频一区二区三区| 亚洲电影免费观看高清完整版在线观看 | 亚洲精品一二区| 性活交片大全免费看| **日韩最新| 欧美日韩在线电影| 三上悠亚av一区二区三区| 在线成人av观看| 欧美性猛交xxxx乱大交3| 成年人视频网站免费| 宅男在线观看免费高清网站| 亚洲欧洲www| 永久久久久久| 欧美尤物美女在线| 中文字幕av一区二区三区免费看 | 精品9999| 欧美黄色片在线观看| 小泽玛利亚一区二区免费| 大胆日韩av| 中文字幕久久久| 欧美激情亚洲色图| 国产一区二区欧美| 国产亚洲精品一区二555| 性欧美精品中出| 国产一区二区精品福利地址| 亚洲视频精品在线| 亚洲毛片亚洲毛片亚洲毛片| 不卡日本视频| 伊人久久免费视频| 最新日韩免费视频| 亚洲91精品| 欧美丰满少妇xxxxx做受| 欧美黄色aaa| 亚洲免费黄色| 欧美孕妇毛茸茸xxxx| 黄色av网站免费观看| 日本免费在线视频不卡一不卡二| 国产精品久久久久av| 在线播放精品视频| 国产一区在线视频| 国产精品手机在线| 欧美精品a∨在线观看不卡| 久久精品人人做人人爽人人| 无码免费一区二区三区免费播放| 自拍视频在线| 一区二区三区日韩精品| 国产av天堂无码一区二区三区| 日韩深夜视频| 欧美三级中文字幕在线观看| 久久综合桃花网| 欧美aaaaaaaa牛牛影院| 中文字幕国产亚洲2019| 9.1片黄在线观看| 欧美日韩三级| 日本免费久久高清视频| 国产精品特级毛片一区二区三区| 国产成人综合网| 欧美日韩一区二区三| 美女羞羞视频在线观看| 午夜不卡av免费| 999在线观看| 日韩欧美国产大片| 波霸ol色综合久久| 精品成人免费视频| 精品伊人久久久久7777人| 国产欧美一区二区三区另类精品 | 白嫩白嫩国产精品| 亚洲国产美女久久久久| 99热在线观看精品| 亚洲一区二区毛片| 亚洲a∨日韩av高清在线观看| 色久视频在线播放| 亚洲欧美一区二区三区国产精品| 免费看一级大黄情大片| 色狠狠一区二区三区| 亚洲国产又黄又爽女人高潮的| 日本 欧美 国产| 国产欧美精品久久| 超碰在线观看97| 91成人高清| 欧美日韩精品在线观看| 能看毛片的网站| 成人av国产| 欧美一级在线亚洲天堂| 精品国产乱码一区二区三| 国产日韩欧美一区二区三区乱码| 又大又硬又爽免费视频| www一区二区三区| 亚洲性xxxx| 日产精品久久久| 国产不卡视频一区| 在线丝袜欧美日韩制服| 成人小电影网站| 亚洲国产天堂久久综合网| 性欧美疯狂猛交69hd| 青青草成人在线观看| 久久亚洲高清| 国产美女高潮在线观看| 精品日韩欧美在线| 99视频只有精品| 韩国女主播成人在线观看| 视频在线精品一区| 亚洲优女在线| 国产视频一区在线| 在线观看国产亚洲| 本田岬高潮一区二区三区| 精品免费久久久久久久| 亚洲精品成a人ⅴ香蕉片| 这里只有精品在线播放| 波多野结衣一二区| 国产午夜精品一区二区| avav在线看| 久草在线成人| 国产97免费视| 国产香蕉在线| 在线看一区二区| 日韩精品无码一区二区三区久久久| 一本一道久久综合狠狠老精东影业| 国产精品久久久久久久久久久久冷 | 中文字幕一区二区三区不卡在线| 国产福利影院在线观看| 国产调教一区二区三区| 国产成人精品一区二区在线| 免费在线稳定资源站| 日本丶国产丶欧美色综合| 亚洲av综合一区二区| 老色鬼久久亚洲一区二区| 欧美主播一区二区三区美女 久久精品人 | 丰满少妇中文字幕| 国产精品99一区二区| 国产伦精品一区二区三毛| 91破解版在线观看| 亚洲精品一二区| 自拍偷拍精品视频| 亚洲欧洲中文日韩久久av乱码| 在线观看日本www| 欧美视频网站| 国产在线精品一区| 偷拍精品精品一区二区三区| 少妇高潮久久久久久潘金莲| 99久久精品日本一区二区免费| 亚洲乱码日产精品bd| 在线精品视频播放| 久久婷婷影院| 中文字幕一区二区三区四区五区| 久久久精品区| 国产91精品久久久久久久| 福利视频在线看| 9191国产精品| 亚洲一区欧美在线| 国产日韩精品一区| 91亚洲一区二区| 国产亚洲欧洲| 亚洲综合视频一区| 国产精品一区二区三区美女| 国产97在线播放| av片哪里在线观看| 精品亚洲夜色av98在线观看| 国产又黄又猛又爽| 五月婷婷激情综合| 懂色av粉嫩av浪潮av| 不卡一区二区三区四区| www.99av.com| 亚洲黄色在线| 欧美亚洲视频一区| 色爱av综合网| 亚洲综合av影视| 欧美日韩电影免费看| 欧美人与物videos| se在线电影| 亚洲护士老师的毛茸茸最新章节| 中文字幕人妻一区二区在线视频 | 亚洲精品久久久蜜桃动漫| 欧美性猛xxx| 久久久久久久黄色| 国产精品色在线观看| 男女一区二区三区| 国产一区二区福利视频| 不要播放器的av网站| 影音先锋中文字幕一区二区| 一区二区三区四区不卡| 午夜先锋成人动漫在线| 97av影视网在线观看| 成人国产精品入口免费视频| 欧美性在线视频| 啪啪免费视频一区| 日韩在线视频观看| 久久久pmvav| 亚洲国产精品人久久电影| 国产男女裸体做爰爽爽| 色狠狠一区二区三区香蕉| 国产一级一片免费播放放a| 亚洲人成精品久久久久久| 日韩福利在线视频| 久久综合网色—综合色88| 无码国产69精品久久久久网站| 精品在线播放午夜| 五月婷婷之婷婷| 日韩精品免费专区| av网址在线观看免费| 一区二区三区导航| 福利视频一二区| 黄色另类av| 女人色极品影院| 欧美成人午夜| 日本三级中文字幕在线观看| 91久久电影| 中文字幕超清在线免费观看| 97人人精品| 亚洲自拍三区| 911久久香蕉国产线看观看| 中文字幕日韩一区二区三区| 国产精品99久久精品| 一区二区在线不卡| 久久一区91| 青少年xxxxx性开放hg| 国产精品国产三级国产在线观看 | 午夜羞羞小视频在线观看| 久久久成人av| bestiality新另类大全| 美日韩精品免费观看视频| 99久久精品免费观看国产| 久久成人这里只有精品| 在线h片观看| 国自产精品手机在线观看视频| 国产第一页在线| 97色在线观看免费视频| 色综合亚洲图丝熟| 国产成人av在线| 欧美高清你懂的| 亚洲影影院av| 男人的天堂久久| 日本欧美色综合网站免费| 日韩国产一区| japanese在线播放| 91久久视频| 北条麻妃av高潮尖叫在线观看| 麻豆精品一区二区av白丝在线| 亚洲天堂av一区二区| 国产成人精品一区二| 欧类av怡春院| 欧美激情一区二区三区蜜桃视频| 亚洲熟女毛茸茸| 亚洲一区在线观看免费观看电影高清| 国产无套内射又大又猛又粗又爽 | 欧美激情三级免费| 国产美女精品写真福利视频| 国产成人精品免费视频| 国产精品亚洲综合在线观看| 国产一区二区黄色| 日韩欧美视频在线播放| 国产av熟女一区二区三区 | 一区二区三区高清在线| 国产www在线| 欧美男人的天堂一二区| 手机av免费在线观看| 中日韩午夜理伦电影免费| 牛牛精品在线视频| 国产97在线观看| 午夜久久av| 婷婷久久五月天| 在线视频日韩| 天天操精品视频| 久久亚洲二区三区| 青青青在线免费观看| 欧美性极品xxxx娇小| 精品人妻伦一二三区久久| 亚洲欧洲成视频免费观看| 视频在线这里都是精品| 国产成人在线视频| 国产毛片精品| 少妇熟女一区二区| 久久久蜜桃一区二区人| 麻豆精品国产传媒| 日本一区二区三区视频视频| 久久久综合久久久| 欧美美女一区二区| 国产裸舞福利在线视频合集| 97香蕉久久超级碰碰高清版| 精品一区二区三区中文字幕| 亚洲国产精品一区在线观看不卡| 亚洲国产导航| 久久综合桃花网| 亚洲天堂中文字幕| 最近中文字幕免费观看| 亚洲国产成人精品久久| av毛片在线看| 国产精品狼人色视频一区| 亚洲区小说区图片区qvod按摩 | 久久一区精品| 中文视频在线观看| 一二三区精品视频| 国产精品一区二区黑人巨大| 亚洲视屏在线播放| 老色鬼在线视频| 国产伦精品一区二区三区免 | 亚洲成a人片77777在线播放| av日韩一区二区三区| 国产精品一区免费视频| 国产精品综合激情| 欧美亚洲高清一区| 黄色在线小视频| 国产成人精品免高潮费视频| 日韩欧美国产大片| 日本一本二本在线观看| 99精品国产99久久久久久白柏 | 欧美视频中文字幕| 国产网站在线播放| 国产精品久久久久久久久免费看 | 久久人人爽人人爽人人片av不| 久久久国内精品| 国产99精品视频| 国产午夜福利片| 日韩av在线不卡| 亚洲校园激情春色| 日韩在线导航| 久久精品国产成人一区二区三区| 久草手机视频在线观看| 欧美久久久一区| 成人短视频在线| 成人3d动漫一区二区三区91| 激情六月综合| 日本japanese极品少妇| 一本大道av一区二区在线播放| 国产毛片在线看| 91精品免费视频| 国内一区二区三区| 久久久久久久无码| 色综合一个色综合| 自拍视频在线网| 亚洲在线视频观看| 亚洲伦伦在线| 亚洲人成人无码网www国产 | 国精产品一品二品国精品69xx| 国外成人在线视频| 蜜桃精品噜噜噜成人av| 熟妇人妻无乱码中文字幕真矢织江| 亚洲国产高清在线| a级片免费视频| 97视频在线免费观看| 第一sis亚洲原创| 久久久精品人妻一区二区三区| 性久久久久久久| 成人影视在线播放| 亚洲一区二区自拍| 国产欧美在线| 纪美影视在线观看电视版使用方法| 欧美一区二区三区在线观看| 操喷在线视频| 亚洲va韩国va欧美va精四季| 国产精品夜夜爽| 无码人妻丰满熟妇精品| 美女999久久久精品视频| 色综合久久中文| 日韩va在线观看| 欧美日韩亚洲精品一区二区三区| av播放在线| 国产一区免费在线观看| 日韩激情一二三区| 久久久久久av无码免费网站| 一本大道久久加勒比香蕉| 亚洲啊v在线免费视频| 国产三级日本三级在线播放 | 国产黄网在线观看| 欧美高清视频免费观看| 国产成人ay| 亚洲精品乱码久久久久久蜜桃欧美| 欧美在线免费观看亚洲| 超碰在线资源| 国产麻豆电影在线观看| 国产色一区二区|