精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

比A100性價比更高!FlightLLM讓大模型推理不再為性能和成本同時發愁

人工智能 新聞
近日,無問芯穹、清華大學和上海交通大學聯合提出了一種面向 FPGA 的大模型輕量化部署流程,首次在單塊 Xilinx U280 FPGA 上實現了 LLaMA2-7B 的高效推理。

大語言模型在端側的規模化應用對計算性能、能效比需求的“提拽式”牽引,在算法與芯片之間,撕開了一道充分的推理競爭場。

面對想象中的終端場景,基于 GPU 和 FPGA 的推理方案的應用潛力需要被重新審視。

近日,無問芯穹、清華大學和上海交通大學聯合提出了一種面向 FPGA 的大模型輕量化部署流程,首次在單塊 Xilinx U280 FPGA 上實現了 LLaMA2-7B 的高效推理。

第一作者為清華大學電子系博士及無問芯穹硬件負責人曾書霖,通訊作者為上海交通大學副教授、無問芯穹聯合創始人兼首席科學家戴國浩,清華大學電子工程系教授、系主任及無問芯穹發起人汪玉。

相關工作現已被可重構計算領域頂級會議 FPGA’24 接收。

論文鏈接:https://arxiv.org/pdf/2401.03868.pdf

回顧上一輪清華電子系相關工作被 FPGA 國際會議收錄的蹤跡,要追溯到 2016 年的 Going Deeper with Embedded FPGA Platform for Convolutional Neural Network 與 2017 年 ESE: Efficient Speech Recognition Engine with Sparse LSTM on FPGA。

前者催化了深鑒科技的創立,后者被 FPGA 國際會議評為當年唯一的最佳論文,并為其特設了一個 Tutorial 環節「The Role of FPGAs in Machine Learning」,專門討論 FPGA 在機器學習領域所扮演角色的變化。

隨著 FPGA 在高性能計算領域的應用潛力被不斷挖掘,震動從學術界傳導到產業界,引發了一輪半導體領域的 FPGA 公司收購熱。

在幾乎所有可能對未來世界產生重大影響的產、研趨勢中,高性能計算都處于關鍵位置。雖然設備的核心計算部件仍是 CPU 和 GPU ,但在一個人工智能算法不斷進步、新標準不斷涌現的時代里,加速這些日新月異的算法推理工作至關重要。

在軟硬件協同優化趨勢下,FPGA 在靈活構建高效的大模型推理系統中將發揮越來越重要的作用。它被認為是通往 5G 通信、數據中心、無人駕駛等諸多千億美元級別市場的鑰匙。

被 FPGA’24 接收的新成果名為 FlightLLM。在單 batch 場景下相比在同等工藝 V100S GPU 上使用 vLLM 推理框架和 SmoothQuant 量化庫,FlightLLM 可實現 6.0 倍的能效比提升和 1.8 倍的性價比提升。

圖片

放眼未來 1 至 2 年,大模型可能將在代碼補全、實時聊天機器人、售后支持等延時敏感應用場景中落地。在這些場景中,延時低、功耗小對于用戶的交互體驗至關重要。

然而,目前大模型的計算量和存儲量相比傳統神經網絡呈現數量級增加,這導致其推理速度和能效很難滿足這些需要快速反饋、能耗敏感場景的需求。

為解決上述問題,行業內通常采用如稀疏化、量化的方法來壓縮大模型。但是 GPU 硬件平臺僅能支持部分粗粒度的模型壓縮方法,對于定制化的模型壓縮方法的計算效率很低。

作者認為,FPGA 具有低成本、可配置、低功耗的特性,可成為加速大模型推理的潛在解決方案。但要想用好,仍需要解決以下挑戰:

圖片


  • 計算效率低下:大模型中靈活的稀疏模式(例如塊稀疏、N:M 稀疏等)導致計算效率低下。
  • 內存帶寬利用率低:大模型的 decode 階段反復從片外存儲器中讀寫細粒度的數據,導致較低的帶寬利用率(29%-43%)。
  • 編譯開銷大:大模型的動態稀疏模式和可變輸入長度構成了一個龐大的指令空間。例如,為 2048 種輸入 token 長度生成指令將導致在 FPGA 上約 TB 量級的存儲開銷。

FlightLLM 的核心思想是利用 FPGA 上特定的資源(如 DSP48 和異構存儲層次結構)來解決大模型的計算和存儲開銷問題。

圖片

 FlightLLM的整體架構。

盡管在理論上,稀疏可以為大模型推理帶來性能提升,但它們不能直接在現有硬件架構上實現。在基于 Transformer 的大模型中,大多采用稀疏注意力和剪枝等稀疏化方法來加速推理。

然而,稀疏化所生成的稀疏矩陣,其密度和稀疏模式并不確定。這給硬件設計帶來了很大的挑戰,特別是對于 FPGA 這種基于固定 DSP48 乘法單元的架構。此前的工作引入了大量額外的硬件架構來支持稀疏計算,但這會導致硬件資源顯著增加。根據估算,需要多消耗近 5 倍的硬件資源。

(a) 統一矩陣處理引擎(Matrix Processing Engine, MPE),可靈活支持(b)矩陣-矩陣乘(Matrix-Matrix multiplication, MMMult)和(c)矩陣-向量乘(Matrix-Vector multiplication, MVMult)計算模式。(d)每個MPE由多個基于稀疏DSP48鏈的向量處理引擎(Vector Processing Engine, VPE)組成。

為此,FlightLLM 采用了軟硬件協同設計來克服低計算效率的挑戰。研究者設計了統一的矩陣處理引擎(MPE),以處理與矩陣計算相關的所有操作(見上圖)。

此前的工作均通過級聯 DSP 來充分利用 DSP48 的硬件資源來減少硬件開銷。然而,由于級聯鏈的路徑是固定的,因此完全級聯的 DSP 架構對稀疏計算不友好。

FlightLLM 在這一問題上提出了針對性的解決方案。FlightLLM 利用 FPGA 上的 DSP48 計算單元,設計了一個可配置的稀疏 DSP 鏈。稀疏 DSP 鏈支持多種的稀疏模式,其計算效率(即運行時 DSP 利用率)提升了 1.6 倍。

此外,在解碼階段,作者發現大模型推理的主要效率限制來自于頻繁訪問片外存儲器的小數據量激活向量。

(a)大模型推理階段的注意力層/線性層與非線性激活操作(MISC)的算子融合實現;全片上解碼在(b)預取(Prefill)階段和(c)解碼(Decode)階段的示意圖:利用算子融合和FPGA的高片上存儲,使得大模型推理解碼階段的激活值無須寫到片外。

為了減少激活向量的片外存儲器訪問,解決訪存帶寬利用率低的挑戰,FlightLLM 使用了算子融合技術,將解碼階段每次推斷中的計算進行融合,提出了 always-on-chip decode 的數據流。通過混合精度量化和算子融合的設計,將 decode 階段的激活值最大程度在片上緩存中復用。

最后,由于大模型每次推理過程 token 長度都會增加,因此需要不同的指令。而大模型有大量計算和存儲需求,即使使用粗粒度指令,指令數量仍然非常龐大。

圖片

通過在不同輸入 token 長度下推理性能的測量,作者觀察到 prefill 和 decode 的延時和輸入 token 長度之間的關系存在著 「階梯」增長的特征,并且 prefill 階段延時隨輸入 token 長度增加得更快。

這是因為 prefill 階段是計算瓶頸,計算量隨 token 長度顯著增加;而 decode 階段是訪存瓶頸,因此延時增加不明顯。階梯狀增長的原因則主要是粗粒度指令集。由于矩陣 - 矩陣乘指令的輸出并行度是 128,矩陣 - 向量乘的輸出并行度是 16,因此 prefill 和 decode 的 「階梯」 的寬度分別為 128 和 16。

基于這些發現,FlightLLM 提出了一種 token 長度自適應的編譯方法,通過復用 prefill 階段和 decode 階段的指令來減少編譯指令的存儲開銷,進而對每個 「階梯」輸入 token 長度的指令分組,以 「階梯」 寬度復用指令序列。這種設計顯著減少了指令的總存儲開銷。

目前,作者已在 Xilinx Alveo U280 FPGA(16nm)上實現了 FlightLLM。在 OPT-6.7B 和 LLaMA2-7B 上的實驗結果表明,FlightLLM 的端到端延遲優于 NVIDIA V100S GPU。

圖片

此外,FlightLLM(基于 U280 FPGA 和 VHK158 FPGA)在能效上超過了 NVIDIA V100S 和 A100 GPU,分別提高了 6.0× 和 4.2×,在性價比上提高了 1.8× 和 1.5×。

更多詳細細節,請參閱論文原文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-12-22 09:32:13

引擎模型

2024-07-08 13:04:01

2023-08-13 07:44:18

GPU模型英偉達

2025-02-12 09:20:12

2017-04-06 13:40:43

JavaScriptThisWeb

2024-05-15 09:41:22

樂觀鎖編程

2023-01-05 09:33:37

視覺模型訓練

2025-06-23 10:08:22

2009-10-22 16:32:10

布線系統短鏈路問題

2025-03-14 11:56:52

2023-02-13 09:32:37

模型訓練

2021-01-05 22:46:59

Wi-Fi5G網絡

2024-02-01 12:43:16

模型數據

2014-11-20 09:13:00

思科
點贊
收藏

51CTO技術棧公眾號

亚洲国产一区二区三区| 久久精品国产免费| 欧美一区二区三区在线| 一区二区三区一级片| 亚洲一卡二卡在线观看| 97久久夜色精品国产| 欧美一级二级三级蜜桃| 日韩免费电影一区二区| 亚洲熟女乱色一区二区三区久久久| 成人在线国产| 欧美日韩高清在线播放| 国产成人一二三区| 四虎影视精品成人| 免费成人你懂的| 久久99久久亚洲国产| 亚洲av网址在线| 国产极品久久久久久久久波多结野| 中文字幕一区二区三区蜜月| 国产98在线|日韩| 综合网在线观看| 国产韩日影视精品| 欧美mv日韩mv国产| 天天摸天天碰天天添| 免费观看在线黄色网| 国产69精品久久99不卡| 国产ts一区二区| 欧洲美女女同性互添| 九九热hot精品视频在线播放| 在线亚洲精品福利网址导航| 日本三级中文字幕在线观看| 天堂91在线| 黄页网站大全一区二区| 5566成人精品视频免费| 国产女人18水真多毛片18精品| 国产乱人伦精品一区| 欧美日韩久久一区二区| 北条麻妃69av| av网址在线播放| 久久久亚洲欧洲日产国码αv| 国产美女精彩久久| 在线观看精品国产| 综合激情婷婷| 在线播放亚洲激情| 日本女人黄色片| 欧美aa在线| 一区二区三区视频在线看| 日本不卡二区高清三区| 黄片毛片在线看| 国产呦萝稀缺另类资源| 国产91色在线免费| 日韩精品――中文字幕| 欧美一区二区| 色狠狠久久aa北条麻妃| 国产精品高清无码在线观看| 久久国产精品美女| 欧美性猛交一区二区三区精品| 国产免费黄视频| 成年人国产在线观看| 国产精品国产三级国产普通话蜜臀| 成人午夜电影免费在线观看| 国产精品视频久久久久久| 日韩国产在线一| 97久久久免费福利网址| 久久精品国产亚洲av香蕉| 超碰成人久久| 在线精品91av| 中文字幕国产专区| 日韩丝袜视频| 日韩久久午夜影院| 精品无码在线视频| 久久国产精品色av免费看| 91精品国产一区二区三区蜜臀| 中文字幕22页| 国产精品高清一区二区| 欧美一区2区视频在线观看| 91女神在线观看| 91精品亚洲一区在线观看| 欧美日韩激情一区| 爱豆国产剧免费观看大全剧苏畅| 国产精品无码久久久久| 欧美日本视频在线| 精品综合久久久久| 亚洲精品一区在线| 精品不卡在线视频| 无码人妻精品一区二区三区99不卡| 亚洲国产视频二区| 亚洲成在人线av| 精品夜夜澡人妻无码av| 综合亚洲色图| 一本一本久久a久久精品牛牛影视| 亚洲av无码国产精品麻豆天美| 婷婷成人在线| 亚洲最新av在线网站| 精品人妻中文无码av在线| 色偷偷综合网| 精品国产一区二区三区久久| 中国一级片在线观看| 欧美粗暴jizz性欧美20| 欧美极品少妇与黑人| 亚洲黄色激情视频| 久久精品国产免费| 国产在线精品日韩| 高清中文字幕一区二区三区| 国产精品国产精品国产专区不片| 致1999电视剧免费观看策驰影院| 中文av资源在线| 欧美日韩中文在线观看| 91极品尤物在线播放国产| 3d动漫一区二区三区在线观看| 欧美一区二区成人6969| 182在线视频| 欧美亚洲激情| 久久久久久久爱| 一级久久久久久| 国产精品 日产精品 欧美精品| 黑人巨大精品欧美一区二区小视频| 九色视频在线观看免费播放| 亚洲女爱视频在线| wwwxxx黄色片| 日韩精品视频在线看| 亚洲欧美国产制服动漫| 欧美日韩在线视频免费| 久久青草久久| 国产精品9999久久久久仙踪林| 欧美日韩国产中文字幕在线| 一区二区欧美视频| 欧美性猛交久久久乱大交小说| 视频在线观看免费影院欧美meiju| 亚洲乱亚洲乱妇无码| 永久看片925tv| 日韩国产成人精品| 国产精品免费一区二区三区四区 | 色偷偷88欧美精品久久久| 色www免费视频| 亚洲va久久久噜噜噜久久| 欧美成人精品h版在线观看| www.亚洲激情| 国产成人在线电影| 久久99精品国产.久久久久久| 久久久久免费视频| 在线播放国产一区| 久久久久久久久久久久久女国产乱| 国产激情在线看| 欧美激情三区| 亚洲天堂av电影| 六月丁香在线视频| 国产91在线观看丝袜| 亚洲一区美女| 日韩精品免费观看视频| 日韩精品免费看| 久久精品免费在线| aaa国产一区| 精品少妇一区二区三区在线| 久久综合另类图片小说| 97色在线观看| 午夜视频福利在线观看| 黑人狂躁日本妞一区二区三区 | 大桥未久一区二区三区| 国内自拍亚洲| 久久久国产精品亚洲一区| 国产欧美久久久精品免费| 亚洲欧美日韩在线不卡| 杨幂一区二区国产精品| 国内精品久久久久久久影视蜜臀| 69堂成人精品视频免费| 亚洲夜夜综合| 亚洲国产精品福利| 69国产精品视频免费观看| 国产三级精品视频| 国产成人美女视频| 欧美黄色大片网站| 国外成人在线视频网站| 自拍网站在线观看| 色婷婷**av毛片一区| 国产精品视频一区二区三区,| 一区二区三区四区在线免费观看| 成人午夜精品无码区| 久久久久久婷| 一区二区三区的久久的视频| 香蕉成人app| 欧美一级在线亚洲天堂| www日韩tube| 日韩欧美一区在线| 国产精品久久久久久久久久久久久久久久久 | 欧美激情视频在线| 色天堂在线视频| 欧美偷拍一区二区| 欧美日韩国产精品综合| www.av精品| av网站在线不卡| 国模大胆一区二区三区| 免费av在线一区二区| 久久精品超碰| 韩国19禁主播vip福利视频| 男人的天堂av高清在线| 7777精品伊人久久久大香线蕉超级流畅| 久草免费在线视频观看| 国产视频一区二区三区在线观看| 国产在线观看中文字幕| 国产精品美女久久久| 伊人久久青草| 噜噜噜天天躁狠狠躁夜夜精品| 国产精欧美一区二区三区| 色呦呦在线播放| 亚洲性猛交xxxxwww| 亚洲高清在线观看视频| 色视频欧美一区二区三区| 国产真实乱在线更新| xfplay精品久久| 视频区 图片区 小说区| 老司机午夜精品视频| www婷婷av久久久影片| 精品国产欧美日韩| 懂色中文一区二区三区在线视频| 午夜日韩成人影院| 欧美大片欧美激情性色a∨久久| 国产二区在线播放| 日韩成人在线视频观看| 99精品在线视频观看| 欧亚洲嫩模精品一区三区| 玖玖爱免费视频| 久久久久久久久久久久久夜| 中文视频在线观看| 国产精品18久久久久久久久| 亚洲综合在线做性| 一级aaaa毛片| 色综合久久九月婷婷色综合| 18精品爽视频在线观看| 亚洲欧美影音先锋| 免费黄在线观看| 99精品久久99久久久久| 好吊操视频这里只有精品| 六月丁香婷婷色狠狠久久| 任你操这里只有精品| 亚洲国产mv| 亚洲色成人www永久在线观看| 天天综合久久| 伊人久久大香线蕉av一区| 欧美偷拍综合| 日本视频一区二区不卡| 亚洲三级精品| 老司机精品福利在线观看| 超碰一区二区三区| 粉嫩高清一区二区三区精品视频| 激情久久一区二区| 国产乱人伦真实精品视频| 成人精品动漫| 国产精自产拍久久久久久| 69堂免费精品视频在线播放| 国产精品久久久久久av福利软件| 日韩欧美另类一区二区| 国产成+人+综合+亚洲欧美丁香花| 蜜桃在线视频| 庆余年2免费日韩剧观看大牛| 色戒汤唯在线观看| 欧美在线观看视频| av有声小说一区二区三区| 欧美一级免费视频| 成人勉费视频| 日本韩国欧美精品大片卡二| sese综合| 国产精品免费观看在线| 亚洲午夜剧场| 成人动漫视频在线观看完整版| 亚洲精品a区| 久久精品综合一区| 久久最新网址| 制服国产精品| 欧美亚洲不卡| av7777777| 手机精品视频在线观看| 簧片在线免费看| 精品一区二区三区在线观看国产| 奇米777在线| 成人免费观看男女羞羞视频| 2一3sex性hd| 国产亚洲精品资源在线26u| 亚洲女人久久久| 亚洲一区二区视频在线| 97久久久久久久| 欧美三级日韩在线| www.欧美国产| 精品偷拍各种wc美女嘘嘘| 99视频在线观看地址| 欧美成人h版在线观看| 99色在线观看| 国产精品精品国产| 香蕉成人app| 欧美精彩一区二区三区| 五月天久久网站| 国产在线精品91| 美腿丝袜在线亚洲一区 | 日韩综合久久| 国产亚洲精品久久飘花| 欧美系列电影免费观看| 成人免费性视频| 日韩av中文字幕一区二区| 无码人妻少妇色欲av一区二区| 99国产精品久久久久久久久久| 日本精品久久久久中文| 亚洲va欧美va人人爽| 中文字幕在线观看免费| 亚洲精品一区二区三区四区高清 | 国产日韩精品一区二区三区| 在线观看美女av| 色婷婷久久一区二区三区麻豆| 国产sm主人调教女m视频| 国产亚洲精品综合一区91| 狂野欧美性猛交xxxxx视频| 国产精品主播视频| 日韩三区视频| 九九热只有这里有精品| 久久97超碰国产精品超碰| 黄瓜视频污在线观看| 亚洲综合激情小说| 亚洲一级黄色大片| 亚洲区中文字幕| 高清在线视频不卡| 亚洲影院高清在线| 欧美大黑bbbbbbbbb在线| 欧美 日韩 国产一区| 成人少妇影院yyyy| 亚洲国产精品免费在线观看| 欧美性一级生活| 精品亚洲成a人片在线观看| 久久久免费精品视频| 欧美片网站免费| 欧美 日韩 国产 在线观看 | www.日本久久| 国产精品全国免费观看高清| 国产精品一区无码| 亚洲精品一区二区三区不| 不卡的av影片| 97人人香蕉| 亚洲成人日韩| 欧美一级特黄aaa| 亚洲品质自拍视频| 国产精品女人久久久| 色妞欧美日韩在线| 狂野欧美性猛交xxxx| 亚洲成人午夜在线| 日韩精品乱码av一区二区| 美女爆乳18禁www久久久久久| 精品久久香蕉国产线看观看gif| 欧美一级做性受免费大片免费| 欧美理论片在线观看| 欧美激情精品| 桥本有菜av在线| 国产一区在线不卡| 成人免费毛片东京热| 日韩一二三区不卡| 在线观看操人| 电影午夜精品一区二区三区| 亚洲国产美女 | 一区二区小视频| 中文字幕久热精品在线视频| 成人黄色在线| 久久久久久久免费视频| 国产91富婆露脸刺激对白| 亚洲一区二区三区乱码aⅴ| 91成人精品在线| 野外做受又硬又粗又大视频√| av一本久道久久综合久久鬼色| 中日韩精品视频在线观看| 精品无码久久久久久国产| 台湾佬成人网| 亚洲精品视频一区二区三区| 久久国产精品一区二区| 欧美成人一二三区| 亚洲激情自拍图| 欧美精品高清| 超碰在线免费观看97| 成人午夜在线视频| 天堂а√在线中文在线新版| 国产一区二区三区在线观看网站| 欧美综合影院| www.av蜜桃| 国产亚洲精品bt天堂精选| 亚洲系列第一页| 久久久久国色av免费观看性色| 欧美高清视频看片在线观看 | 在线观看欧美日韩电影| 日本精品国语自产拍在线观看| 久久激情综合网| 久久精品无码人妻| 国产一区二区三区欧美| 国产麻豆一区二区三区| 69堂免费视频| 国产精品久久久久久久久免费相片 | 精品黑人一区二区三区观看时间| 欧美中文字幕一二三区视频| 亚洲无线看天堂av| 欧美日韩最好看的视频| 韩国理伦片一区二区三区在线播放| 国产一级片网址| 一个色综合导航| 国产精品调教视频| 亚洲精品视频三区| 欧美日韩在线看| 91精品久久久久久粉嫩|