精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

中國團隊首次奪魁!無問芯穹FlightVGM獲FPGA'25最佳論文,峰值算力超GPU21倍

人工智能 新聞
在大模型部署成本爭議甚囂塵上的產業背景下,以 FPGA、ASIC 等靈活可編程硬件和專用任務集成電路來提升硬件運行效率,或將成為大模型落地效率提升與成本降低的最關鍵一環。

國際可重構計算領域頂級會議 ——FPGA 2025 在落幕之時傳來消息,今年的最佳論文頒發給了無問芯穹和上交、清華共同提出的視頻生成大模型推理 IP 工作 FlightVGM,這是 FPGA 會議首次將該獎項授予完全由中國大陸科研團隊主導的研究工作,同時也是亞太國家團隊首次獲此殊榮。

這項工作首次在 FPGA 上實現了視頻生成模型(Video Generation Models, VGMs)的高效推理,也是該團隊繼去年在 FPGA 上加速大語言模型 FlightLLM(FPGA’24)后的最新系列工作。與 NVIDIA 3090 GPU 相比,FlightVGM 在 AMD V80 FPGA 上實現了 1.30 倍的性能提升與 4.49 倍的能效提升(峰值算力差距超過 21 倍)。

論文鏈接:https://dl.acm.org/doi/10.1145/3706628.3708864

論文第一作者劉軍是上海交通大學博士生,共同一作曾書霖是清華大學博士后,通訊作者是汪玉和戴國浩。汪玉是 IEEE Fellow、清華大學電子工程系教授、系主任和無問芯穹發起人,戴國浩是上海交通大學副教授、無問芯穹聯合創始人兼首席科學家。

上一輪清華電子系相關工作被 FPGA 國際會議收錄應追溯到 2016 年的 Going Deeper with Embedded FPGA Platform for Convolutional Neural Network 與 2017 年 ESE: Efficient Speech Recognition Engine with Sparse LSTM on FPGA。前者催化了深鑒科技的創立,后者被 FPGA 國際會議評為當年唯一的最佳論文,隨后深鑒科技于 2018 年被可編程芯片廠商賽靈思以 3 億美元收購。

在大模型部署成本爭議甚囂塵上的產業背景下,以 FPGA、ASIC 等靈活可編程硬件和專用任務集成電路來提升硬件運行效率,或將成為大模型落地效率提升與成本降低的最關鍵一環。2024 年,無問芯穹曾以大語言模型定制推理 IP FlightLLM 被 FPGA 高評價錄取,今年再次以 VGM 模型定制推理 IP FlightVGM 拿下最佳論文獎,都是在通過創新硬件架構提升效率。據悉,這一系列研究成果現已被集成到無問芯穹自研大模型推理 IP LPU(Large-model Processing Unit)之中,并已與合作伙伴開展合作驗證。

下面是論文的核心內容解讀。

背景

在視頻生成領域,擴散 Transformer(DiT)逐漸成為一種重要的框架。DiT 模型通過一個擴散過程生成視頻,它將噪聲圖像逐步恢復為清晰的視頻幀,從而展現了強大的生成能力。最初,DiT 被提出是為了探索在大規模數據處理中的可擴展性,隨著技術的不斷發展,DiT 的架構也不斷被優化,逐步提高了生成視頻的質量和分辨率,使得生成的視頻更加清晰、精細。盡管如此,這種方法的計算需求非常高,尤其是在生成高分辨率和較長時長的視頻時,所需的計算量和內存消耗大幅增加,因此如何提升生成效率并優化計算過程,成為該領域的關鍵問題之一。

核心見解:從視頻壓縮到視頻生成

視頻壓縮技術(如 H.264、H.265)通過離散余弦變換(DCT)等技術,識別并消除視頻幀間和幀內的冗余信息,從而實現高達 1000 倍的壓縮率。這一思想的核心在于,視頻數據在時間和空間維度上存在大量重復模式,例如相鄰幀之間的背景幾乎不變,或同一幀內的紋理具有高度相似性。通過檢測并跳過這些冗余信息,壓縮算法能夠顯著減少數據量,同時保持視頻質量。

FlightVGM 創新性地將這一思想引入視頻生成模型的加速中。視頻生成模型(VGMs)在推理過程中同樣表現出顯著的時空冗余性。例如,相鄰幀之間的 Token 在語義上高度相似,而同一幀內的不同區域也可能共享相同的視覺特征。然而,現有 GPU 架構無法充分利用這種冗余性。FPGA 雖然具備稀疏計算的優勢,但其峰值算力遠低于 GPU,且其計算單元(例如 V80 的 DSP58)的傳統設計無法動態適配混合精度需求,限制了其在視頻生成加速中的應用。FlightVGM 通過以下三項技術,解決上述挑戰:

1.“時間 - 空間” 激活值在線稀疏化方法:基于視頻壓縮中的相似性檢測思想,FlightVGM 設計了幀間和幀內的冗余激活稀疏機制。通過余弦相似度計算,動態跳過相似部分計算,顯著降低了計算負載。

2.“浮點 - 定點” 混合精度 DSP58 拓展架構:借鑒視頻壓縮中的分塊處理思想,FlightVGM 對視頻生成模型的不同模塊進行精度分層處理。關鍵模塊(如注意力機制)保留 FP16 精度,非關鍵模塊(如線性層)量化至 INT8,最大化硬件利用率。

3.“動態 - 靜態” 自適應調度策略:針對激活值在線稀疏化導致的負載不均衡問題,FlightVGM 針對實際工作負載自適應調整不同操作負載的執行順序,從而提高計算利用率。

技術要點

“時間 - 空間” 激活值在線稀疏方法

我們提出了一種 “時間 - 空間” 激活值在線稀疏化方法,同時考慮了幀間和幀內的相似性。激活稀疏化的核心思想是:如果兩個 token 之間具有高度相似性,則可以只計算其中一個 token,并將結果共享給另一個 token。具體來說,輸入激活是一個 3 維張量,由 tokenizer 從噪聲視頻中處理得到。因此,輸入激活可以表示為,其中 F 表示幀數,T 表示每幀的 token 數,d 表示隱藏維度。為了簡便起見,我們用 () 來表示第 1 幀的第 1 個 token。對于輸入激活,我們使用來表示參考向量和輸入向量。我們使用余弦相似度作為度量標準。

激活稀疏化包含兩個步驟:幀間稀疏化和幀內稀疏化。

1. 幀間稀疏化:我們將輸入激活分為 G 個連續的組,并選擇中間幀作為參考幀。剩余幀的 token 與參考幀的 token 逐一計算相似度,若超過閾值,則使用參考幀的 token 計算結果替代當前 token。

2. 幀內稀疏化:我們將每幀的 token 分為 K 個塊,選擇中間 token 作為參考 token,計算其他 token 與參考 token 的相似度,若超過閾值則用參考 token 替代計算。如果某 token 已在幀間稀疏化中被裁剪,其相似度為 0。

從計算角度來看,相似度計算需要進行一次內積和兩次模長計算,因此其計算量為 3d,其中 d 為隱藏維度。以一個線性操作為例,假設輸入激活的大小為,權重矩陣 W 的大小為,則原始操作的計算量為。對于稀疏操作,考慮幀間和幀內稀疏化帶來的額外計算,假設稀疏度為 s,則稀疏操作的總計算量為:

由于原始計算量包含了 d 的二次項,而稀疏化帶來的額外計算只是 d 的線性項(典型值 d=1152),因此稀疏化引入的額外開銷幾乎可以忽略不計。

“浮點 - 定點” 混合精度 DSP58 拓展架構

AMD V80 FPGA 配備了硬件 IP DSP58,支持多種計算模式,如標量、向量和浮點配置。然而,由于這些配置之間無法在運行時進行動態切換,這與視頻生成模型對數據的混合精度的需求存在沖突,導致我們無法充分利用 DSP58 的計算潛力。

為了解決這一問題,我們提出了基于 DSP58 的創新性 FP16-INT8 混合精度硬件架構 ——DSP-Expansion (DSP-E)。該架構允許在運行時配置,支持兩個 FP16 乘加單元(MAC)或四個 INT8 乘加單元。我們的核心思路是通過引入額外的乘法器來解決當一個 DSP58 執行兩個 FP16 分數乘法時的數據混淆問題,這些乘法器在 INT8 模式下也可以復用。在 FP16 模式下,DSP58 執行兩個 MAC 的分數乘法,并通過減去 INT8 乘法器的結果來獲得正確的中間計算結果。中間結果的指數部分通過 INT 加法器計算,并通過指數對齊和調整單元對齊小數點位置,最終通過加法、歸一化和四舍五入得到最終結果。在 INT8 模式下,DSP-E 通過復用 DSP58、兩個 INT8 乘法器和兩個 INT 加法器,最大化計算性能。通過將相關數據輸入到不同的端口,額外的邏輯單元可以復用硬件資源,從而有效地提高了計算吞吐量。

為了在計算精度和硬件資源的約束下實現最大吞吐量,我們提出了一個異構的 DSP58 陣列設計,以適應不同的計算需求。我們根據不同設計的資源消耗(包括 DSP、LUT、REG、RAM 等)進行評估,并通過資源約束來確保最優計算性能。此外,我們還考慮了 INT8 與 FP16 計算性能的比值,以衡量計算能力的提升。

實驗結果

算法評估

與基準模型相比,FlightVGM 對于模型精度的影響幾乎可以忽略(僅平均損失為 0.008),而使用全 INT8 量化時,平均損失為 0.042。同時,在實際視頻生成效果上,FlightVGM 生成的視頻與原始模型仍有較好的保持。

性能評估

對于 NVIDIA 3090 GPU,在 FP16 精度下,AMD V80 FPGA 的峰值算力差距超過了 21 倍。然而,基于 V80 FPGA 實現的 FlightVGM 仍在性能和能效上超過了 GPU。這是因為 FlightVGM 充分利用了 VGM 固有的稀疏相似性和混合精度數據分布特性,并通過軟硬件協同開辟了 “算法 - 軟件 - 硬件” 的全新優化空間并成功在其中找到了一個足夠好的解。而 GPU 由于硬件架構的限制,難以達到相同的加速效果,且缺乏稀疏化和定制化計算數據流優化的支持。

展望和未來工作

隨著 VGM 計算需求的增長,FlightVGM 展示了如何通過 FPGA 的軟硬件協同創新,實現更高能效的文生視頻大模型推理。未來,通過探索 AIE(AI Engine)+ HBM(High Bandwidth Memory)的全新 FPGA 架構,FPGA 有望為視頻生成任務提供更高效的計算支持,成為未來計算平臺的重要選擇。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-01-23 12:30:00

2024-01-10 17:13:42

模型數據

2024-11-08 15:00:00

AI模型

2020-06-24 14:00:10

富岳奪魁

2017-11-17 09:34:00

2025-08-01 09:14:00

2023-11-10 12:53:35

論文AI

2022-08-29 14:44:09

特斯拉芯片

2018-07-20 09:01:39

2020-07-03 15:19:04

AI 數據人工智能

2013-01-10 16:32:20

用友

2019-05-15 10:42:26

超算芯片計算機
點贊
收藏

51CTO技術棧公眾號

91国产视频在线播放| 91精品婷婷国产综合久久| 久久爱av电影| 国产99免费视频| 久久婷婷蜜乳一本欲蜜臀| 91精品婷婷国产综合久久| 欧洲精品在线播放| 黄色软件在线| 国产精品一区久久久久| 欧美一级免费看| 神马久久精品综合| 台湾亚洲精品一区二区tv| 欧美猛男gaygay网站| a级黄色小视频| 91在线导航| 成人av资源站| 91久久久久久久| 中文字幕一区二区人妻视频| 这里只有精品在线| 亚洲午夜色婷婷在线| 日本中文字幕精品| 成人在线不卡| 欧美日韩在线视频观看| 欧美日韩亚洲国产成人| 久青草国产在线| youjizz久久| 91久久在线观看| 国产suv精品一区二区33| 黄色精品免费| 久久国产精品偷| a级黄色免费视频| 香蕉人人精品| 亚洲国产精品高清久久久| 亚洲综合欧美激情| 国产另类xxxxhd高清| 亚洲第一激情av| www.一区二区.com| 黄色精品免费看| 国产精品区一区二区三| 美日韩精品免费| 日本xxxxxwwwww| 国产成人av在线影院| 国产欧美日韩高清| 最近中文在线观看| 三级久久三级久久| 日本人成精品视频在线| 99久在线精品99re8热| 欧美日韩18| 精品综合久久久久久97| 二区三区四区视频| 91视频综合| xxx成人少妇69| 四虎永久免费地址| 五月天久久网站| y97精品国产97久久久久久| 欧美亚洲色综久久精品国产| 欧美日韩第一| 中文字幕在线精品| 国产极品视频在线观看| 欧美另类69xxxxx| 色妞一区二区三区| 久久国产波多野结衣| 91精品一区二区三区综合| 日韩在线观看免费网站 | 中文国产成人精品| 日韩免费成人av| 日韩精品免费| 久久天天躁狠狠躁夜夜躁| 国内偷拍精品视频| 激情成人亚洲| 欧美亚洲视频在线看网址| 天堂а√在线中文在线新版| 美女尤物久久精品| 国产精品高精视频免费| 一区二区三区午夜| 国产在线精品一区二区三区不卡| 91久久国产综合久久蜜月精品| 国产www视频| 本田岬高潮一区二区三区| 久久国产精品久久精品国产| 国产黄在线看| 亚洲欧洲精品成人久久奇米网| 狠狠干视频网站| 欧美久久天堂| 欧美日韩综合色| 亚洲女人在线观看| 免费日韩一区二区三区| 少妇激情综合网| 国产av无码专区亚洲av毛网站 | 国产97在线 | 亚洲| 成人啊v在线| 欧美一区二区三区四区在线观看| 国产视频精品视频| 精品日本12videosex| 裸体女人亚洲精品一区| 亚洲天堂日韩av| 青草国产精品久久久久久| 69堂成人精品视频免费| 日韩av地址| 亚洲黄色尤物视频| 日本三级免费观看| 成人豆花视频| 亚洲人高潮女人毛茸茸| 国产一二三区精品| 久热精品在线| 成人免费在线一区二区三区| 二区三区在线| 亚洲成av人综合在线观看| 奇米影视四色在线| 欧美变态挠脚心| 久久国产精品久久久久久久久久 | 久久精品系列| 99九九视频| 欧洲成人av| 一区二区三区产品免费精品久久75| 欧美日韩一区二区在线免费观看| 久久影院一区二区三区| 国产一区二区精品丝袜| 尤物视频在线观看国产| 久久99在线观看| 欧美日韩日本网| 免费网站在线观看人| 欧美性xxxxxxxx| 中国黄色a级片| 伊人激情综合| 成人av片网址| 超碰免费在线播放| 欧美日韩视频不卡| 亚洲精品成人无码熟妇在线| 亚洲视频狠狠| 亚洲自拍偷拍第一页| 97视频在线观看网站| 91黄色免费网站| 国产黄色网址在线观看| 亚洲美女视频在线免费观看 | www日本高清| 一区在线观看免费| 日本在线一二三区| 国产日产一区| 国产精品69av| 激情福利在线| 一本久道中文字幕精品亚洲嫩| 99精品一区二区三区无码吞精| 亚洲精品午夜av福利久久蜜桃| 国产精品日日做人人爱| 大片免费播放在线视频| 色综合 综合色| 久久久亚洲av波多野结衣| 国产欧美一级| 精品国产一区二区三区麻豆小说| japanese色国产在线看视频| 日韩欧美综合一区| 久久久国产精品黄毛片| 成人动漫在线一区| 91九色丨porny丨国产jk| 丁香一区二区| 97视频网站入口| 青梅竹马是消防员在线| 色噜噜久久综合| 欧美人与禽zoz0善交| 老司机精品视频在线| 亚洲精品一区二区三区蜜桃久 | 国产日韩一区二区三区在线播放| 国产另类自拍| 亚洲天堂导航| 中文字幕无线精品亚洲乱码一区 | 一区二区三区美女xx视频| japanese国产在线观看| 国产精品久线观看视频| 热久久久久久久久| 欧美激情1区2区| 国产在线欧美日韩| 欧美aa在线| 国产亚洲精品久久久久久777| 亚洲国产av一区二区三区| 国产精品卡一卡二| 一区二区三区人妻| 亚洲精品影院在线观看| 日本精品一区二区| 日韩电影精品| 久久久久久久久久久人体 | 欧美影院精品| 91精品91久久久久久| 你懂的在线观看视频网站| 欧美在线制服丝袜| 国产这里有精品| 99re热视频这里只精品| 蜜臀一区二区三区精品免费视频| 欧美a级一区| 欧美极品一区| 亚洲一区有码| 欧美一乱一性一交一视频| 亚洲成人影院麻豆| 亚洲精品在线免费观看视频| 无码人妻精品一区二区50| 亚洲欧美韩国综合色| 爱爱的免费视频| 国产在线精品一区二区夜色 | 免费观看在线色综合| 黄色一级视频播放| 国产伦精品一区二区三区免费优势| 国产成人精品日本亚洲专区61| 米奇777四色精品人人爽| 亚洲福利视频二区| 亚洲天堂中文字幕在线| 婷婷国产v国产偷v亚洲高清| 久久嫩草捆绑紧缚| 久久亚洲一区二区三区明星换脸 | 亚洲男人天堂网址| 亚洲伊人伊色伊影伊综合网| 亚洲一级片在线播放| 99视频在线观看一区三区| 国产欧美一区二| 久久一二三区| 国内自拍在线观看| 午夜性色一区二区三区免费视频| 日韩国产一区久久| 国产一区丝袜| 96sao精品视频在线观看| 亚洲承认视频| 奇米一区二区三区四区久久| 欧美xxxx黑人又粗又长| 久久精品国产视频| eeuss影院www在线播放| 亚洲精品一区在线观看香蕉| 欧美一级在线免费观看| 91精品免费在线观看| 欧美特级黄色片| 黑人精品xxx一区| 久久亚洲av午夜福利精品一区| 亚洲欧洲av在线| 青青操在线播放| 国产精品美女久久久久久久久久久 | 欧美精品在欧美一区二区| 99久久.com| 亚洲午夜精品久久久久久浪潮| 最近国产精品视频| 欧美二区在线看| 亚洲日产av中文字幕| 久草精品电影| 天天躁日日躁成人字幕aⅴ| 国内成+人亚洲| 精品久久97| 国产综合第一页| 人人香蕉久久| 免费一区二区三区| 九九免费精品视频在线观看| 免费在线观看一区二区| 亚洲动漫在线观看| 日韩免费av电影| 成人在线免费观看视频| 亚洲精品乱码视频| 亚洲成人精品| 日本福利视频网站| 亚洲精品社区| 女人天堂av手机在线| 亚洲综合不卡| 91在线视频观看免费| 另类综合日韩欧美亚洲| 午夜av中文字幕| 国产福利一区二区| 制服丝袜第一页在线观看| 91丝袜国产在线播放| 天堂在线中文视频| rebdb初裸写真在线观看| 亚洲国产精品久久久久秋霞不卡| 少妇高潮久久久| 日韩精品久久久久久久玫瑰园 | 97se亚洲国产综合自在线观| 欧美图片一区二区| 国产精品毛片无遮挡高清| 女人18毛片毛片毛片毛片区二 | 大桥未久av一区二区三区中文| 欧美69精品久久久久久不卡| 波多野结衣中文字幕一区二区三区 | 99国产精品视频免费观看| 亚洲国产欧美视频| 中文字幕一区二区在线播放| 欧美性猛交xxxxx少妇| 亚洲mv在线观看| 这里只有久久精品视频| 欧美日本一区二区在线观看| 超碰在线人人干| 亚洲欧美中文字幕在线一区| 欧美激情午夜| 久久久久久国产精品美女| 欧美福利在线播放| 91嫩草在线| 国产成人精品999在线观看| 超碰成人在线免费观看| 亚洲国产一区二区三区高清 | 在线精品免费视| 91精品国产色综合久久| 日韩av视屏| 欧美高清无遮挡| 日韩欧美少妇| 肥熟一91porny丨九色丨| 欧美**vk| 国产一区二区四区| 美女视频免费一区| 波多野结衣先锋影音| 成人免费小视频| 成人免费看片98欧美| 这里只有精品99re| 免费动漫网站在线观看| 欧美日韩国产成人在线| 成人国产激情| 欧美xxxx黑人又粗又长密月| 在线电影一区二区| 在线看的黄色网址| 91一区二区三区在线观看| 9999热视频| 欧美日韩视频第一区| 免费一级在线观看播放网址| 久久男人资源视频| 久久久91麻豆精品国产一区| 视频在线99| 亚久久调教视频| 国产免费一区二区三区最新6| 亚洲欧洲综合另类在线| 黄色一区二区视频| 亚洲精品视频在线观看视频| xxx性欧美| 2014亚洲精品| 在线观看免费一区二区| 欧美美女性视频| 中文字幕乱码日本亚洲一区二区| 久久久久久久久久影院| 亚洲第一精品电影| 欧美videosex性极品hd| 91精品视频免费观看| 91欧美在线| 亚洲国产成人va在线观看麻豆| 久久九九影视网| 91久久国产综合久久91| 亚洲美女福利视频网站| 在线观看涩涩| 久久精品综合一区| 六月婷婷一区| 欧美老熟妇乱大交xxxxx| 狠狠躁夜夜躁久久躁别揉| 五月婷婷免费视频| 91av在线免费观看视频| 欧美做受69| 成熟老妇女视频| 久久精品一区蜜桃臀影院| 激情五月婷婷网| 在线日韩欧美视频| 日韩护士脚交太爽了| 2025韩国大尺度电影| 国产在线一区观看| 欧美黑人一级片| 亚洲第一黄色网| 欧美成人资源| 亚洲国产午夜伦理片大全在线观看网站| 日韩精品高清不卡| 妖精视频在线观看免费| 欧美裸体bbwbbwbbw| 黄色视屏免费在线观看| 亚洲综合成人婷婷小说| 黄色成人在线网站| 日本黄色特级片| 欧美三区在线观看| 精精国产xxxx视频在线| 99超碰麻豆| 国产精品毛片| 国产伦精品一区二区三区视频女| 欧美三级在线视频| 羞羞电影在线观看www| 国产乱码精品一区二区三区中文| 媚黑女一区二区| 日本不卡一区视频| 日韩免费电影网站| 国模套图日韩精品一区二区| 亚洲欧美日韩不卡一区二区三区| 国产一区91精品张津瑜| 国产精品99精品无码视| 亚洲欧美日韩爽爽影院| 亚洲色图图片| 丝袜老师办公室里做好紧好爽 | 国产精品99久久久久久宅男| 国产精品suv一区二区69| 国产亚洲欧美一区| 日韩在线视频一区二区三区| 日韩精品xxxx| 亚洲欧美中日韩| 色欲av伊人久久大香线蕉影院| 国产精品成人va在线观看| 欧美91福利在线观看| 亚洲精品理论片| 日韩久久精品一区| 日韩性xxx| 日韩精品久久一区二区| 国产色爱av资源综合区| 性中国xxx极品hd| 国产精品日韩在线一区| 亚洲黄色av| 天天综合天天做| 亚洲视频在线观看免费| 极品束缚调教一区二区网站|