精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

VLM 實現 10%的精度提高,13.1倍加速!紐約大學新算法讓視覺語言模型更小、更快、更準確

人工智能 新聞
視覺語言模型是人工智能領域的一項杰出成就,它賦予了AI像人一樣同時理解圖像和文字的能力。

紐約大學的研究團隊通過QSVD的新方法,讓視覺語言模型(VLM)實現了驚人的效率飛躍,在普通GPU上獲得了高達13.1倍的運行速度提升。

視覺語言模型是人工智能領域的一項杰出成就,它賦予了AI像人一樣同時理解圖像和文字的能力。

無論是讓AI看圖說話,進行生動的圖像描述,還是回答關于一張圖片內容的復雜問題,這些都離不開VLM的核心支持。

它就像是連接視覺世界和語言世界的橋梁,在醫療診斷、在線教育、互動娛樂等眾多領域展現出巨大的應用潛力。

然而,這種強大的能力背后,是巨大的計算代價。

VLM需要吞噬海量的數據,處理高維度的視覺與文本信息,這導致其模型體積龐大,內存占用極高,計算過程緩慢。

尤其是在模型進行推理,也就是生成答案或描述時,一個名為鍵值緩存(KV Cache)的機制會急劇消耗內存帶寬,成為拖慢整體速度的主要瓶頸。

這種高昂的硬件成本,極大地限制了VLM在普通設備,特別是手機、筆記本電腦等資源受限環境中的部署和應用。

為了讓這項技術真正走進千家萬戶,科學家們必須為這頭巨獸瘦身減負,在不犧牲其智慧的前提下,讓它變得更輕、更快。

奇思妙想:將Q、K、V三個矩陣捆綁處理

過去,研究者們嘗試了各種方法來壓縮模型,比如分組查詢注意力或多查詢注意力,思路主要是減少計算中的某些環節。

最近,DeepSeek-v3模型提出的多頭潛在注意力(MLA)提供了一個新穎的視角,它通過將KV緩存壓縮成更小的潛在向量,顯著提升了推理效率。

受到MLA的啟發,紐約大學的研究者們提出了一個更大膽的想法。

在VLM的核心組件多頭注意力(Multi-Head Attention)模塊中,輸入的信息會通過三個獨立的權重矩陣,分別變換成查詢(Query, Q)、鍵(Key, K)和值(Value, V)。

這三個元素是注意力機制的關鍵,決定了模型在處理信息時應該關注什么。

傳統的優化方法,通常是獨立地去壓縮處理Q、K、V各自的權重矩陣。這就像是三個獨立的優化任務,分別對三個部件進行改造。

而QSVD的核心創新在于,它不再將這三者分開看待。

研究團隊將原本獨立的三個大小為E×E的權重矩陣WQ、WK、WV,在邏輯上拼接成一個更寬的、大小為E×3E的聯合矩陣Wconcat。

然后,他們對這個拼接后的超級矩陣進行一次統一的奇異值分解(Singular Value Decomposition, SVD)。

SVD是一種經典的矩陣分解技術,可以理解為一種精密的數據壓縮手術。

它能將一個復雜的矩陣,分解為幾個更簡單、更小的矩陣相乘的形式,并自動找出原矩陣中最重要的特征信息,用一個對角矩陣中的奇異值來表示其重要性,數值越大的奇異值越重要。

通過保留那些最重要的奇異值,就可以用幾個小得多的矩陣來近似模擬原來的大矩陣,從而實現壓縮。

QSVD的這一步操作,帶來了立竿見影的好處。

在原始模型中(a, d),輸入數據X需要分別和WQ、WK、WV做三次矩陣乘法,計算成本高。同時,生成的KV緩存直接存儲完整的K和V向量,內存占用大。

如果像之前的方法那樣,分別對WQ、WK、WV做SVD(圖b, e),雖然也能壓縮權重,但在計算時,輸入X還是要分別和兩個不同的下投影矩陣相乘,生成兩個中間結果Ck和Cv并緩存起來。

而QSVD的方法(圖c, f)則優雅得多。

輸入X只需要和那個共享的下投影矩陣相乘一次,就能得到一個統一的中間結果。

結果在權重參數量、計算開銷(浮點運算次數FLOPs)和最關鍵的KV緩存大小這三個方面,都實現了顯著的降低。

為每個奇異值打出重要性得分

聯合SVD提供了一把鋒利的手術刀,但如何下刀,切除多少,才能既切除冗余,又不傷及模型的智慧,這是一個核心挑戰。

這個度的把握,就是如何為模型中所有注意力層的聯合矩陣,確定一個最優的截斷秩(rank)。

簡單粗暴地為所有層設置一個統一的秩,或者沿用過去基于費雪信息(Fisher Information)的分配方法,效果并不理想。

QSVD為此設計了一套更精細、更高效的秩分配策略。其核心思想是,直接量化每一個奇異值對模型最終準確率的貢獻度。

我們知道,一個矩陣的SVD分解可以看作是多個單秩分量的加和,每個分量由一個奇異值和其對應的左右奇異向量構成。截斷一個奇異值,就等于從原矩陣中移除了它所代表的那部分信息。

這個移除操作,必然會引起模型最終輸出的變化,從而導致訓練損失(Training Loss)的增加。QSVD的目標,就是找到那些移除后對損失函數影響最小的奇異值,將它們截斷。

首先對模型所有注意力層的QKV權重進行聯合SVD分解,得到所有的奇異值。

接著使用一小部分校準數據集(例如從ScienceQA中抽取256個樣本),計算出每一個奇異值對應的重要性評分。

然后QSVD執行一個關鍵的全局排序。它不再局限于單個注意力層,而是將模型中所有層的、所有奇異值放在一起,根據它們的重要性評分進行一個總排名。

最后設定一個總的秩預算k,只保留全局排名前k的那些最重要的奇異值,無論它們來自哪一層。其余的奇異值全部被截斷(設為0)。

這種全局最優的分配策略,確保了有限的秩資源被用在了刀刃上,保留了對模型性能最關鍵的組件,從而在最大化壓縮率的同時,將精度損失降到最低。

極致壓縮:為低秩模型引入可控的量化方案

經過聯合SVD和智慧秩分配,VLM已經變得苗條了許多。但QSVD的目標是極致的效率,于是它引入了量化(Quantization)。

量化,就是將模型中用高精度浮點數(如FP16)表示的權重和激活值,轉換為低精度的整數(如INT8甚至INT4)來存儲和計算。這能大幅減少內存占用和計算延遲,因為整數運算比浮點運算快得多。

然而,量化也是一把雙刃劍。這個過程必然會帶來精度損失,就像把3.14159近似成3一樣。特別是當數據分布中存在一些極端的大數值,即異常值(Outliers)時,量化誤差會急劇放大,嚴重損害模型性能。

研究者們分析了LLaVA-v1.5 13B模型的內部數據,發現無論是在注意力模塊還是前饋網絡中,輸入激活值X都存在非常嚴重的通道級異常值。

直接對這樣的數據進行量化,后果不堪設想。

為了解決這個問題,學術界已經有了一些成熟的方法,比如通過引入一個正交矩陣H進行旋轉,來平滑異常值的分布,同時保持模型的數學計算等價性。

但QSVD面對的情況更復雜,因為它的注意力架構已經被SVD改造過了。研究者們為此開發了一種與低秩SVD框架深度融合的量化方法。

最終,QSVD的量化方案,通過引入兩個正交矩陣H1和H2,以及一個可學習的參數β,成功地馴服了低秩VLM中的異常值,實現了從輸入、權重到中間結果的全鏈路低精度計算。

這使得模型在享受SVD帶來的結構性優化的同時,還能獲得量化帶來的存儲和計算雙重紅利,從而達到極致的硬件效率。

更低的成本,更高的精度

研究團隊在LLaVA-v1.5、LLaVA-Next和SmolVLM等多個主流視覺語言模型上,對QSVD進行了全面的評估。

為了公平對比,他們將QSVD與當前頂尖的SVD方法(如ASVD, SVD-LLM)和量化方法(如QuaRot, DuQuant, QVLM)進行了同臺競技。

評價的維度非常清晰:在相似甚至更低的硬件成本(用權重/計算壓縮率R1和KV緩存壓縮率R2來衡量)下,誰能保持更高的模型準確率。

首先,來看一下僅使用SVD壓縮(表示為QSVD-noQ)的效果。

QSVD-noQ的表現堪稱驚艷。在所有測試模型和數據集上,它都以最低的硬件成本,取得了超越ASVD和SVD-LLM的準確率。

在LLaVA-v1.5 13B模型上,QSVD-noQ在ScienceQA-IMG數據集上的準確率損失不到1%,幾乎與未壓縮的FP16模型持平。

在VizWiz數據集上,它甚至以46.7%的權重和17.5%的緩存,取得了超越原始模型2%的準確率。

這可能意味著低秩近似在某種程度上起到了正則化作用,有效地抑制了模型的幻覺(Hallucination)現象,讓回答更準確。

接下來,是SVD與量化雙管齊下的完整版QSVD的表演。

在W8A8(8位權重和8位激活)的溫和量化設置下,QSVD在大多數情況下都輕松勝出。

在LLaVA-1.5 13B這樣的大模型上,它幾乎達到了FP16基線的精度,而此時QKV的權重和計算量已經減半,KV緩存更是只有原始大小的18.75%。

當挑戰升級到W4A4的極限壓縮設置時,差距被進一步拉大。

其他方法,特別是QASVD,性能急劇下降,甚至完全失效(準確率變為0)。而QSVD依然堅挺,在所有模型上都保持了最高的性能,同時硬件成本依舊是最低的。

這些數據雄辯地證明了QSVD框架的先進性,它不僅僅是SVD和量化的簡單疊加,而是二者深度融合、協同優化的結晶。

最后,是延遲的實測。

研究者們在一臺配備12GB顯存的NVIDIA RTX 4070 GPU上測試了LLaVA-v1.5 7B模型的推理延遲,這代表了典型的消費級硬件環境。

結果令人振奮。由于顯存有限,原始的FP16模型和僅經過SVD壓縮的QSVD-noQ模型,都需要將一部分數據卸載到CPU內存中,導致速度緩慢。

即便如此,QSVD-noQ因為數據移動量更少,也實現了比基線最高2.1倍的加速。

而當應用了W8A8量化的完整版QSVD登場時,情況發生了質變。

由于模型和緩存被極致壓縮,它完全不需要CPU卸載,所有計算都在GPU上飛速完成,最終實現了高達13.1倍的驚人加速。

這意味著,曾經需要在昂貴服務器上才能流暢運行的大型視覺AI,現在有了在普通家用電腦甚至未來在移動設備上高效部署的可能。

QSVD通過其統一的QKV權重處理、智慧的秩分配策略和與低秩框架深度綁定的量化方案,為高成本的視覺語言模型指出了一條清晰的平民化之路。

這項工作為強大AI技術的普及和應用,掃清了一大障礙。

責任編輯:張燕妮 來源: AIGC開放社區
相關推薦

2020-05-03 13:52:27

深度學習開源人工智能

2024-11-19 13:17:38

視覺語言模型Pytorch人工智能

2010-10-12 13:57:43

GoogleWebP

2023-10-17 12:52:00

模型訓練

2025-07-14 09:14:00

2019-04-19 08:18:37

神經網絡數據圖形

2025-04-17 14:11:10

視覺AI模型

2024-12-13 15:53:58

VLM小型視覺語言模型LLM

2025-04-07 08:35:00

3DAI生成

2025-03-18 09:23:22

2018-11-26 14:56:15

云計算UCloud云主機

2024-06-06 11:54:35

2024-02-19 07:10:00

視覺模型

2025-10-14 10:03:11

CompLLMLLMRAG

2025-01-06 08:20:00

雷達AI生成

2019-06-06 10:19:33

谷歌開源計算庫

2025-02-03 10:04:47

擴散模型數據分布

2022-10-27 16:03:57

2025-06-30 08:25:00

智能體AI模型

2024-12-05 13:50:00

AI大模型
點贊
收藏

51CTO技術棧公眾號

国产欧美一区二区三区在线看蜜臀| 亚洲国产专区| 制服丝袜中文字幕一区| 欧美黄网在线观看| 天堂91在线| 麻豆精品国产传媒mv男同| 欧美成人国产va精品日本一级| 久久无码专区国产精品s| 在线最新版中文在线| 国产精品久久久一本精品| 99国产在线观看| 精品国产乱子伦| 伊人成综合网| 日韩精品在线观看网站| 九九精品久久久| 国产在线观看www| 综合久久国产九一剧情麻豆| 国产一区二区三区免费不卡| 在线观看中文字幕2021| 最新亚洲一区| 美女啪啪无遮挡免费久久网站| 97人妻天天摸天天爽天天| crdy在线观看欧美| 欧洲一区二区三区免费视频| 97在线国产视频| 天天影视久久综合| 久久蜜桃一区二区| 91午夜在线播放| 国产一级片av| 国产精品久久久久久久久久妞妞| 久久亚洲精品视频| 久久国产柳州莫菁门| 国产精品传媒| 日韩欧美一二三四区| 亚洲黄色小视频在线观看| 制服丝袜专区在线| 亚洲成人免费在线| 亚洲爆乳无码精品aaa片蜜桃| 丁香婷婷在线观看| 91蜜桃婷婷狠狠久久综合9色| 91中文字精品一区二区| 亚洲一区二区天堂| 免费人成在线不卡| 国产精品激情自拍| 无码人妻aⅴ一区二区三区有奶水| 欧美特黄一级| 欧美日韩国产123| www.5588.com毛片| 亚洲一区二区| 欧美精品亚州精品| 青草影院在线观看| 欧美午夜一区| 欧美华人在线视频| 精品在线免费观看视频| 国内精品美女在线观看| 欧美国产日本在线| 久久久久免费看| 亚洲国产91| 久久免费国产视频| 国产成人啪精品午夜在线观看| 欧美午夜一区| 久久久久久亚洲精品不卡| 国产一级免费av| 国产精品va| 国产+人+亚洲| 久久精品一二区| 亚洲欧美日韩国产综合精品二区| 91国内在线视频| 国产日本一区二区三区| 中文字幕你懂的| 麻豆精品一二三| 成人高h视频在线| 国产女主播福利| 成人夜色视频网站在线观看| 国精产品99永久一区一区| 性感美女视频一二三| 久久伊99综合婷婷久久伊| 日本一区二区久久精品| 调教视频免费在线观看| 依依成人精品视频| 欧美三级在线观看视频| 欧美成a人片在线观看久| 欧美日韩日本视频| 欧美日韩一区二区区| 开心激情综合| 在线精品91av| 免费又黄又爽又色的视频| 亚洲每日在线| 国产精品一二区| 精品国产亚洲AV| 99精品视频在线观看免费| 亚洲 日韩 国产第一区| 亚洲视频tv| 亚洲国产wwwccc36天堂| 91网址在线播放| 日韩一区二区三区精品| 日韩毛片在线观看| 女人18毛片毛片毛片毛片区二| 国产精品九九| 国产精品99蜜臀久久不卡二区| 国产精品久久久久久久久毛片 | 艳妇乳肉豪妇荡乳av无码福利| 韩国三级在线一区| 精品视频免费观看| 久久久久久国产精品免费无遮挡| 亚洲成a人片在线观看中文| 天堂中文视频在线| 99这里只有精品视频| 亚洲午夜女主播在线直播| 农村妇女精品一区二区| 日韩中文字幕区一区有砖一区| 91免费在线视频网站| 日本1级在线| 一区二区三区产品免费精品久久75| 久草青青在线观看| 亚洲国产中文在线| 一区二区三区精品99久久| 四虎成人精品永久免费av| 久热成人在线视频| 欧美日韩一区二区视频在线| 天堂av在线电影| 欧美日韩一区二区三区不卡| 91av在线免费| 国产精品mm| 91免费看片在线| 91在线看片| 欧美性猛交xxxx黑人猛交| 香蕉视频1024| 综合视频在线| 成人福利在线视频| www.久久热.com| 一本一道久久a久久精品| 精品一区二区三区四区五区六区| 午夜片欧美伦| 国产欧亚日韩视频| av影片免费在线观看| 欧美性高潮床叫视频| 成熟妇人a片免费看网站| 欧美二区不卡| 亚洲最大av网| 国产黄网站在线观看| 51精品国自产在线| 美国黄色片视频| 毛片基地黄久久久久久天堂| 日本一区视频在线| 美女网站视频一区| 亚洲无限av看| 在线视频精品免费| 国产欧美日韩综合精品一区二区| 国产在线观看福利| 久久99久久人婷婷精品综合| 啪一啪鲁一鲁2019在线视频| 色在线免费视频| 欧美性生交大片免网| 扒开jk护士狂揉免费| 男人的天堂亚洲| 欧美xxxx黑人又粗又长密月| 亚洲一区站长工具| 国产亚洲成精品久久| 这里只有精品999| 国产精品亲子伦对白| 亚欧激情乱码久久久久久久久| 成人看的视频| 成人亚洲激情网| av网站网址在线观看| 日韩欧美成人激情| 久久高清免费视频| 91色婷婷久久久久合中文| 男人揉女人奶房视频60分| 欧美三级情趣内衣| 91在线无精精品一区二区| 日本在线视频中文有码| 亚洲第一页自拍| 欧美超碰在线观看| 成人免费一区二区三区在线观看| 国产又粗又猛大又黄又爽| 精品动漫3d一区二区三区免费| 久久久综合亚洲91久久98| 色成人免费网站| 久久久成人的性感天堂| 日韩一卡二卡在线| 欧美性生活影院| www青青草原| 久久精品一级爱片| 久久成年人网站| 99国产精品| 午夜精品亚洲一区二区三区嫩草| 久久视频社区| 日本伊人精品一区二区三区介绍| 日本蜜桃在线观看| 亚洲精品国产精品国自产在线| 日韩手机在线视频| 亚洲免费在线视频一区 二区| 亚洲观看黄色网| 久99久精品视频免费观看| 91精品国产91久久久久麻豆 主演| 国内成人精品| 国产精品加勒比| 狠狠久久伊人中文字幕| 欧美黄色性视频| 97电影在线| 日韩精品高清在线观看| 国产精品欧美综合亚洲| 精品久久久久国产| 国产女人被狂躁到高潮小说| 久久精品人人做人人综合 | 日韩精品一区二区在线视频| 狠狠综合久久av一区二区蜜桃| av电影成人| 久久久久毛片| 日本久久中文字幕| 久操av在线| 久久精品国产91精品亚洲| 三级视频在线| 精品sm捆绑视频| aaa级黄色片| 欧美色图一区二区三区| www.毛片.com| 亚洲一区二区三区小说| 日本裸体美女视频| 久久精品欧美日韩| 国产人妻人伦精品1国产丝袜| 国产乱子伦视频一区二区三区| av免费网站观看| 亚洲欧美日韩国产一区| 岛国大片在线播放| 亚洲小说欧美另类婷婷| 91制片厂免费观看| 日韩国产一区二区| 日本午夜精品一区二区| 欧洲在线一区| 国模精品一区二区三区| 成人h动漫精品一区二区器材| 成人免费视频网| 色综合久久久| 国产日韩精品综合网站| jizzyou欧美16| 国产精品99久久99久久久二8| 一级毛片久久久| 欧美亚洲国产精品| 午夜裸体女人视频网站在线观看| 性色av一区二区三区免费| 欧美人体视频xxxxx| 欧美大片在线影院| 女囚岛在线观看| 九九久久综合网站| 国产蜜臀一区二区打屁股调教| 美日韩丰满少妇在线观看| 九七久久人人| 欧美日韩成人网| 免费影视亚洲| 欧美福利视频网站| √最新版天堂资源网在线| 久久琪琪电影院| 日韩欧美精品一区二区三区| 91av在线看| 欧洲av一区二区| 国产有码在线一区二区视频| 国产精品麻豆| 国产精品手机在线| 亚洲精品一级二级三级| 日本在线播放一区| 91精品精品| 青青在线视频免费观看| 最新日韩在线| 久久久久久久久久福利| 免费亚洲电影在线| 亚洲精品久久久久久| 成人免费高清视频在线观看| 午夜一区二区三区免费| 中文字幕不卡在线| 日日骚一区二区三区| 无吗不卡中文字幕| 日韩电影在线观看一区二区| 欧美日韩国产天堂| 亚洲精品字幕在线观看| 日韩激情片免费| a天堂中文在线| 欧美肥老妇视频| 日本韩国欧美| 91精品久久久久| 国产精品毛片久久久| 日韩欧美精品一区二区三区经典| 亚洲精品tv久久久久久久久久| 日本手机在线视频| 视频精品一区二区| 国产又粗又猛大又黄又爽| www国产亚洲精品久久麻豆| 国产又黄又粗又猛又爽的| 一区二区三区欧美亚洲| 一级做a爰片久久毛片| 欧美精品99久久久**| 污污视频在线免费看| 日日摸夜夜添一区| 成人bbav| 亚洲综合av影视| 精品国产午夜| 久艹视频在线免费观看| 久久爱www久久做| 亚洲国产精品无码久久久久高潮| 国产精品美日韩| 日本午夜精品理论片a级app发布| 欧美日韩1区2区| 日韩精品123| 欧美激情免费观看| 亚洲天堂网站| 日本亚洲自拍| 一区二区三区国产盗摄| 亚洲国产日韩在线一区| 国产亚洲欧美激情| 日韩xxxxxxxxx| 日韩西西人体444www| 在线观看麻豆| 欧美孕妇性xx| 米奇精品关键词| 草草草视频在线观看| 久久99精品久久久久| 成都免费高清电影| 欧美色播在线播放| 高潮毛片7777777毛片| 久久精品国产亚洲一区二区| 小黄鸭精品aⅴ导航网站入口| 国产一区二区三区四区五区加勒比| 国产精品7m凸凹视频分类| 人人爽人人av| 91美女视频网站| 日韩成人av毛片| 欧美成人bangbros| 91中文在线| 91精品在线观| 99久久综合| 五月婷婷六月合| 欧美激情一区二区| 波多野结衣二区三区| 亚洲欧美日韩在线一区| 在线视频cao| 免费精品视频一区| 亚洲影音一区| 国产精品815.cc红桃| 欧美性猛交xxx| 黄色毛片在线观看| 国产ts人妖一区二区三区 | 国产一区久久久| 97成人资源站| 日韩欧美亚洲一区二区| a毛片在线看免费观看| 99久久99久久精品国产片| 91精品综合| 免费黄色av网址| 亚洲成人在线观看视频| 手机亚洲第一页| 国产精品成人免费电影| 欧美丝袜一区| 在线看免费毛片| 亚洲免费av观看| 免费观看黄色一级视频| 97色在线观看免费视频| 亚洲精品动态| 日韩福利视频在线| 国产精品久久久久久户外露出| 国产又粗又猛又爽又黄的| 久久视频免费观看| 澳门成人av| 久久精品香蕉视频| 亚洲欧洲国产专区| 亚洲国产欧美另类| 欧美中文字幕在线| 久久国产成人午夜av影院宅| www,av在线| 午夜精品久久久久久不卡8050| 美女做暖暖视频免费在线观看全部网址91 | 欧美艳星brazzers| 成年视频在线观看| 久99久视频| 麻豆精品久久久| 久久久久久久蜜桃| 亚洲人成电影在线| 亚洲香蕉久久| 青青草视频在线免费播放| 国产三级精品三级| 精品国产黄色片| 茄子视频成人在线| 91超碰国产精品| 国产一级二级在线观看| 欧美亚洲尤物久久| 欧美极品少妇videossex| 欧美一区二区三区成人久久片| 久久精品国产第一区二区三区| 精品视频久久久久| 中文字幕精品在线视频| 99久久免费精品国产72精品九九| 久久精品99国产| 一区二区三区在线观看国产| 欧美日本网站| 99视频在线播放| 免费在线一区观看| 在线观看国产亚洲| 久久精品影视伊人网| 蜜桃视频欧美| 图片区偷拍区小说区|