精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

<del id="asgks"></del>

<strike id="asgks"><rt id="asgks"></rt></strike>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

賬號設置退出

VLM 實現 10%的精度提高，13.1倍加速！紐約大學新算法讓視覺語言模型更小、更快、更準確

2025-11-18 08:50:54

人工智能新聞

視覺語言模型是人工智能領域的一項杰出成就，它賦予了AI像人一樣同時理解圖像和文字的能力。

紐約大學的研究團隊通過QSVD的新方法，讓視覺語言模型（VLM）實現了驚人的效率飛躍，在普通GPU上獲得了高達13.1倍的運行速度提升。

視覺語言模型是人工智能領域的一項杰出成就，它賦予了AI像人一樣同時理解圖像和文字的能力。

無論是讓AI看圖說話，進行生動的圖像描述，還是回答關于一張圖片內容的復雜問題，這些都離不開VLM的核心支持。

它就像是連接視覺世界和語言世界的橋梁，在醫療診斷、在線教育、互動娛樂等眾多領域展現出巨大的應用潛力。

然而，這種強大的能力背后，是巨大的計算代價。

VLM需要吞噬海量的數據，處理高維度的視覺與文本信息，這導致其模型體積龐大，內存占用極高，計算過程緩慢。

尤其是在模型進行推理，也就是生成答案或描述時，一個名為鍵值緩存（KV Cache）的機制會急劇消耗內存帶寬，成為拖慢整體速度的主要瓶頸。

這種高昂的硬件成本，極大地限制了VLM在普通設備，特別是手機、筆記本電腦等資源受限環境中的部署和應用。

為了讓這項技術真正走進千家萬戶，科學家們必須為這頭巨獸瘦身減負，在不犧牲其智慧的前提下，讓它變得更輕、更快。

奇思妙想：將Q、K、V三個矩陣捆綁處理

過去，研究者們嘗試了各種方法來壓縮模型，比如分組查詢注意力或多查詢注意力，思路主要是減少計算中的某些環節。

最近，DeepSeek-v3模型提出的多頭潛在注意力（MLA）提供了一個新穎的視角，它通過將KV緩存壓縮成更小的潛在向量，顯著提升了推理效率。

受到MLA的啟發，紐約大學的研究者們提出了一個更大膽的想法。

在VLM的核心組件多頭注意力（Multi-Head Attention）模塊中，輸入的信息會通過三個獨立的權重矩陣，分別變換成查詢（Query, Q）、鍵（Key, K）和值（Value, V）。

這三個元素是注意力機制的關鍵，決定了模型在處理信息時應該關注什么。

傳統的優化方法，通常是獨立地去壓縮處理Q、K、V各自的權重矩陣。這就像是三個獨立的優化任務，分別對三個部件進行改造。

而QSVD的核心創新在于，它不再將這三者分開看待。

研究團隊將原本獨立的三個大小為E×E的權重矩陣WQ、WK、WV，在邏輯上拼接成一個更寬的、大小為E×3E的聯合矩陣Wconcat。

然后，他們對這個拼接后的超級矩陣進行一次統一的奇異值分解（Singular Value Decomposition, SVD）。

SVD是一種經典的矩陣分解技術，可以理解為一種精密的數據壓縮手術。

它能將一個復雜的矩陣，分解為幾個更簡單、更小的矩陣相乘的形式，并自動找出原矩陣中最重要的特征信息，用一個對角矩陣中的奇異值來表示其重要性，數值越大的奇異值越重要。

通過保留那些最重要的奇異值，就可以用幾個小得多的矩陣來近似模擬原來的大矩陣，從而實現壓縮。

QSVD的這一步操作，帶來了立竿見影的好處。

在原始模型中（a, d），輸入數據X需要分別和WQ、WK、WV做三次矩陣乘法，計算成本高。同時，生成的KV緩存直接存儲完整的K和V向量，內存占用大。

如果像之前的方法那樣，分別對WQ、WK、WV做SVD（圖b, e），雖然也能壓縮權重，但在計算時，輸入X還是要分別和兩個不同的下投影矩陣相乘，生成兩個中間結果Ck和Cv并緩存起來。

而QSVD的方法（圖c, f）則優雅得多。

輸入X只需要和那個共享的下投影矩陣相乘一次，就能得到一個統一的中間結果。

結果在權重參數量、計算開銷（浮點運算次數FLOPs）和最關鍵的KV緩存大小這三個方面，都實現了顯著的降低。

為每個奇異值打出重要性得分

聯合SVD提供了一把鋒利的手術刀，但如何下刀，切除多少，才能既切除冗余，又不傷及模型的智慧，這是一個核心挑戰。

這個度的把握，就是如何為模型中所有注意力層的聯合矩陣，確定一個最優的截斷秩（rank）。

簡單粗暴地為所有層設置一個統一的秩，或者沿用過去基于費雪信息（Fisher Information）的分配方法，效果并不理想。

QSVD為此設計了一套更精細、更高效的秩分配策略。其核心思想是，直接量化每一個奇異值對模型最終準確率的貢獻度。

我們知道，一個矩陣的SVD分解可以看作是多個單秩分量的加和，每個分量由一個奇異值和其對應的左右奇異向量構成。截斷一個奇異值，就等于從原矩陣中移除了它所代表的那部分信息。

這個移除操作，必然會引起模型最終輸出的變化，從而導致訓練損失（Training Loss）的增加。QSVD的目標，就是找到那些移除后對損失函數影響最小的奇異值，將它們截斷。

首先對模型所有注意力層的QKV權重進行聯合SVD分解，得到所有的奇異值。

接著使用一小部分校準數據集（例如從ScienceQA中抽取256個樣本），計算出每一個奇異值對應的重要性評分。

然后QSVD執行一個關鍵的全局排序。它不再局限于單個注意力層，而是將模型中所有層的、所有奇異值放在一起，根據它們的重要性評分進行一個總排名。

最后設定一個總的秩預算k，只保留全局排名前k的那些最重要的奇異值，無論它們來自哪一層。其余的奇異值全部被截斷（設為0）。

這種全局最優的分配策略，確保了有限的秩資源被用在了刀刃上，保留了對模型性能最關鍵的組件，從而在最大化壓縮率的同時，將精度損失降到最低。

極致壓縮：為低秩模型引入可控的量化方案

經過聯合SVD和智慧秩分配，VLM已經變得苗條了許多。但QSVD的目標是極致的效率，于是它引入了量化（Quantization）。

量化，就是將模型中用高精度浮點數（如FP16）表示的權重和激活值，轉換為低精度的整數（如INT8甚至INT4）來存儲和計算。這能大幅減少內存占用和計算延遲，因為整數運算比浮點運算快得多。

然而，量化也是一把雙刃劍。這個過程必然會帶來精度損失，就像把3.14159近似成3一樣。特別是當數據分布中存在一些極端的大數值，即異常值（Outliers）時，量化誤差會急劇放大，嚴重損害模型性能。

研究者們分析了LLaVA-v1.5 13B模型的內部數據，發現無論是在注意力模塊還是前饋網絡中，輸入激活值X都存在非常嚴重的通道級異常值。

直接對這樣的數據進行量化，后果不堪設想。

為了解決這個問題，學術界已經有了一些成熟的方法，比如通過引入一個正交矩陣H進行旋轉，來平滑異常值的分布，同時保持模型的數學計算等價性。

但QSVD面對的情況更復雜，因為它的注意力架構已經被SVD改造過了。研究者們為此開發了一種與低秩SVD框架深度融合的量化方法。

最終，QSVD的量化方案，通過引入兩個正交矩陣H1和H2，以及一個可學習的參數β，成功地馴服了低秩VLM中的異常值，實現了從輸入、權重到中間結果的全鏈路低精度計算。

這使得模型在享受SVD帶來的結構性優化的同時，還能獲得量化帶來的存儲和計算雙重紅利，從而達到極致的硬件效率。

更低的成本，更高的精度

研究團隊在LLaVA-v1.5、LLaVA-Next和SmolVLM等多個主流視覺語言模型上，對QSVD進行了全面的評估。

為了公平對比，他們將QSVD與當前頂尖的SVD方法（如ASVD, SVD-LLM）和量化方法（如QuaRot, DuQuant, QVLM）進行了同臺競技。

評價的維度非常清晰：在相似甚至更低的硬件成本（用權重/計算壓縮率R1和KV緩存壓縮率R2來衡量）下，誰能保持更高的模型準確率。

首先，來看一下僅使用SVD壓縮（表示為QSVD-noQ）的效果。

QSVD-noQ的表現堪稱驚艷。在所有測試模型和數據集上，它都以最低的硬件成本，取得了超越ASVD和SVD-LLM的準確率。

在LLaVA-v1.5 13B模型上，QSVD-noQ在ScienceQA-IMG數據集上的準確率損失不到1%，幾乎與未壓縮的FP16模型持平。

在VizWiz數據集上，它甚至以46.7%的權重和17.5%的緩存，取得了超越原始模型2%的準確率。

這可能意味著低秩近似在某種程度上起到了正則化作用，有效地抑制了模型的幻覺（Hallucination）現象，讓回答更準確。

接下來，是SVD與量化雙管齊下的完整版QSVD的表演。

在W8A8（8位權重和8位激活）的溫和量化設置下，QSVD在大多數情況下都輕松勝出。

在LLaVA-1.5 13B這樣的大模型上，它幾乎達到了FP16基線的精度，而此時QKV的權重和計算量已經減半，KV緩存更是只有原始大小的18.75%。

當挑戰升級到W4A4的極限壓縮設置時，差距被進一步拉大。

其他方法，特別是QASVD，性能急劇下降，甚至完全失效（準確率變為0）。而QSVD依然堅挺，在所有模型上都保持了最高的性能，同時硬件成本依舊是最低的。

這些數據雄辯地證明了QSVD框架的先進性，它不僅僅是SVD和量化的簡單疊加，而是二者深度融合、協同優化的結晶。

最后，是延遲的實測。

研究者們在一臺配備12GB顯存的NVIDIA RTX 4070 GPU上測試了LLaVA-v1.5 7B模型的推理延遲，這代表了典型的消費級硬件環境。

結果令人振奮。由于顯存有限，原始的FP16模型和僅經過SVD壓縮的QSVD-noQ模型，都需要將一部分數據卸載到CPU內存中，導致速度緩慢。

即便如此，QSVD-noQ因為數據移動量更少，也實現了比基線最高2.1倍的加速。

而當應用了W8A8量化的完整版QSVD登場時，情況發生了質變。

由于模型和緩存被極致壓縮，它完全不需要CPU卸載，所有計算都在GPU上飛速完成，最終實現了高達13.1倍的驚人加速。

這意味著，曾經需要在昂貴服務器上才能流暢運行的大型視覺AI，現在有了在普通家用電腦甚至未來在移動設備上高效部署的可能。

QSVD通過其統一的QKV權重處理、智慧的秩分配策略和與低秩框架深度綁定的量化方案，為高成本的視覺語言模型指出了一條清晰的平民化之路。

這項工作為強大AI技術的普及和應用，掃清了一大障礙。

責任編輯：張燕妮來源： AIGC開放社區

AI 模型算法

51CTO技術棧公眾號

業務
速覽

媒體

51CTO CIOAge HC3i

社區

51CTO博客鴻蒙開發者社區 AI.x社區

教育

51CTO學堂精培企業培訓 CTO訓練營

国产欧美一区二区三区在线看蜜臀| 亚洲国产专区| 制服丝袜中文字幕一区| 欧美黄网在线观看| 天堂91在线| 麻豆精品国产传媒mv男同| 欧美成人国产va精品日本一级| 久久无码专区国产精品s| 在线最新版中文在线| 国产精品久久久一本精品| 99国产在线观看| 精品国产乱子伦| 伊人成综合网| 日韩精品在线观看网站| 九九精品久久久| 国产在线观看www| 综合久久国产九一剧情麻豆| 国产一区二区三区免费不卡| 在线观看中文字幕2021| 最新亚洲一区| 美女啪啪无遮挡免费久久网站| 97人妻天天摸天天爽天天| crdy在线观看欧美| 欧洲一区二区三区免费视频| 97在线国产视频| 天天影视久久综合| 久久蜜桃一区二区| 91午夜在线播放| 国产一级片av| 国产精品久久久久久久久久妞妞| 久久亚洲精品视频| 久久国产柳州莫菁门| 国产精品传媒| 日韩欧美一二三四区| 亚洲黄色小视频在线观看| 制服丝袜专区在线| 亚洲成人免费在线| 亚洲爆乳无码精品aaa片蜜桃| 丁香婷婷在线观看| 91蜜桃婷婷狠狠久久综合9色| 91中文字精品一区二区| 亚洲一区二区天堂| 免费人成在线不卡| 国产精品激情自拍| 无码人妻aⅴ一区二区三区有奶水| 欧美特黄一级| 欧美日韩国产123| www.5588.com毛片| 亚洲一区二区| 欧美精品亚州精品| 青草影院在线观看| 欧美午夜一区| 欧美华人在线视频| 精品在线免费观看视频| 国内精品美女在线观看| 欧美国产日本在线| 久久久久免费看| 亚洲国产91| 久久免费国产视频| 国产成人啪精品午夜在线观看| 欧美午夜一区| 久久久久久亚洲精品不卡| 国产一级免费av| 国产精品va| 国产+人+亚洲| 久久精品一二区| 亚洲欧美日韩国产综合精品二区| 91国内在线视频| 国产日本一区二区三区| 中文字幕你懂的| 麻豆精品一二三| 成人高h视频在线| 国产女主播福利| 成人夜色视频网站在线观看| 国精产品99永久一区一区| 性感美女视频一二三| 久久伊99综合婷婷久久伊| 日本一区二区久久精品| 调教视频免费在线观看| 依依成人精品视频| 欧美三级在线观看视频| 欧美成a人片在线观看久| 欧美日韩日本视频| 欧美日韩一区二区区| 开心激情综合| 在线精品91av| 免费又黄又爽又色的视频| 亚洲每日在线| 国产精品一二区| 精品国产亚洲AV| 99精品视频在线观看免费| 亚洲日韩国产第一区| 亚洲视频tv| 亚洲国产wwwccc36天堂| 91网址在线播放| 日韩一区二区三区精品| 日韩毛片在线观看| 女人18毛片毛片毛片毛片区二| 国产精品九九| 国产精品99蜜臀久久不卡二区| 国产精品久久久久久久久毛片 | 艳妇乳肉豪妇荡乳av无码福利| 韩国三级在线一区| 精品视频免费观看| 久久久久久国产精品免费无遮挡| 亚洲成a人片在线观看中文| 天堂中文视频在线| 99这里只有精品视频| 亚洲午夜女主播在线直播| 农村妇女精品一区二区| 日韩中文字幕区一区有砖一区| 91免费在线视频网站| 日本1级在线| 一区二区三区产品免费精品久久75| 久草青青在线观看| 亚洲国产中文在线| 一区二区三区精品99久久| 四虎成人精品永久免费av| 久热成人在线视频| 欧美日韩一区二区视频在线| 天堂av在线电影| 欧美日韩一区二区三区不卡| 91av在线免费| 国产精品mm| 91免费看片在线| 91在线看片| 欧美性猛交xxxx黑人猛交| 香蕉视频1024| 综合视频在线| 成人福利在线视频| www.久久热.com| 一本一道久久a久久精品| 精品一区二区三区四区五区六区| 午夜片欧美伦| 国产欧亚日韩视频| av影片免费在线观看| 欧美性高潮床叫视频| 成熟妇人a片免费看网站| 欧美二区不卡| 亚洲最大av网| 国产黄网站在线观看| 51精品国自产在线| 美国黄色片视频| 毛片基地黄久久久久久天堂| 日本一区视频在线| 美女网站视频一区| 亚洲无限av看| 在线视频精品免费| 国产欧美日韩综合精品一区二区| 国产在线观看福利| 久久99久久人婷婷精品综合| 啪一啪鲁一鲁2019在线视频| 色在线免费视频| 欧美性生交大片免网| 扒开jk护士狂揉免费| 男人的天堂亚洲| 欧美xxxx黑人又粗又长密月| 亚洲一区站长工具| 国产亚洲成精品久久| 这里只有精品999| 国产精品亲子伦对白| 亚欧激情乱码久久久久久久久| 成人看的视频| 成人亚洲激情网| av网站网址在线观看| 日韩欧美成人激情| 久久高清免费视频| 91色婷婷久久久久合中文| 男人揉女人奶房视频60分| 欧美三级情趣内衣| 91在线无精精品一区二区| 日本在线视频中文有码| 亚洲第一页自拍| 欧美超碰在线观看| 成人免费一区二区三区在线观看| 国产又粗又猛大又黄又爽| 精品动漫3d一区二区三区免费| 久久久综合亚洲91久久98| 色成人免费网站| 久久久成人的性感天堂| 日韩一卡二卡在线| 欧美性生活影院| www青青草原| 久久精品一级爱片| 久久成年人网站| 99国产精品| 午夜精品亚洲一区二区三区嫩草| 久久视频社区| 日本伊人精品一区二区三区介绍| 日本蜜桃在线观看| 亚洲精品国产精品国自产在线| 日韩手机在线视频| 亚洲免费在线视频一区二区| 亚洲观看黄色网| 久99久精品视频免费观看| 91精品国产91久久久久麻豆主演| 国内成人精品| 国产精品加勒比| 狠狠久久伊人中文字幕| 欧美黄色性视频| 97电影在线| 日韩精品高清在线观看| 国产精品欧美综合亚洲| 精品久久久久国产| 国产女人被狂躁到高潮小说| 久久精品人人做人人综合 | 日韩精品一区二区在线视频| 狠狠综合久久av一区二区蜜桃| av电影成人| 久久久久毛片| 日本久久中文字幕| 久操av在线| 久久精品国产91精品亚洲| 三级视频在线| 精品sm捆绑视频| aaa级黄色片| 欧美色图一区二区三区| www.毛片.com| 亚洲一区二区三区小说| 日本裸体美女视频| 久久精品欧美日韩| 国产人妻人伦精品1国产丝袜| 国产乱子伦视频一区二区三区| av免费网站观看| 亚洲欧美日韩国产一区| 岛国大片在线播放| 亚洲小说欧美另类婷婷| 91制片厂免费观看| 日韩国产一区二区| 日本午夜精品一区二区| 欧洲在线一区| 国模精品一区二区三区| 成人h动漫精品一区二区器材| 成人免费视频网| 色综合久久久| 国产日韩精品综合网站| jizzyou欧美16| 国产精品99久久99久久久二8| 一级毛片久久久| 欧美亚洲国产精品| 午夜裸体女人视频网站在线观看| 性色av一区二区三区免费| 欧美人体视频xxxxx| 欧美大片在线影院| 女囚岛在线观看| 九九久久综合网站| 国产蜜臀一区二区打屁股调教| 美日韩丰满少妇在线观看| 九七久久人人| 欧美日韩成人网| 免费影视亚洲| 欧美福利视频网站| √最新版天堂资源网在线| 久久琪琪电影院| 日韩欧美精品一区二区三区| 91av在线看| 欧洲av一区二区| 国产有码在线一区二区视频| 国产精品麻豆| 国产精品手机在线| 亚洲精品一级二级三级| 日本在线播放一区| 91精品精品| 青青在线视频免费观看| 最新日韩在线| 久久久久久久久久福利| 免费亚洲电影在线| 亚洲精品久久久久久| 成人免费高清视频在线观看| 午夜一区二区三区免费| 中文字幕不卡在线| 日日骚一区二区三区| 无吗不卡中文字幕| 日韩电影在线观看一区二区| 欧美日韩国产天堂| 亚洲精品字幕在线观看| 日韩激情片免费| a天堂中文在线| 欧美肥老妇视频| 日本韩国欧美| 91精品久久久久| 国产精品毛片久久久| 日韩欧美精品一区二区三区经典| 亚洲精品tv久久久久久久久久| 日本手机在线视频| 视频精品一区二区| 国产又粗又猛大又黄又爽| www国产亚洲精品久久麻豆| 国产又黄又粗又猛又爽的| 一区二区三区欧美亚洲| 一级做a爰片久久毛片| 欧美精品99久久久**| 污污视频在线免费看| 日日摸夜夜添一区| 成人bbav| 亚洲综合av影视| 精品国产午夜| 久艹视频在线免费观看| 久久爱www久久做| 亚洲国产精品无码久久久久高潮| 国产精品美日韩| 日本午夜精品理论片a级app发布| 欧美日韩1区2区| 日韩精品123| 欧美激情免费观看| 亚洲天堂网站| 日本亚洲自拍| 一区二区三区国产盗摄| 亚洲国产日韩在线一区| 国产亚洲欧美激情| 日韩xxxxxxxxx| 日韩西西人体444www| 在线观看麻豆| 欧美孕妇性xx| 米奇精品关键词| 草草草视频在线观看| 久久99精品久久久久| 成都免费高清电影| 欧美色播在线播放| 高潮毛片7777777毛片| 久久精品国产亚洲一区二区| 小黄鸭精品aⅴ导航网站入口| 国产一区二区三区四区五区加勒比| 国产精品7m凸凹视频分类| 人人爽人人av| 91美女视频网站| 日韩成人av毛片| 欧美成人bangbros| 91中文在线| 91精品在线观| 99久久综合| 五月婷婷六月合| 欧美激情一区二区| 波多野结衣二区三区| 亚洲欧美日韩在线一区| 在线视频cao| 免费精品视频一区| 亚洲影音一区| 国产精品815.cc红桃| 欧美性猛交xxx| 黄色毛片在线观看| 国产ts人妖一区二区三区 | 国产一区久久久| 97成人资源站| 日韩欧美亚洲一区二区| a毛片在线看免费观看| 99久久99久久精品国产片| 91精品综合| 免费黄色av网址| 亚洲成人在线观看视频| 手机亚洲第一页| 国产精品成人免费电影| 欧美丝袜一区| 在线看免费毛片| 亚洲免费av观看| 免费观看黄色一级视频| 97色在线观看免费视频| 亚洲精品动态| 日韩福利视频在线| 国产精品久久久久久户外露出| 国产又粗又猛又爽又黄的| 久久视频免费观看| 澳门成人av| 久久精品香蕉视频| 亚洲欧洲国产专区| 亚洲国产欧美另类| 欧美中文字幕在线| 久久国产成人午夜av影院宅| www,av在线| 午夜精品久久久久久不卡8050| 美女做暖暖视频免费在线观看全部网址91 | 欧美艳星brazzers| 成年视频在线观看| 久99久视频| 麻豆精品久久久| 久久久久久久蜜桃| 亚洲人成电影在线| 亚洲香蕉久久| 青青草视频在线免费播放| 国产三级精品三级| 精品国产黄色片| 茄子视频成人在线| 91超碰国产精品| 国产一级二级在线观看| 欧美亚洲尤物久久| 欧美极品少妇videossex| 欧美一区二区三区成人久久片| 久久精品国产第一区二区三区| 精品视频久久久久| 中文字幕精品在线视频| 99久久免费精品国产72精品九九| 久久精品99国产| 一区二区三区在线观看国产| 欧美日本网站| 99视频在线播放| 免费在线一区观看| 在线观看国产亚洲| 久久精品影视伊人网| 蜜桃视频欧美| 图片区偷拍区小说区|

<strike id="wwk0o"><rt id="wwk0o"></rt></strike><fieldset id="wwk0o"><table id="wwk0o"></table></fieldset>

<ul id="wwk0o"></ul>