精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

深度網(wǎng)絡數(shù)據(jù)編碼新突破,上交大SPARK登上計算機體系結構頂會

人工智能 新聞
本文的研究者提出了 SPARK 技術,一種可擴展細粒度混合精度編碼的軟硬件協(xié)同設計。

隨著深度神經(jīng)網(wǎng)絡(DNNs)模型在規(guī)模和復雜性上的迅速增長,傳統(tǒng)的神經(jīng)網(wǎng)絡處理方法面臨著嚴峻的挑戰(zhàn)。現(xiàn)有的神經(jīng)網(wǎng)絡壓縮技術在處理參數(shù)規(guī)模大、精度要求高的神經(jīng)網(wǎng)絡模型時效率低下,無法滿足現(xiàn)有應用的需求。

數(shù)值量化是神經(jīng)網(wǎng)絡模型壓縮的一種有效手段。在模型推理過程中,低位寬(比特)數(shù)據(jù)的存取和計算可以大幅度節(jié)省存儲空間、訪存帶寬與計算負載,從而降低推理延遲和能耗。當前,大多數(shù)量化技術的位寬在 8bit。更為激進的量化算法,必須要修改硬件的操作粒度與數(shù)據(jù)流特征,才能在真實推理時獲得接近理論的收益。比如混合精度量化,激活數(shù)據(jù)的量化等方案。一方面,這些方案會顯式增加 book-keeping 存儲開銷和硬件邏輯,使得實際收益下降 [1,2,3]。另一方面,一些方案利用分布特征對量化范圍和粒度做約束,來減小上述硬件開銷 [4,5]。但其精度損失也受到不同模型和參數(shù)分布的影響,無法滿足現(xiàn)有應用的需求。

為此,本文的研究者提出了 SPARK 技術,一種可擴展細粒度混合精度編碼的軟硬件協(xié)同設計。

其核心優(yōu)勢如下:

  • 固有比特冗余:SPARK 不對模型進行壓縮,而是剔除數(shù)據(jù)表示中固有的比特冗余,與現(xiàn)有的壓縮方案正交,可以協(xié)同使用。
  • 變長編碼方案:SPARK 創(chuàng)新了變長數(shù)據(jù)表示格式,有效壓縮模型大小,不需要增加額外的 book-keeping(如 index 等)代價(如硬件,訪問與更新延遲)。該編碼方案對模型參數(shù)與激活值同樣適用。
  • 硬件兼容性:SPARK 不需要修改硬件加速器微架構(如:脈動陣列),不會引入額外的設計復雜性,可行性較高。
  • 平衡精度與效率:在大型模型中,SPARK 通過其高效的編碼機制,不僅提升了處理速度,還精確地保持了模型的準確性。與其他同類型加速器相比平均獲得了 4.65 倍的加速,降低了 74.7% 的能耗。

研究動機

本工作源于對模型參數(shù)與激活值分布的觀察分析:由于權重和激活的分布成長尾型,量化后的數(shù)據(jù)仍會保持該分布,呈現(xiàn)高位稀疏的特性。具體的,按 INT8 精度量化后的模型參數(shù)中,80% 左右的數(shù)據(jù)都可以用 INT4 表示,只有一小部分較重要的值需要高位寬存儲,如圖 1 所示。

圖 1 不同網(wǎng)絡中 INT4 范圍內數(shù)據(jù)和 INT8 范圍內數(shù)據(jù)的比例

為了利用數(shù)據(jù)表示中固有的比特冗余,作者提出了 SPARK—— 一種可變長度的編碼方案,通過引入一位指示符和新穎的編解碼模式來支持混合精度。這種編碼方案電路設計簡單,而且維持存儲對齊。

主要方法

在 SPARK 中,本工作只簡單地用最高位作為指示符區(qū)分高 / 低精度數(shù)據(jù),而不同于其他分離尾數(shù)域和指數(shù)域的復雜編碼策略。同時,模型訓練時就可以模擬該編碼行為,而不用進行訓練后微調來補償由量化帶來的精度損失。

編碼方案及電路設計

該工作以 INT8 量化為例,每個數(shù)據(jù)為 8bit unsigned 整型。原始數(shù)據(jù)的編碼表示為(b0 , b1 , b2 , b3 , b4 , b5 , b6 , b7),具體的編碼原則如圖 2 所示。

1. 當原編碼中只有b- b7 這低 4 位包含非零有效位時,直接進行低精度無損編碼,縮短為 4bit,其中最高位 C4 是指示符位,設為 0。

2. 當原編碼中 b0-b3 這高 4 位也包含非零有效位時,進行高精度編碼。其中,最高位 c0 為指示符位,設為 1。之后,視 b0 異或 b3 的結果,決定是否進行有損近似編碼或無損編碼。

a) 當原數(shù)值范圍在 [8, 127],即 b3-b1 位包含非零有效位時,最高位的指示符位不作為數(shù)值位計算。當 b3 位為 1 時,在編碼階段將 b3 位設為 0 并將低 4 位 C4-C7 補償為 1111。雖然,這一步是有損的,但由于補償效應、損失精度較小。

b) 當原數(shù)值范圍在 [128, 255],即 b7-b0 位這 8 位都包含非零有效位時,最高位的指示符位作為數(shù)值位計算。當 b3 位為 0 時,在編碼階段將 b3 位設為 1 并將低 4 位 C4-C7 補償為 0000。

當然,該工作也可以更激進地舍棄這些 fixed bit 進一步壓縮存儲容量與帶寬,但需要在解碼階段把 fixed bit 填補后再將 8bit 數(shù)據(jù)送入計算單元。這會增加一些解碼器的硬件開銷。

圖片

圖 2 SPARK 編碼對于不同范圍的原數(shù)據(jù)的應用

硬件上實現(xiàn)該編碼器只需要用到零檢測器,多路選擇器和異或門等熟知的硬件模塊,具體電路設計如圖 3 所示:輸入 8bit 的原始數(shù)據(jù),b0 ~ b4 先經(jīng)過一個 5bit 的零檢測器,判定該輸入編碼為高 / 低精度,如果編碼為低精度則直接輸出 b, b, b, b7,若編碼為高精度,則根據(jù)公式 1 和公式 2 分情況編碼。

圖片

圖片

圖 3  SPARK 方案的編碼器電路設計

解碼方案及電路設計

本工作設計了一個硬件友好的解碼方案,下面將闡述如何將編碼轉換為十進制值。首先,本工作假定大端序存儲(Big Endian),解碼時輸入位寬為 4bit,使能信號 1 位。

解碼器電路需要的硬件模塊為熟知的多路選擇器,或門和非門。具體實現(xiàn)如圖 4 所示,解碼器每個周期讀入 4bit 數(shù)據(jù)和使能信號。

當使能信號為 1,則指該輸入是高精度值得后半部分編碼;當使能信號為 0 時,若 c0 = 0,則判定輸入是低精度值直接輸出 c0c1c2c3 為解碼值,若 c0 = 1 則根據(jù) c3 判定將指示符位作為數(shù)值位計算。公式 3 闡述了具體的判定規(guī)則,圖 4 是解碼器的電路設計圖。

圖片


圖 4  SPARK 方案的解碼器設計

整體架構

SPARK 可以與常用的張量運算核心(脈動陣列,乘加樹等)很好的兼容。如圖 5 所示,解碼器放置在 weight buffer 與 PE 之間,在參數(shù)灌入 PE 陣列之前解碼;同樣也放置在 Activation Buffer 與 PE 之間,在激活值灌入 PE 陣列之前解碼。編碼則分為兩部分。對于參數(shù)的編碼可以離線進行,在 DRAM 中直接存儲已經(jīng)編碼壓縮后的參數(shù)。在線硬件編碼器則放置在 PE 計算完產生 Activation 之后。

若要進一步挖掘計算效率上的提升,則可以設計一個常見的混合位寬運算單元(SPARK PE Unit),支持兩個 8bit 操作數(shù)的 MAC 操作,或者 2 對 4 個 4bit 操作數(shù)的 MAC 操作。

圖 5 SPARK 整體架構圖

實驗結果

文章使用 CNN-based 和 attention-based 的模型簇進行實驗,在 ImageNet 數(shù)據(jù)集上測試了 VGG-16,ResNet-18,ResNet-50 網(wǎng)絡,在 GLUE 數(shù)據(jù)集上測試 BERT-based 模型,以及 ViT 模型。與 SPARK 進行對比的 baseline 架構有:Eyeriss [6], BitFusion [7], OLAccel [1], ANT [8], Olive [9]。

模型準確性評估

在 ImageNet 數(shù)據(jù)集上,和原始的 FP32 模型相比,SPARK 上的平均準確率損失大約為 0.1%,對于 attention-based 的模型,SPARK 獲得了更好的準確性(+0.6%)。表 1 和表 2 展示了準確性評估的結果。


圖片

表 1 SPARK 和其他沒有微調的架構在精度損失和平均存儲位寬上的比較

圖片

表 2  SPARK 和其他架構在 SST-2 數(shù)據(jù)集上測試 BERT 的精度損失和位寬比較

性能和能耗評估

執(zhí)行效率上,圖 5 展示了不同加速器在六個網(wǎng)絡上的執(zhí)行效率對比。和其他架構相比,SPARK 最多獲得了 4.65 倍的加速,在 ResNet-50 網(wǎng)絡上,SPARK 有 80.1% 的明顯性能提升。

圖 5 不同架構設計的延遲比較

能耗上,圖 6 展示了不同架構的 DRAM,BUFFER,CORE 的能耗貢獻在 5 個網(wǎng)絡上的比較結果。對于 ResNet-50,SPARK 最多下降了 74.7%。

圖 6 不同架構設計的能耗比較

結語

SPARK 利用數(shù)據(jù)表示中的比特冗余,結合高效的編解碼方案,使得 AI 模型在保證精度需求的情況下,利用本就存在的比特稀疏,這對于計算、存儲、傳輸都帶來了巨大的開銷節(jié)省。在處理越來越大的模型時,SPARK 展現(xiàn)出了其獨特的優(yōu)勢。它不僅能夠處理大規(guī)模數(shù)據(jù),還能在精度極其敏感的場景下保持高效率。這一點對于現(xiàn)在 AI 應用尤為關鍵,如自動駕駛、醫(yī)學診斷和語言處理等。

在未來,這套編碼方法還可以進一步擴展到交換芯片,存儲盤控芯片等關鍵位置,用于優(yōu)化 AI 數(shù)據(jù)中心的通信瓶頸。

這一工作由上海交大先進計算機體系結構實驗室蔣力教授課題組(IMPACT)完成,同時也獲得了上海期智研究院的支持。第一作者是劉方鑫教授與博士生楊寧。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2022-01-26 09:53:23

計算機體系結構

2023-01-03 00:00:17

2024-08-13 14:00:00

AI訓練

2015-10-10 10:58:45

Flynn指令流數(shù)據(jù)流

2021-08-10 11:24:03

結構網(wǎng)絡分層

2010-09-16 14:36:43

Java虛擬機

2017-02-06 21:08:34

Android虛擬機體系結構

2010-01-18 10:23:04

核心交換機

2018-03-21 09:24:27

超融合架構層次存儲

2020-06-01 21:07:33

C11C++11內存

2025-08-14 08:30:29

2018-06-11 08:46:01

高性能Lustre體系

2010-01-04 10:33:38

核心交換機

2014-09-09 09:49:59

2010-01-26 16:54:09

核心交換機

2016-03-02 15:09:57

Java虛擬機體系結構

2010-01-25 15:01:36

交換機體系結構

2017-11-21 18:03:00

2009-12-17 12:58:51

UML之父架構

2020-01-16 15:20:48

編程語言PythonJava
點贊
收藏

51CTO技術棧公眾號

国产自产一区二区| 国产成人av免费在线观看| 户外露出一区二区三区| 国产精品三级电影| 国产成人av一区二区三区| 国产香蕉视频在线| 久久在线免费| 亚洲成人激情视频| 99九九99九九九99九他书对| 第一福利在线视频| 亚洲欧洲韩国日本视频| 久久久久国产精品视频| 国产精品一级视频| 麻豆九一精品爱看视频在线观看免费| 久久午夜a级毛片| 国产精品1000部啪视频| 韩国三级成人在线| 欧美亚洲国产一区二区三区va| 欧美 国产 精品| 国产高清一区在线观看| 国产成人精品网址| 国产精品亚洲精品| 中文字幕精品无码一区二区| 国产精品大片| 欧美大奶子在线| 亚洲色图27p| 国产乱码精品一区二区亚洲 | 国产精品露脸视频| 亚洲激情视频| 欧美成人免费网| av片在线免费看| 免费欧美视频| 精品视频中文字幕| 91传媒理伦片在线观看| 国产一区二区三区亚洲综合| 欧美日韩一区小说| 92看片淫黄大片一级| 天天干在线视频论坛| 成人免费在线视频观看| 亚洲日本无吗高清不卡| 国产午夜精品一区理论片| 99视频精品全部免费在线| 99热在线播放| www香蕉视频| 国产在线精品免费| 91色视频在线导航| 国产女人18毛片18精品| 极品少妇一区二区三区精品视频| 国产精品视频地址| 伊人亚洲综合网| 日韩高清在线一区| 国产精品福利小视频| 在线免费一区二区| 青草av.久久免费一区| 国产成人精品在线视频| 天天射天天干天天| 人人精品人人爱| 国产精品丝袜高跟| 一本色道久久综合精品婷婷| 日本vs亚洲vs韩国一区三区二区| 国产精品久久二区| 在线免费看av片| 国产揄拍国内精品对白| 亚洲影院在线看| 免费国产羞羞网站视频| 99精品视频免费在线观看| 久久久神马电影| 国产粉嫩一区二区三区在线观看| 国产欧美视频在线观看| 亚洲一区二区三区加勒比| 国产剧情在线| 亚洲a一区二区| 18禁男女爽爽爽午夜网站免费| 在线观看v片| 欧美午夜一区二区三区免费大片| 伊人国产在线视频| 欧美国产中文高清| 亚洲国产精久久久久久| 偷拍夫妻性生活| 999国产精品| 欧美二区在线播放| 色一情一乱一伦| 美女国产一区二区三区| 114国产精品久久免费观看| 欧美一级免费片| 欧美高清在线一区| 国产一二三四五| 秋霞伦理一区| 欧美福利一区二区| 中文字幕一区三区久久女搜查官| 欧美男gay| 欧美老妇交乱视频| 国产一区二区视频网站| 国产精品自拍毛片| 欧美精彩一区二区三区| 岛国成人毛片| 色视频欧美一区二区三区| 天天综合天天添夜夜添狠狠添| 精品中国亚洲| 日韩最新免费不卡| 毛片视频网站在线观看| 国产在线国偷精品免费看| 久久涩涩网站| 手机在线免费av| 欧美日韩一卡二卡| 中文字幕精品久久久| 99久久夜色精品国产亚洲狼| 91精品国产自产91精品| av中文字幕播放| 久久久九九九九| 无码人妻少妇伦在线电影| 日韩深夜福利网站| 亚洲人成在线播放| 久久精品欧美一区二区| 久久99久久久欧美国产| 欧美一二三区| cao在线视频| 91精品国产综合久久小美女| 中文字幕在线观看免费高清| 亚洲欧洲一级| 99爱精品视频| 1024免费在线视频| 欧美天堂在线观看| 97精品人妻一区二区三区蜜桃| 日韩系列欧美系列| 日本伊人精品一区二区三区介绍 | 日韩在线观看不卡| 日韩精品亚洲精品| 国产无码精品在线播放| 国产经典欧美精品| 国产一区一区三区| 亚洲高清影院| 久久精品91久久久久久再现| 在线观看你懂的网站| 久久久91精品国产一区二区精品| 欧美精品久久久久久久自慰| 亚洲91网站| 欧美大秀在线观看| 国产视频一二三四区| 亚洲欧美自拍偷拍色图| 亚洲无在线观看| 亚洲91中文字幕无线码三区| 91精品久久久久久久久| 色网站免费在线观看| 精品视频免费在线| 手机免费观看av| 久久99热这里只有精品| 国产系列第一页| 精品国产亚洲一区二区三区在线 | 波多野结衣在线观看一区| 久久综合精品国产一区二区三区| 国产网站免费在线观看| 婷婷亚洲成人| 国产精品福利网| 91caoporn在线| 欧美精品三级在线观看| 波多野结衣亚洲色图| 国产剧情一区二区三区| 菠萝蜜视频在线观看入口| 亚洲伊人影院| 国产91成人video| 搞黄视频免费在线观看| 欧美色涩在线第一页| 色哟哟一一国产精品| 国产精品白丝jk白祙喷水网站 | 蜜臀av在线| 亚洲级视频在线观看免费1级| 亚洲精品男人天堂| 国产欧美精品一区aⅴ影院 | 成人国产在线观看| www.玖玖玖| 日韩理论电影院| 亚洲精品欧美日韩专区| aa国产成人| 亚洲日本中文字幕| 国产三级精品在线观看| 午夜视频在线观看一区| 性少妇bbw张开| 精品中文字幕一区二区| 波多野结衣之无限发射| 欧美先锋资源| 成人女人免费毛片| 高清电影一区| 美女福利视频一区| 飘雪影院手机免费高清版在线观看| 欧美在线不卡视频| 国产真实的和子乱拍在线观看| 久久精品夜色噜噜亚洲aⅴ| 日本美女视频一区| 中文高清一区| 亚洲精品在线观看免费| 97se亚洲国产一区二区三区| 欧美最猛性xxxxx(亚洲精品)| 久久久久久国产精品免费无遮挡| 亚洲精品国产成人| 国产精品人妻一区二区三区| 精品电影在线观看| 欧美爱爱免费视频| 久久久另类综合| 人妻 丝袜美腿 中文字幕| 日韩经典中文字幕一区| av免费看网址| 国产精品99在线观看| 久久爱av电影| 4438全国亚洲精品观看视频| 国产精品网站视频| 蜜桃视频在线观看播放| 超在线视频97| 91大神xh98hx在线播放| 亚洲免费视频观看| 亚洲a视频在线观看| 欧美私人免费视频| 久久久久久久久黄色| 亚洲综合另类小说| 999精品久久久| 久久久久久一二三区| 国产+高潮+白浆+无码| 韩国三级在线一区| 国产又大又黄又粗的视频| av成人黄色| 日韩精品久久一区二区| 欧美日韩中字| 欧美日韩在线观看一区| 国产厕拍一区| 9a蜜桃久久久久久免费| 成人在线啊v| 成人xxxx视频| 国产精品诱惑| 国产精品一二三在线| 日韩成人影音| 国产成人短视频| 超碰aⅴ人人做人人爽欧美| 国内精品小视频| 超碰在线网站| 欧美国产中文字幕| 污污的视频在线观看| 久久艹在线视频| av观看在线| 久久五月天综合| 制服丝袜在线播放| 欧美超级乱淫片喷水| 成人在线免费看片| 欧美成人午夜激情视频| av在线播放国产| 欧美刺激性大交免费视频| 污污网站在线观看| 欧美激情亚洲一区| 成人高潮aa毛片免费| 性色av香蕉一区二区| 热色播在线视频| 992tv在线成人免费观看| 密臀av在线播放| 国产精品99久久久久久www| 国产精品xxx| 91麻豆桃色免费看| 91亚洲无吗| 久久大片网站| 不卡一区2区| 正在播放国产精品| 综合色一区二区| 国产天堂视频在线观看| 亚洲男人影院| 黄色在线视频网| 国产中文字幕精品| 天天躁日日躁狠狠躁免费麻豆| 波多野结衣中文字幕一区二区三区| 中文字幕在线播放一区| 久久精品视频网| 亚洲AV成人无码网站天堂久久| 亚洲欧洲成人精品av97| 国产在线观看免费视频今夜| 欧美网站在线观看| 在线观看免费视频a| 日韩美女视频在线| 五月婷婷六月丁香综合| 国产一区二区三区在线看| 菠萝蜜视频国产在线播放| 性欧美视频videos6一9| 美女久久久久久| 国产一区二区三区免费不卡| 精品久久不卡| av在线播放天堂| 免费在线视频一区| 深夜视频在线观看| 国产婷婷色一区二区三区| 欧美一区二区三区爽爽爽| 天天综合天天综合色| 91久久久久国产一区二区| 日韩av中文在线| 快射视频在线观看| 91精品国产一区| 欧美第一在线视频| 日韩国产高清一区| 精品动漫一区| 五月天丁香花婷婷| 久久久噜噜噜久久人人看 | 欧美特黄一区| 中文字幕一区二区三区四区在线视频| 国产成人一级电影| 我不卡一区二区| 亚洲sss视频在线视频| 一级片在线观看视频| 亚洲激情成人网| 亚洲91av| 国产欧美一区二区三区久久| 女一区二区三区| 激情成人开心网| 精品系列免费在线观看| 伊人网伊人影院| 午夜国产精品一区| 精品人妻少妇AV无码专区| 一本一道久久a久久精品逆3p| www.综合网.com| 91精品视频大全| 成人黄色小视频| 国产一区二区三区精彩视频 | 母乳一区在线观看| 人妻巨大乳一二三区| 国产精品天美传媒沈樵| 亚洲av中文无码乱人伦在线视色| 亚洲成人久久久| 久草在线视频福利| 亚洲精品日产aⅴ| 99国产**精品****| 一道本视频在线观看| 久久久www成人免费毛片麻豆| 亚洲一区二区91| 欧美zozozo| 牛牛精品在线视频| 91影院在线免费观看视频| 日韩中文欧美| 一区二区三区韩国| 国产人妖乱国产精品人妖| 国产区在线观看视频| 亚洲精品美女久久久| 2020国产在线| 精品国产乱码一区二区三区四区| 亚洲小说欧美另类婷婷| 涩视频在线观看| 亚洲一区二区在线视频| www视频在线| 久久久免费精品| gogo久久日韩裸体艺术| 免费人成在线观看视频播放| 成人av在线观| 亚洲精品午夜国产va久久成人| 亚洲精品国产综合久久| 在线天堂中文资源最新版| 久久99蜜桃综合影院免费观看| 亚洲一区二区成人| 国产精品jizz| 91精品办公室少妇高潮对白| 岛国在线大片| 国产精品一区av| 婷婷精品进入| 少妇丰满尤物大尺度写真| 亚洲小说欧美激情另类| 凸凹人妻人人澡人人添| 欧美有码在线观看| gogogo高清在线观看一区二区| 奇米影音第四色| 亚洲天堂成人在线观看| 亚洲国产精品久久久久爰性色| 欧美精品第一页在线播放| 日日天天久久| 天天干天天草天天| 亚洲猫色日本管| 午夜福利一区二区三区| 国产成人精品电影| 91精品国产麻豆国产在线观看| 亚洲成a人无码| 色呦呦国产精品| 男人在线资源站| 国产一区二区黄色| 日本va欧美va瓶| 精品无码人妻一区二区三| 亚洲开心激情网| **日韩最新| 伊人成色综合网| 国产精品卡一卡二卡三| 成人免费视频国产免费麻豆| 欧美一区二区三区精品电影| 久久一区91| xxxx黄色片| 91精品国产一区二区人妖| 色偷偷偷在线视频播放| 中文字幕一区二区三区四区五区六区 | 国产99在线|中文| 亚洲天天综合| 成人乱码一区二区三区av| 日韩午夜电影在线观看| 亚洲成人不卡| 久久男人资源站| 欧美国产精品v| 头脑特工队2免费完整版在线观看| 国产精品女主播视频| 日韩一级网站| 九九热最新地址| 在线中文字幕日韩| 欧美日韩一区二区三区不卡视频|