精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

多模態大模型輕量化探索-視覺大模型SAM的視覺編碼器 原創

發布于 2025-5-8 06:46
瀏覽
0收藏

往期,筆者基于LLava的數據對齊訓練,搞了一個??Reyes?多模態大模型,并且看了些多模態大模型,相關開源的多模態大模型如:KimiVL、Internvl、QwenVL等,其視覺編碼器的尺寸都比較大,如:MoonViT-SO-400M、InternViT-6B-448px-V2_5 等都非常大,對于特定的垂直場景(或者是端側落地都不大友好),也許并不需要這么大視覺編碼器。如:表格場景(??【多模態 & 文檔智能】一次多模態大模型表格識別解析探索小實踐記錄???),當時筆者用了一個8B參數的模型及百萬表格數據進行訓練達到了不錯的效果。近期,因此思考一些模型輕量化的方案,尋找一個輕量點的視覺編碼器(比如參數量小于100M),下面來看看SAM,供參考。

Segment Anything Model(SAM)是Meta AI發布的一個突破性圖像分割模型為計算機視覺領域提供一個通用的、靈活的基座視覺大模型。它受到自然語言處理(NLP)中基礎模型(如GPT、BERT)的啟發,強調零樣本遷移和提示式交互能力。在SA-1B數據集上的訓練,該數據集包含超過11百萬張圖像和11億個高質量分割掩碼,覆蓋了從日常場景到專業領域的多樣化內容。

多模態大模型輕量化探索-視覺大模型SAM的視覺編碼器-AI.x社區

SAM借鑒了NLP領域的Prompt策略,通過給圖像分割任務提供Prompt提示來完成任意目標的快速分割。Prompt類型可以是「前景/背景點集、粗略的框或遮罩、任意形式的文本或者任何指示圖像中需要進行分割」的信息。如圖(a)所示,模型的輸入是原始的圖像和一些prompt,目標是輸出"valid"的分割,所謂valid,就是當prompt的指向是模糊時,模型能夠輸出至少其中一個mask。

模型結構

多模態大模型輕量化探索-視覺大模型SAM的視覺編碼器-AI.x社區

SAM的模型結構由三個核心組件組成,Image Encoder、Prompt Encoder和Mask Decoder。分別負責圖像特征提取、提示編碼和掩碼生成。圖像經過Image Encoder編碼,Prompt提示經過Prompt Encoder編碼,兩部分Embedding再經過一個輕量化的Mask Decoder得到融合后的特征。其中,Encoder部分使用的是已有模型,Decoder部分使用Transformer。 下表為三個組件的總結:

組件名稱

功能

關鍵特點

Image Encoder

將輸入圖像轉換為密集特征表示

使用MAE預訓練的Vision Transformer(ViT-H/16),輸入1024x1024x3,輸出64x64x256嵌入。

Prompt Encoder

將用戶提示(點、框、文本、掩碼)編碼為嵌入

支持稀疏提示(點、框、文本)和密集提示(掩碼),使用CLIP處理文本,靈活適應多種輸入。

Mask Decoder

結合圖像和提示嵌入,生成最終分割掩碼

輕量級Transformer解碼器,通過自注意力與交叉注意力機制預測掩碼,實時高效。

Image Encoder

本文的目的是為了尋找一個輕量化的視覺編碼器,因此下面來詳細看下視覺編碼器部分。Image Encoder的作用是把圖像映射到特征空間,整體過程如下圖所示。

多模態大模型輕量化探索-視覺大模型SAM的視覺編碼器-AI.x社區

正如論文中所講,本質上這個Encoder可以是任何網絡結構,在這里使用的是微調的Detectron的ViT,當然它也可以被改成傳統的卷積結構,非常合理。

多模態大模型輕量化探索-視覺大模型SAM的視覺編碼器-AI.x社區

可以看到,Image Encoder就是一個ViT的結構,由PatchEmbed、Transformer Encoder、Neck Convolution組成。

輸入圖像經過ViT結構的過程如下:

1.Patch Embedding
輸入圖像通過一個卷積base,將圖像劃分為16x16的patches,步長也為16,這樣feature map的尺寸就縮小了16倍,同時channel從3映射到768。Patch Embedding示意圖如下所示。

多模態大模型輕量化探索-視覺大模型SAM的視覺編碼器-AI.x社區

多模態大模型輕量化探索-視覺大模型SAM的視覺編碼器-AI.x社區

將輸入的圖像轉換為序列化的特征向量

Patch Embedding過程在Vision Transformer結構圖中對應下圖所示。

多模態大模型輕量化探索-視覺大模型SAM的視覺編碼器-AI.x社區

2.Transformer Encode
feature map通過16個Transformer Block,其中12個Block使用了基于Window Partition(就是把特征圖分成14*14的windows做局部的Attention)的注意力機制,以處理局部信息。另外4個Block是全局注意力模塊(多頭注意力),它們穿插在Window Partition模塊之間,以捕捉圖像的全局上下文。

多模態大模型輕量化探索-視覺大模型SAM的視覺編碼器-AI.x社區

多模態大模型輕量化探索-視覺大模型SAM的視覺編碼器-AI.x社區

循環疊加Transformer Encode

3.Neck Convolution
最后,通過兩層卷積(Neck)將通道數降低至256,生成最終的Image Embedding。其結構圖如下所示。

多模態大模型輕量化探索-視覺大模型SAM的視覺編碼器-AI.x社區

多模態大模型輕量化探索-視覺大模型SAM的視覺編碼器-AI.x社區

SAM構建與輕量化編碼器提取

通過下面代碼提取一個參數量大小僅為80幾M的視覺編碼器。

import torch
from functools import partial
from modeling import ImageEncoderViT, MaskDecoder, PromptEncoder, Sam, TwoWayTransformer


def build_sam_vit_b(checkpoint=None):
    return _build_sam(
        encoder_embed_dim=768,
        encoder_depth=12,
        encoder_num_heads=12,
        encoder_global_attn_indexes=[2, 5, 8, 11],
        checkpoint=checkpoint,
    )


sam_model_registry = {
    "vit_b": build_sam_vit_b,
}


def _build_sam(
        encoder_embed_dim,
        encoder_depth,
        encoder_num_heads,
        encoder_global_attn_indexes,
        checkpoint=None,
):
    prompt_embed_dim = 256
    image_size = 1024
    vit_patch_size = 16
    image_embedding_size = image_size // vit_patch_size
    sam = Sam(
        image_encoder=ImageEncoderViT(
            depth=encoder_depth,
            embed_dim=encoder_embed_dim,
            img_size=image_size,
            mlp_ratio=4,
            norm_layer=partial(torch.nn.LayerNorm, eps=1e-6),
            num_heads=encoder_num_heads,
            patch_size=vit_patch_size,
            qkv_bias=True,
            use_rel_pos=True,
            global_attn_indexes=encoder_global_attn_indexes,
            window_size=14,
            out_chans=prompt_embed_dim,
        ),
        prompt_encoder=PromptEncoder(
            embed_dim=prompt_embed_dim,
            image_embedding_size=(image_embedding_size, image_embedding_size),
            input_image_size=(image_size, image_size),
            mask_in_chans=16,
        ),
        mask_decoder=MaskDecoder(
            num_multimask_outputs=3,
            transformer=TwoWayTransformer(
                depth=2,
                embedding_dim=prompt_embed_dim,
                mlp_dim=2048,
                num_heads=8,
            ),
            transformer_dim=prompt_embed_dim,
            iou_head_depth=3,
            iou_head_hidden_dim=256,
        ),
        pixel_mean=[123.675, 116.28, 103.53],
        pixel_std=[58.395, 57.12, 57.375],
    )
    sam.eval()
    if checkpoint is not None:
        with open(checkpoint, "rb") as f:
            state_dict = torch.load(f)
        sam.load_state_dict(state_dict)
    return sam


if __name__ == '__main__':
    x = torch.zeros(2, 3, 1024, 1024)
    net = build_sam_vit_b(checkpoint='sam_vit_b_01ec64.pth')
    image_encoder = net.image_encoder

    print(image_encoder)
    print(image_encoder(x).shape)  # 輸出:torch.Size([2, 256, 64, 64])
    
    total_params = sum(p.numel() for p in image_encoder.parameters())
    print(f"模型的參數量為: {(total_params/ 1e6):.2f}M")      # 模型的參數量為: 89.67M

參考文獻:

Segment Anything,https://arxiv.org/pdf/2304.02643

code:https://github.com/facebookresearch/segment-anything


公眾號大模型自然語言處理  作者:余俊暉

原文鏈接:??https://mp.weixin.qq.com/s/-bpeKqfBEAytKTVeFd7szQ??

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2025-5-8 06:46:04修改
收藏
回復
舉報
回復
相關推薦
一区二区日韩av| 激情欧美一区二区三区在线观看| 亚洲精品720p| 人人干人人视频| 成人日批视频| 久久看人人爽人人| 亚洲字幕在线观看| 无码人妻av一区二区三区波多野| 亚洲男女av一区二区| 日韩精品免费视频| 日韩av影视大全| 深夜成人福利| 亚洲福中文字幕伊人影院| 日本精品一区| 蜜臀av在线观看| 久久国产免费看| 97国产精品视频人人做人人爱| 亚洲综合第一区| 久久97久久97精品免视看秋霞| 欧美日韩在线三区| 国产裸体舞一区二区三区| 99在线播放| 国产精品免费免费| 蜜桃成人在线| 黄色aaa大片| 国产精品资源站在线| 国产激情视频一区| www..com国产| 欧美激情aⅴ一区二区三区| 国产亚洲一区二区精品| 一区二区免费在线观看视频| 成人自拍视频| 欧美日韩中文另类| 日韩免费毛片视频| 国产黄大片在线观看| 一区av在线播放| 视频一区二区视频| p色视频免费在线观看| 99久久伊人精品| 成人免费看片网址| 99国产精品一区二区三区| 九九热在线视频观看这里只有精品| 55夜色66夜色国产精品视频| 日本少妇激情舌吻| 亚洲特级毛片| 欧美激情在线视频二区| 日韩女优一区二区| 欧美激情1区2区3区| 欧美成aaa人片在线观看蜜臀| 人成免费在线视频| 人人狠狠综合久久亚洲婷| 国产一区二区三区网站| a毛片毛片av永久免费| 一本久久青青| 国产亚洲精品成人av久久ww| 国产精品毛片一区二区| 少妇一区二区视频| 国产亚洲成精品久久| 天堂网av2018| 久久久综合色| 久久五月天色综合| 亚洲国产成人精品综合99| 国产精品hd| 亚洲97在线观看| 国产精品第5页| 日韩和的一区二区| 国产精品青草久久久久福利99| 中文精品久久久久人妻不卡| 毛片一区二区三区| 亚洲a区在线视频| 亚洲h视频在线观看| 成人精品在线视频观看| 久久久亚洲综合网站| 国产专区在线播放| 中文字幕一区二区三| 2021狠狠干| 福利影院在线看| 91黄色免费观看| 在线播放免费视频| 豆花视频一区二区| 国产一区二区三区视频| 国产精品99久久久久久成人| 精品成人免费| 国产精品成人av在线| 一区二区www| 成人免费视频视频| 日韩国产伦理| 亚洲91av| 在线亚洲精品福利网址导航| 在线观看视频你懂得| 18国产精品| 国产香蕉精品视频一区二区三区| 免费三级在线观看| 午夜亚洲精品| 成人免费淫片aa视频免费| 香蕉人妻av久久久久天天| 国产欧美一区二区精品忘忧草| 亚洲精品天堂成人片av在线播放| 理论不卡电影大全神| 欧美视频一区二区三区| 亚洲一级av无码毛片精品| 欧美手机在线| 国语自产精品视频在线看一大j8| 亚洲天堂手机版| 成人av在线电影| 中文字幕在线中文字幕日亚韩一区 | 97伦伦午夜电影理伦片| 亚洲经典一区| 国产精品成人观看视频国产奇米| 黄色av网址在线| 国产精品久久久久久久久搜平片 | 鲁大师成人一区二区三区| 91老司机在线| 国产福利在线观看| 精品久久久精品| 中文字幕一二三| 日韩欧美二区| 国产精品扒开腿做爽爽爽的视频| 丰满人妻妇伦又伦精品国产| 国产精品成人网| 日韩在线第三页| 群体交乱之放荡娇妻一区二区 | 黄色a级片在线观看| 日韩综合在线视频| 精品一区久久久| 久久国产精品黑丝| 91精品国产综合久久久久久| 激情五月深爱五月| 天堂午夜影视日韩欧美一区二区| 国产精品美女诱惑| 综合图区亚洲| 制服丝袜激情欧洲亚洲| 免费看黄色三级| 狂野欧美一区| 日韩国产美国| 国产极品久久久久久久久波多结野| 亚洲黄页网在线观看| 亚洲精品午夜久久久久久久| 国产ts人妖一区二区| 日本a级片在线播放| 精品国产一区二区三区性色av | 欧美日本韩国在线| 老牛影视精品| 亚洲精品视频网上网址在线观看 | free性欧美hd另类精品| 欧美嫩在线观看| 懂色av粉嫩av蜜臀av一区二区三区| 日韩电影免费在线看| 欧美日韩视频在线一区二区观看视频 | 欧美经典一区二区三区| 日韩av资源在线| 国产精品欧美三级在线观看| 青青草原成人在线视频| 人操人视频在线观看| 日本韩国欧美在线| 精品人体无码一区二区三区| 加勒比av一区二区| 青青草视频在线视频| 成人资源在线| 2019中文字幕免费视频| 涩爱av在线播放一区二区| 91福利国产精品| www成人啪啪18软件| 精品一区二区精品| 日韩在线视频在线| 牛牛精品成人免费视频| 国产不卡av在线| 午夜不卡视频| 日韩一区二区精品葵司在线| 在线观看 中文字幕| 久久综合九色综合欧美就去吻| 99精品视频播放| 91一区在线| av蓝导航精品导航| 午夜影院在线播放| 日韩一级黄色av| 午夜久久久久久噜噜噜噜| 午夜精品123| 国产成人一区二区在线观看| 国产在线视频不卡二| 亚洲色成人www永久在线观看| 奇米影视777在线欧美电影观看| 国产精品日韩欧美综合| 影音先锋男人资源在线| 精品中文字幕久久久久久| 亚洲视频中文字幕在线观看| 悠悠色在线精品| 国产麻豆天美果冻无码视频 | 欧美va天堂在线| 免费看成人午夜电影| 日本亚洲欧洲无免费码在线| 国产69精品99久久久久久宅男| 韩国中文免费在线视频| 欧美成人三级在线| 国产99免费视频| 亚洲国产日韩av| 91麻豆制片厂| 成人激情校园春色| 国产九九热视频| 一本综合精品| 男女激烈动态图| 精品国产一区一区二区三亚瑟 | 日本免费一区视频| 欧美日韩国产精选| 国产日产精品一区二区三区| 亚洲人成小说网站色在线| 加勒比一区二区| 国产成人免费高清| 99国产精品久久久久久| 久久aⅴ国产紧身牛仔裤| 日韩免费在线观看av| 日韩专区精品| 欧美日韩综合另类| 欧美wwwsss9999| 亚洲最大的网站| 国产成人免费| 国产成人avxxxxx在线看| 超碰99在线| 欧美日韩999| 91亚洲天堂| 日韩视频免费在线| 搞黄视频在线观看| 亚洲女人被黑人巨大进入| 成人小说亚洲一区二区三区| 欧美精品vⅰdeose4hd| 久久精品99北条麻妃| 精品欧美国产一区二区三区| 国产精品美女毛片真酒店| 亚洲精品水蜜桃| 老熟妇高潮一区二区三区| 国产精品丝袜在线| 国产aaaaaaaaa| 国产日产欧美精品一区二区三区| 中文字幕5566| 91亚洲精华国产精华精华液| 日韩大尺度视频| 国产成人免费xxxxxxxx| 一级全黄裸体片| 国产91精品免费| 三上悠亚 电影| 国产大片一区二区| 性生交大片免费看l| 国产精品羞羞答答xxdd| 日韩精品――色哟哟| 国产精品资源在线| 亚洲午夜精品在线观看| 成人毛片在线观看| 波多野结衣影院| 2017欧美狠狠色| 欧美黄色激情视频| 国产欧美日韩综合| 少妇太紧太爽又黄又硬又爽小说 | 激情亚洲综合在线| 91视频福利网| 国产91丝袜在线观看| 欧美性生交xxxxx| 99久久国产综合精品女不卡 | 中文字幕字幕中文在线中不卡视频| 青青青手机在线视频| 综合激情成人伊人| 国产一级理论片| 欧美日韩亚洲天堂| 特级西西444www大胆免费看| 欧美午夜精品久久久久久超碰| 国产一区二区三区三州| 日韩欧美美女一区二区三区| 视频一区 中文字幕| 亚洲男人7777| 青青影院在线观看| 欧美激情在线狂野欧美精品| 中文在线免费二区三区| 国产欧美va欧美va香蕉在| 国产精品日韩精品在线播放| 国产精品对白刺激久久久| 夜夜躁狠狠躁日日躁2021日韩| 亚洲国产综合自拍| 狠狠入ady亚洲精品经典电影| 欧美亚洲国产成人| 久久国产精品第一页| 国产在线不卡av| 国产欧美日韩亚州综合 | 欧美在线观看18| 国产成人精品a视频| 日韩av中文字幕在线播放| 91短视频版在线观看www免费| 操91在线视频| 黑人巨大精品| 91系列在线播放| 宅男在线一区| 国产精品一二三在线观看| 国产精品嫩草99av在线| www激情五月| 国产亚洲视频系列| 欧美成欧美va| 91成人免费网站| 俄罗斯嫩小性bbwbbw| 中文字幕久精品免费视频| 免费看电影在线| 国产精品三级美女白浆呻吟| 国产精品2023| 亚洲一区精彩视频| 先锋亚洲精品| 国产无套精品一区二区三区| 国产精品美女久久久久久久久| 国产精品99re| 欧美福利电影网| 黄色av网站在线免费观看| 欧美激情一区二区三区成人 | 亚洲精品卡一卡二| 日韩欧美亚洲国产一区| 亚洲AV无码一区二区三区少妇| 在线免费观看羞羞视频一区二区| а√天堂8资源在线| 91天堂在线观看| 四虎成人av| 性生交免费视频| 99久久er热在这里只有精品66| 久草手机视频在线观看| 色呦呦一区二区三区| 天天操天天操天天| 欧美另类在线播放| 国产95亚洲| 中日韩在线视频| 日本女优在线视频一区二区| 亚洲第一成人网站| 欧美日韩亚洲精品内裤| 日本xxxxwww| 久久琪琪电影院| 91精品国产自产在线丝袜啪| 精品国产三级a∨在线| 美腿丝袜在线亚洲一区| 三年中国中文观看免费播放| 欧美性猛交xxxx免费看| 天天干天天干天天干| 久久男人av资源网站| 成人在线tv视频| 久久久久久久香蕉| 国产jizzjizz一区二区| 九九视频在线免费观看| 日韩欧美中文字幕精品| 在线观看的网站你懂的| 亚洲在线第一页| 亚洲免费二区| 中文字幕55页| 尤物在线观看一区| 黄色小视频免费观看| 午夜精品www| 日韩欧美中文字幕电影| 国产精品欧美激情在线观看| 91免费版在线看| 久操视频在线免费观看| 中文字幕亚洲欧美日韩高清| 国产福利亚洲| 色一情一乱一乱一区91| 国产.欧美.日韩| 精品成人免费视频| 亚洲男人的天堂网站| 中文字幕系列一区| 在线观看免费91| 国产精品中文有码| 日本一区二区不卡在线| 日韩精品在线播放| 国产美女久久| av动漫在线免费观看| 99在线精品视频| 中文字幕+乱码+中文| 美女999久久久精品视频| 东京久久高清| www.超碰com| 亚洲六月丁香色婷婷综合久久| 亚洲女同志亚洲女同女播放| 欧美在线国产精品| 大色综合视频网站在线播放| 青娱乐国产精品视频| 精品国产91久久久久久| 国产精品无码2021在线观看| 成人在线播放av| 亚洲区第一页| 蜜桃av免费在线观看| 日韩一级免费观看| 在线手机中文字幕| 黄色网址在线免费看| av不卡在线播放| 91av久久久| 91av在线网站| 国产精品成人一区二区不卡| 大乳护士喂奶hd| 欧美日韩午夜精品| a√中文在线观看| 亚洲狠狠婷婷综合久久久| 成人动漫中文字幕| 亚洲一区二区三区高清视频| 午夜精品久久17c| 国产精品久久久久久久免费观看| 欧美性生交xxxxx| 欧美日韩国产另类一区| 不卡av影片| 日韩成人三级视频| 国产精品久久久久久一区二区三区 | 欧美精品一区二区久久久|