精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

探索 mcdse-2b-v1:全新高效的多語言文檔檢索模型 原創(chuàng)

發(fā)布于 2024-11-15 10:35
瀏覽
0收藏

01、概述

在信息時代的浪潮中,各類數(shù)據(jù)以驚人的速度不斷產(chǎn)生,涵蓋文檔、演示文稿、圖像等多種格式。這些信息的多樣性為有效檢索帶來了巨大的挑戰(zhàn)。傳統(tǒng)的檢索模型在處理純文本查詢時表現(xiàn)良好,但面對復(fù)雜的多模態(tài)內(nèi)容(如截圖或幻燈片)時,卻往往力不從心。這對于需要從包含文本和視覺元素的文檔中提取信息的企業(yè)、研究人員和教育工作者來說,尤為棘手。因此,迫切需要一種能夠高效處理這些多樣化內(nèi)容的模型。

02、引入 mcdse-2b-v1:文檔檢索的新方法

今天,我們要向大家介紹 mcdse-2b-v1,這是一款全新的人工智能模型,能夠嵌入頁面或幻燈片截圖,并通過自然語言進行查詢。與依賴文本進行索引和搜索的傳統(tǒng)檢索系統(tǒng)不同,mcdse-2b-v1 讓用戶可以處理包含文字、圖片和圖表的截圖或幻燈片,這為經(jīng)常處理非純文本文檔的用戶打開了新的可能性。用戶只需截取一張演示文稿的截圖或信息圖文檔,將其嵌入模型中,就能通過自然語言搜索獲得相關(guān)信息。

mcdse-2b-v1 架起了傳統(tǒng)文本查詢與更復(fù)雜視覺數(shù)據(jù)之間的橋梁,非常適合那些需要頻繁分析演示文稿、報告或其他視覺文檔內(nèi)容的行業(yè)。這一能力使得該模型在信息豐富的環(huán)境中顯得尤為重要,因為手動瀏覽這些視覺密集的文檔往往耗時且效率低下。與其費力尋找那一張?zhí)囟ǖ幕脽羝蚴侵痦摲喢芗膱蟾妫蝗缋米匀徽Z言直接搜索嵌入內(nèi)容,既節(jié)省了時間,又提升了工作效率。

03、技術(shù)細節(jié)與優(yōu)勢

mcdse-2b-v1(??)基于 MrLight/dse-qwen2-2b-mrl-v1,并采用 DSE 方法進行訓練。它是一款高效、可擴展且多語言的文檔檢索模型,能夠無縫處理混合內(nèi)容源。該模型提供了一種嵌入機制,有效捕捉文本與視覺成分,使得在多模態(tài)數(shù)據(jù)類型之間進行強大的檢索操作成為可能。

mcdse-2b-v1 最顯著的特點之一是其資源效率。例如,它可以在僅 10 GB 的空間內(nèi)嵌入 1 億個頁面。這種優(yōu)化水平使其非常適合數(shù)據(jù)存儲緊張的應(yīng)用場景,如本地解決方案或邊緣計算部署。此外,該模型的體積可以縮小至原來的六分之一,且性能損失極小,這使其能夠在資源有限的設(shè)備上運行,同時保持高檢索準確性。

另一個優(yōu)勢是 mcdse-2b-v1 與常用框架如 Transformers 或 vLLM 的兼容性,這使得其對廣泛用戶而言變得更加可及。這種靈活性使得開發(fā)者和數(shù)據(jù)科學家可以輕松將該模型集成到現(xiàn)有的機器學習工作流中,無需進行大幅修改,極大地方便了使用。

#如何使用

初始化模型和處理器

from transformers import AutoProcessor, Qwen2VLForConditionalGeneration
from PIL import Image
import torch
import math

model = Qwen2VLForConditionalGeneration.from_pretrained(
    'marco/mcdse-2b-v1',
    attn_implementation="flash_attention_2",
    torch_dtype=torch.bfloat16,
    device_map="cuda:0"
).eval()

min_pixels = 1 * 28 * 28
max_pixels = 960 * 28 * 28

processor = AutoProcessor.from_pretrained(
    'marco/mcdse-2b-v1',
    min_pixels=min_pixels,
    max_pixels=max_pixels
)

model.padding_side = "left"
processor.tokenizer.padding_side = "left"

document_prompt = "<|im_start|>system\nYou are a helpful assistant.<|im_end|>\n<|im_start|>user\n<|vision_start|><|image_pad|><|vision_end|>What is shown in this image?<|im_end|>\n<|endoftext|>"

query_prompt = "<|im_start|>system\nYou are a helpful assistant.<|im_end|>\n<|im_start|>user\n<|vision_start|><|image_pad|><|vision_end|>Query: %s<|im_end|>\n<|endoftext|>"

對查詢進行編碼

def encode_queries(queries: list[str], dimension: int):
    dummy_image = Image.new('RGB', (56, 56))
    inputs = processor(
        text=[query_prompt % x for x in queries],
        images=[dummy_image for _ in queries],
        videos=None,
        padding='longest',
        return_tensors='pt'
    ).to('cuda:0')

    cache_position = torch.arange(0, len(queries))
    inputs = model.prepare_inputs_for_generation(
        **inputs, cache_position=cache_position, use_cache=False)

    with torch.no_grad():
        output = self.model(
            **inputs,
            return_dict=True,
            output_hidden_states=True
        )
    
    embeddings = output.hidden_states[-1][:, -1]
    return torch.nn.functional.normalize(embeddings[:, :dimension], p=2, dim=-1)

對文檔進行編碼

def round_by_factor(number: float, factor: int) -> int:
    return round(number / factor) * factor

def ceil_by_factor(number: float, factor: int) -> int:
    return math.ceil(number / factor) * factor

def floor_by_factor(number: float, factor: int) -> int:
    return math.floor(number / factor) * factor

def smart_resize(height: int, width: int) -> tuple[int, int]:
        h_bar = max(28, round_by_factor(height, 28))
        w_bar = max(28, round_by_factor(width, 28))
        if h_bar * w_bar > max_pixels:
            beta = math.sqrt((height * width) / max_pixels)
            h_bar = floor_by_factor(height / beta, 28)
            w_bar = floor_by_factor(width / beta, 28)
        elif h_bar * w_bar < min_pixels:
            beta = math.sqrt(min_pixels / (height * width))
            h_bar = ceil_by_factor(height * beta, 28)
            w_bar = ceil_by_factor(width * beta, 28)
        return h_bar, w_bar

def resize(image: Image.Image):
    new_size = smart_resize(image.height, image.width)
    return image.resize(new_size)

def encode_documents(documents: list[Image.Image], dimension: int):
    inputs = processor(
        text=[document_prompt] * len(documents),
        images=[resize(x) for x in documents],
        videos=None,
        padding='longest',
        return_tensors='pt'
    ).to('cuda:0')

    cache_position = torch.arange(0, len(queries))
    inputs = model.prepare_inputs_for_generation(
        **inputs, cache_position=cache_position, use_cache=False)

    with torch.no_grad():
        output = self.model(
            **inputs,
            return_dict=True,
            output_hidden_states=True
        )
    
    embeddings = output.hidden_states[-1][:, -1]
    return torch.nn.functional.normalize(embeddings[:, :dimension], p=2, dim=-1)

對比結(jié)果

探索 mcdse-2b-v1:全新高效的多語言文檔檢索模型-AI.x社區(qū)

04、mcdse-2b-v1 的重要性

mcdse-2b-v1 的意義不僅在于其高效的信息檢索能力,更在于它如何使復(fù)雜文檔分析變得更加平易近人。傳統(tǒng)的文檔檢索方法往往需要精確的結(jié)構(gòu)化,并且常常忽視現(xiàn)代文檔中豐富的視覺元素。而 mcdse-2b-v1 的出現(xiàn),讓用戶可以像進行文本查詢一樣,輕松訪問嵌入在圖表、圖示及其他非文本組件中的信息。

初步結(jié)果顯示,即使在壓縮至原始大小的六分之一時,mcdse-2b-v1 依然能夠持續(xù)提供高檢索準確率。這種性能使其適合于大規(guī)模部署,而不必擔心典型的計算開銷。此外,其多語言能力意味著它可以為全球范圍內(nèi)的用戶提供服務(wù),對于在多個語言環(huán)境中運作的跨國組織或?qū)W術(shù)機構(gòu)而言,尤其寶貴。

對于那些從事多模態(tài)檢索增強生成(RAG)工作的人員來說,mcdse-2b-v1 提供了一種可擴展的解決方案,能夠為包含文本和視覺內(nèi)容的文檔提供高性能的嵌入。這種結(jié)合增強了下游任務(wù)的能力,如回答復(fù)雜用戶查詢或從多模態(tài)輸入中生成詳細報告。

05、結(jié)語

mcdse-2b-v1 通過嵌入頁面和幻燈片截圖,具備了可擴展性、效率和多語言能力,從而解決了多模態(tài)文檔檢索的挑戰(zhàn)。它簡化了與復(fù)雜文檔的互動,使用戶免于繁瑣的手動搜索過程。用戶將獲得一種強大的檢索模型,有效處理多模態(tài)內(nèi)容,認識到現(xiàn)實數(shù)據(jù)的復(fù)雜性。這一模型重新定義了我們?nèi)绾卧L問和與嵌入文本和視覺知識互動,為文檔檢索設(shè)定了新的標準。

通過以上的介紹,相信大家對 mcdse-2b-v1 有了更深入的了解。這一模型不僅將推動文檔檢索技術(shù)的發(fā)展,也將改變我們處理信息的方式,讓知識獲取變得更加高效和便捷。歡迎大家繼續(xù)關(guān)注這一領(lǐng)域的最新動態(tài)!

參考:

  1. ??https://huggingface.co/marco/mcdse-2b-v1??



本文轉(zhuǎn)載自公眾號Halo咯咯 作者:基咯咯

原文鏈接:??https://mp.weixin.qq.com/s/JKLE-CuZzBvG53gJKxDScw??


?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請注明出處,否則將追究法律責任
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦
欧美三级一区二区| 国产喷白浆一区二区三区| 欧美xxxx做受欧美.88| www.黄色网| 伊人久久在线| 亚洲欧美日本在线| 欧美理论一区二区| 国产日韩欧美视频在线观看| 欧美日一区二区在线观看| 日韩精品中文字幕久久臀| 手机版av在线| 激情aⅴ欧美一区二区欲海潮| 久久精品亚洲一区二区三区浴池| 成人午夜在线视频一区| 日本三级视频在线| 午夜精品毛片| 亚洲精品有码在线| 真实乱偷全部视频| 国产精品久久久久久妇女| 一区二区三区在线观看动漫| 欧美日韩在线高清| 后进极品白嫩翘臀在线视频| 日韩成人一级大片| 97精品国产91久久久久久| 日韩欧美在线视频播放| 欧美三级午夜理伦三级在线观看| 欧美久久一区二区| 国产xxxxx在线观看| 视频在线观看入口黄最新永久免费国产| 91美女在线观看| caoporen国产精品| 91国内精品久久久| 日韩综合小视频| 欧美与黑人午夜性猛交久久久| 国产av无码专区亚洲av毛网站| 精品国产中文字幕第一页| 精品视频中文字幕| 国产精品手机在线观看| 亚洲第一二区| 欧美一区二区三区啪啪| 黄色在线视频网| 蜜桃视频成人m3u8| 色一情一乱一乱一91av| 激情五月宗合网| 国产在线xxx| 亚洲小说欧美激情另类| 伊人再见免费在线观看高清版 | 男人天堂a在线| 老司机在线视频二区| 国产日产欧美一区二区三区| 精品一卡二卡三卡四卡日本乱码| 亚洲xxxx天美| 福利91精品一区二区三区| 亚洲一区免费网站| 国产黄色片免费| 国产不卡在线视频| 99精彩视频| 亚洲第一天堂在线观看| 国产91丝袜在线播放0| 91免费观看| 亚洲欧美激情国产综合久久久| 国产精品亚洲成人| 国产98在线|日韩| 国产自产一区二区| 2023国产精品自拍| 日韩欧美一区二区在线观看| 97超碰国产一区二区三区| 国产精品欧美久久久久无广告| 亚洲精品永久www嫩草| 69久久久久| 亚洲男人的天堂网| 成人一级生活片| 美女高潮在线观看| 在线观看国产精品网站| 91看片破解版| www.丝袜精品| 精品一区二区电影| 国精产品一区一区| 在线中文一区| 午夜精品福利视频| 成人小视频在线播放| 蓝色福利精品导航| 99精彩视频| 国模精品一区二区| 亚洲欧美影音先锋| 丰满少妇久久久| av成人免费看| 精品久久久久香蕉网| www.久久国产| 久久久久蜜桃| 91国内在线视频| 一二三区在线播放| a美女胸又www黄视频久久| 日韩欧美手机在线| 中文在线免费| 色综合久久综合中文综合网| 中文字幕线观看| 国产厕拍一区| 在线播放精品一区二区三区| 免费麻豆国产一区二区三区四区| 亚洲欧美日韩视频二区| 亚洲一区制服诱惑| 蝌蚪视频在线播放| 亚洲一二三区在线观看| 国产一伦一伦一伦| 日韩av三区| 欧美乱妇高清无乱码| 在线视频一区二区三区四区| 精品中文字幕一区二区| 久久久综合亚洲91久久98| 黄色精品在线观看| 色悠久久久久综合欧美99| 麻豆精品国产传媒| 日韩免费一区| 日本韩国欧美精品大片卡二| 亚洲国产成人一区二区| 国产精品天天看| 亚洲国产精品久久久久婷蜜芽| 国产色99精品9i| 最近2019年手机中文字幕| 天天操天天摸天天干| 国产一区二区不卡老阿姨| 视频一区二区三| 成人私拍视频| 亚洲国产精品系列| 黄色一级片在线| 久久精品av麻豆的观看方式| 欧美成人一区二区在线| 麻豆福利在线观看| 欧美一级欧美一级在线播放| 人妻熟人中文字幕一区二区| 一区二区黄色| 国产综合18久久久久久| 青春草在线视频| 日韩欧美一级在线播放| 91久久久久久久久久久久久久| 免费一级欧美片在线播放| 国产亚洲精品久久飘花| 人人超在线公开视频| 日韩视频一区二区三区在线播放| 免费观看特级毛片| 美腿丝袜一区二区三区| 日韩电影免费观看在| 性欧美hd调教| 亚洲香蕉av在线一区二区三区| 国产成人亚洲精品自产在线| 成人免费视频网站在线观看| 一区二区三区四区在线视频| 欧美123区| 永久免费毛片在线播放不卡| 五月婷婷激情五月| 国产精品久久久久久久久免费丝袜| 欧美亚洲另类色图| 亚洲精品一级二级三级| 日韩免费观看在线观看| 国产福利小视频在线观看| 欧亚洲嫩模精品一区三区| 国产性猛交xx乱| 捆绑调教美女网站视频一区| 一区二区视频在线免费| 国产一区二区三区免费观看在线| 精品国偷自产在线视频99| 一本色道久久综合精品婷婷| 亚洲色图视频网| 丰满人妻一区二区三区大胸 | 欧美成人亚洲成人日韩成人| 国产精品熟女久久久久久| 亚洲欧美乱综合| 极品白嫩的小少妇| 性感少妇一区| 亚洲mv在线看| 日本超碰一区二区| 97色在线观看| 98在线视频| 精品国产三级a在线观看| 国产精品老女人| 亚洲国产精品高清| 亚洲综合伊人久久| a91a精品视频在线观看| 日本亚洲欧洲精品| 中文成人激情娱乐网| 欧美激情第一页xxx| 五月婷婷激情在线| 欧美午夜电影网| 久久久久亚洲AV成人| 95精品视频在线| 天堂视频免费看| 亚洲精品123区| 色阁综合av| 午夜免费欧美电影| 国产不卡精品视男人的天堂| 免费黄网在线观看| 亚洲高清一区二| 亚洲天天综合网| 性做久久久久久免费观看| 亚洲色图 激情小说| 成人中文字幕电影| 天堂一区在线观看| 亚洲日本激情| 国产日韩第一页| 亚洲免费成人av在线| 亚洲精品日韩激情在线电影| 欲香欲色天天天综合和网| 日韩中文字幕视频| 天堂av在线资源| 欧美日韩一区二区欧美激情| 国产主播在线播放| 亚洲欧洲日韩一区二区三区| 欲求不满的岳中文字幕| 久久激情综合网| av片中文字幕| 亚洲青色在线| 996这里只有精品| 99久久亚洲精品蜜臀| 美乳视频一区二区| 一区二区三区四区视频免费观看| 国产精品久久久久久久一区探花| 丁香花电影在线观看完整版| 精品国产自在精品国产浪潮| 天堂中文在线8| 亚洲精品一区二区三区香蕉| 国产精品毛片久久久久久久av| 日本韩国欧美在线| 人人爽人人爽人人片av| 午夜久久久久久电影| 欧美被狂躁喷白浆精品| 国产精品国产三级国产普通话蜜臀| 性欧美成人播放77777| 成人午夜精品在线| 少妇欧美激情一区二区三区| 久久精品免费看| 视频二区在线播放| 久久一区视频| 成人午夜视频免费在线观看| 在线看片欧美| 17c丨国产丨精品视频| 久久久久亚洲| 中文字幕免费在线不卡| 日韩久久精品| 亚洲亚洲精品三区日韩精品在线视频| 久久99视频| 久久一区二区精品| 女仆av观看一区| 精品免费日产一区一区三区免费| 嗯用力啊快一点好舒服小柔久久| 亚洲直播在线一区| 精品欧美视频| 99精彩视频| 久久a爱视频| 久久偷看各类wc女厕嘘嘘偷窃| 老司机精品在线| 免费久久99精品国产自| 亚洲欧美tv| 欧美日韩一区在线视频| 欧美色图国产精品| 一区二区三区的久久的视频| 区一区二视频| 中文字幕99| 韩国在线视频一区| a级黄色一级片| 天堂一区二区在线| 中文av一区二区三区| 国产一区在线不卡| 永久免费未满蜜桃| 久久女同互慰一区二区三区| 91视频免费在观看| 亚洲视频一二区| 国产精品日日夜夜| 日韩欧美亚洲成人| 一本久道久久综合无码中文| 日韩一区二区视频在线观看| 欧洲成人一区二区三区| 精品丝袜一区二区三区| 日本网站在线免费观看视频| 欧美区二区三区| www.com.cn成人| 国产精品爽爽爽爽爽爽在线观看| 成人av在线播放| 精品一区二区三区免费毛片| 欧洲三级视频| 免费极品av一视觉盛宴| 国产精品视区| 羞羞的视频在线| 成人免费视频视频在线观看免费| 在线观看日本中文字幕| 亚洲视频精选在线| 久久久久99精品成人片三人毛片| 欧美三区在线观看| 欧美天堂在线视频| 日韩在线观看网站| bbw在线视频| 国产在线精品成人一区二区三区| 综合久久成人| 亚洲欧洲国产精品久久| 韩日欧美一区| www.久久91| 99久久国产综合色|国产精品| 日韩av片在线| 午夜成人免费视频| 国产露脸国语对白在线| 亚洲精品自在久久| 在线观看的网站你懂的| 国产激情999| 精品国内亚洲2022精品成人| 亚洲一区二区三区乱码| 国产亚洲福利| 香蕉视频在线观看黄| 国产亚洲欧洲997久久综合 | 欧美视频在线免费| 精品久久在线观看| 在线播放国产精品| 蜜桃视频在线网站| 91日韩久久| 91亚洲国产| 日本男人操女人| 波多野结衣在线一区| 国产尤物在线播放| 在线视频一区二区免费| 天天摸天天碰天天爽天天弄| 久久这里有精品视频| 日韩中文在线播放| 免费在线国产精品| 影音先锋久久精品| 可以看的av网址| 中文字幕在线不卡一区| 综合网在线观看| 亚洲精品国产精品乱码不99按摩| 色婷婷视频在线观看| 国产日韩欧美另类| 欧美一区二区三区激情视频 | 精品97人妻无码中文永久在线| 欧美三级中文字| 成人在线免费公开观看视频| 欧美怡春院一区二区三区| 美女扒开腿让男人桶爽久久动漫| 免费cad大片在线观看| 国产精品影视在线观看| 久久国产精品国语对白| 欧美区在线观看| 777电影在线观看| 国产一区二区在线播放| 999久久久精品国产| 黄色av免费在线播放| 国产视频一区在线播放| 国产一级免费视频| 亚洲天堂av电影| 综合在线影院| 亚洲精品一区二区三区av| 久久99精品久久久| 中文字幕美女视频| 欧美一区二区三区婷婷月色 | 亚洲一区在线看| 丰满少妇被猛烈进入| 久久久免费在线观看| 国产精品17p| 国产综合免费视频| 国产女人18毛片水真多成人如厕| 波多野结衣视频在线看| 三级精品视频久久久久| 麻豆精品久久| 日本精品久久久久久久久久| a级高清视频欧美日韩| 精品免费囯产一区二区三区 | 干b视频在线观看| 欧美日韩激情在线| 成人影欧美片| 国产亚洲二区| 日韩高清国产一区在线| 色老板免费视频| 亚洲精品一区二区精华| 欧洲一区二区三区精品| 亚洲欧洲精品一区二区| 九九在线精品视频| 久久久久久激情| 亚洲欧美日韩国产成人| 欧美日韩伦理一区二区| 欧美一区二区三区综合| hitomi一区二区三区精品| 婷婷激情五月综合| 欧美xxxx做受欧美| 伊甸园亚洲一区| 成人高清在线观看视频| 精品动漫一区二区三区| 在线日本中文字幕| 国产一区二区高清不卡| 美女精品一区二区| 久久9999久久免费精品国产| 亚洲美女视频网| 欧美1区2区3| 嫩草av久久伊人妇女超级a| 亚洲精品视频在线看| 免费在线高清av| 国产91精品入口17c| 免费精品视频最新在线| 18精品爽视频在线观看| 在线视频中文亚洲| 女同久久另类99精品国产| 国产欧美一区二| 欧美视频一二三| 男女羞羞视频在线观看|