精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

一文讀懂:從RAG到多模態(tài)RAG 原創(chuàng) 精華

發(fā)布于 2024-11-1 15:56
瀏覽
0收藏

如果說2023年見證了大語言模型的“寒武紀(jì)大爆發(fā)”,那么2024年則是多模態(tài)大模型“元年”。GPT-4o的出現(xiàn)讓大家見識(shí)到多模態(tài)能力引入,給下游應(yīng)用生態(tài)帶來的巨大改變。隨之而來的,RAG技術(shù)也將逐漸從單語言模態(tài)的RAG進(jìn)化到多模態(tài)RAG。本文將帶大家速覽多模態(tài)RAG技術(shù)的原理及實(shí)現(xiàn)。

一文讀懂:從RAG到多模態(tài)RAG-AI.x社區(qū)

什么是RAG

什么是RAG:Retrieval Augmented Generation,檢索增強(qiáng)生成。是一種結(jié)合了信息檢索技術(shù)和大型語言模型提示功能的框架。它通過從數(shù)據(jù)源檢索信息來輔助LLM生成答案,提高了模型在知識(shí)密集型任務(wù)中的準(zhǔn)確性和可信度。

我們?yōu)槭裁葱枰猂AG:大型語言模型通?;诠潭ǖ臍v史數(shù)據(jù)集進(jìn)行訓(xùn)練,這意味著它們的知識(shí)是過時(shí)的,無法涵蓋最新的信息或特定領(lǐng)域的專業(yè)知識(shí)。RAG的目的是通過引入額外知識(shí)庫,檢索其中的相關(guān)信息,并根據(jù)檢索結(jié)果給予用戶回答。這也可以顯著減少大模型因?yàn)椴⒉痪邆湎嚓P(guān)知識(shí),而出現(xiàn)的“幻覺”現(xiàn)象。當(dāng)然我們也可以直接把整個(gè)數(shù)據(jù)庫作為L(zhǎng)LM的prompt輸入,但由于transformer架構(gòu)O(N2)復(fù)雜度的限制,LLM支持的最長(zhǎng)輸入長(zhǎng)度通常有限,多數(shù)支持到128k token已經(jīng)是極限,使得在面臨更長(zhǎng)知識(shí)庫輸入時(shí),RAG依然是當(dāng)下唯一可行的解決方案。

如何實(shí)現(xiàn)RAG:在實(shí)際應(yīng)用時(shí),我們常需要給定一系列文檔,并使用RAG方法,讓LLM針對(duì)這些文檔進(jìn)行檢索與交互。RAG的實(shí)現(xiàn)主要包含以下幾個(gè)步驟:

  • 數(shù)據(jù)準(zhǔn)備階段:包括數(shù)據(jù)提取、分塊(chunking)、向量化(embedding)、數(shù)據(jù)入庫等環(huán)節(jié)。數(shù)據(jù)提取涉及將不同格式的數(shù)據(jù)(如PDF、Word、數(shù)據(jù)庫等)處理為統(tǒng)一的格式。分塊是將大文檔分割成較小的、語義完整的單元,以便于后續(xù)處理和檢索。
  • 檢索階段:系統(tǒng)根據(jù)輸入查詢檢索相關(guān)文檔或信息。這個(gè)階段依賴于搜索算法和索引方法來快速識(shí)別大量集合中最相關(guān)的數(shù)據(jù)。
  • 增強(qiáng)階段:將用戶查詢和檢索到的額外上下文放入一個(gè)提示模板中,以增強(qiáng)提示。
  • 生成階段:使用大型語言模型來針對(duì)檢索結(jié)果,生成對(duì)用戶的回復(fù)。?

走向多模態(tài)RAG

從RAG的應(yīng)用可以看出,多數(shù)時(shí)候,我們需要把一些文檔作為RAG的輸入,用于檢索和生成。而現(xiàn)實(shí)應(yīng)用中,文檔通常是以圖文交錯(cuò)的形式存在的,比如網(wǎng)頁、PDF、PPT文件等等。

通常的做法是,只保留文檔中的文本信息。對(duì)于PDF文檔,則進(jìn)行OCR文字識(shí)別,讀取其中的文本。但這樣會(huì)導(dǎo)致大量圖片中至關(guān)重要的信息被丟失,以及很多結(jié)構(gòu)化內(nèi)容的錯(cuò)亂,比如標(biāo)題、表格、頁眉頁腳等格式錯(cuò)亂。

改進(jìn)的做法是,把所有模態(tài)信息都轉(zhuǎn)換為純文本,再進(jìn)行RAG。我們可以使用多種計(jì)算機(jī)視覺模型,比如檢測(cè)模型對(duì)文檔結(jié)構(gòu)進(jìn)行識(shí)別,然后對(duì)文檔中不同的模塊,使用不同的“廣義OCR模型”進(jìn)行解析。比如對(duì)于文本段落,使用OCR模型進(jìn)行文本識(shí)別;對(duì)于表格,可以用表格模型進(jìn)行識(shí)別轉(zhuǎn)換為Markdown或LaTeX文本;對(duì)于公式,則套用公式識(shí)別轉(zhuǎn)換為L(zhǎng)aTeX;對(duì)于圖片,則可使用多模態(tài)大模型如GPT-4o進(jìn)行文本解讀(caption),保存為文本描述。有很多開源的工具可以完成這些事情,比如MinerU等。通過解析算法,多模態(tài)數(shù)據(jù)就被完全轉(zhuǎn)換為純文本的格式了,也就可以照葫蘆畫瓢套用純文本的RAG方法了。

一文讀懂:從RAG到多模態(tài)RAG-AI.x社區(qū)

圖像來源: 張穎峰 | 所見即所得:多模態(tài)RAG正在向我們走來

我們注意到,使用上述的方法,信息不可避免會(huì)存在丟失,而且依賴過多的解析模型。而時(shí)間來到2024年,多模態(tài)大模型實(shí)現(xiàn)了爆發(fā)式的技術(shù)突破,高分辨率的視覺輸入已經(jīng)取得了巨大突破,使用單一的多模態(tài)大模型做廣義OCR也變得非常容易。比如QWen2-VL以及InternVL-2等開源多模態(tài)大模型,在文檔的廣義OCR上都有非常好的效果。

一文讀懂:從RAG到多模態(tài)RAG-AI.x社區(qū)

多模態(tài)大模型成功,讓端到端(end-to-end)的算法已經(jīng)成為了主流。原生多模態(tài)的RAG算法也成為了可能:既然多模態(tài)大模型有能力理解文本,那我們其實(shí)即無需再把圖像轉(zhuǎn)換為文本,而可以直接使用圖像,提取embedding去做RAG。

一文讀懂:從RAG到多模態(tài)RAG-AI.x社區(qū)

即從圖(a)轉(zhuǎn)變?yōu)閳D(b)的模式

DSE

??https://arxiv.org/abs/2406.11251??

一文讀懂:從RAG到多模態(tài)RAG-AI.x社區(qū)

DSE,即Document Screenshot Embedding,是一個(gè)不使用廣義OCR的多模態(tài)RAG方法,直接把原始文檔的掃描圖片,切片后,使用視覺語言模型的編碼器編碼。其對(duì)query和docunment使用了雙編碼的架構(gòu)。驗(yàn)證了這一想法的可行性。

ColPali

??https://arxiv.org/abs/2407.01449??

一文讀懂:從RAG到多模態(tài)RAG-AI.x社區(qū)

ColPali架構(gòu)也是利用視覺語言模型來從文檔頁面的圖像中產(chǎn)生高質(zhì)量的上下文化嵌入。ColPali使用了延遲交互(late interaction)技術(shù),大大提高了檢索效率,同時(shí)在檢索性能上超越了現(xiàn)有的文檔檢索系統(tǒng),并且具有更快的處理速度和可端到端訓(xùn)練的特點(diǎn)。上圖對(duì)比了傳統(tǒng)的文檔RAG與多模態(tài)RAG的區(qū)別。因?yàn)闇p少了廣義OCR的解析過程,使得處理速度也有了質(zhì)的提升。

一文讀懂:從RAG到多模態(tài)RAG-AI.x社區(qū)

CoPali其實(shí)從名字上看,就知道靈感來源于兩個(gè)工作,PaliGemma和CoBERT。PaliGemma 是 Google 開發(fā)的一款具有多模態(tài)功能的視覺語言模型,它結(jié)合了視覺模型 SigLIP 和大型語言模型 Gemma?!癈ol” 則來自于ColBERT 的延遲交互編碼器。ColPali 算是延遲交互編碼器在多模態(tài) RAG 檢索的應(yīng)用,并且極大提高了檢索召回的精度。

延遲交互編碼結(jié)合了雙編碼器和交叉編碼器的優(yōu)點(diǎn)。在這種架構(gòu)中,query和文檔被分別編碼成獨(dú)立的embedding集合,然后通過一個(gè)高效的交互機(jī)制來計(jì)算它們之間的相似度。


一文讀懂:從RAG到多模態(tài)RAG-AI.x社區(qū)


延遲交互編碼的核心思想是將查詢和文檔的編碼過程分開,這樣文檔的編碼可以離線完成,而查詢的編碼則在在線階段進(jìn)行。這種方法的優(yōu)點(diǎn)是可以在查詢時(shí)僅對(duì)查詢進(jìn)行編碼,從而大大提高了處理速度。此外,由于文檔的編碼是預(yù)先完成的,可以將其存儲(chǔ)在數(shù)據(jù)庫中,這樣就可以對(duì)更多的文檔進(jìn)行排序,從而提高查詢的精度。

在延遲交互編碼中,一個(gè)關(guān)鍵的計(jì)算是最大相似性(MaxSim)函數(shù),它計(jì)算每個(gè)查詢Token向量與所有文檔Token向量之間的相似度,并跟蹤每個(gè)查詢Token的最大得分。查詢和文檔的總相似度分?jǐn)?shù)是這些最大余弦相似度分?jǐn)?shù)的總和。這種方法允許模型在保持較高排序質(zhì)量的同時(shí),也具備較高的性能。

隨著多模態(tài)大語言模型能力的增強(qiáng),以它為基礎(chǔ)的多模態(tài)RAG,也早已突破了傳統(tǒng)的圖像檢索的應(yīng)用方式,而是真正具備大規(guī)模非結(jié)構(gòu)化多模態(tài)數(shù)據(jù)深度理解的能力,將會(huì)有更多toB的商業(yè)應(yīng)用價(jià)值。


本文轉(zhuǎn)載自公眾號(hào)思源數(shù)據(jù)科學(xué) 作者:思源Source

原文鏈接:??https://mp.weixin.qq.com/s/IDkIjZfyfllajfoWh4mlLQ???

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請(qǐng)注明出處,否則將追究法律責(zé)任
標(biāo)簽
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
亚洲午夜极品| 国产中文字幕免费观看| 男插女视频网站| 天堂影院在线| 成人全视频在线观看在线播放高清| 国产精品白丝jk白祙喷水网站| 亚洲美女自拍视频| 91传媒视频在线观看| 免费一级做a爰片久久毛片潮| 日本乱理伦在线| 久久福利资源站| 国产婷婷成人久久av免费高清| 欧美视频在线第一页| 国产精品自偷自拍| 欧美xxxx中国| 欧美日韩一区 二区 三区 久久精品 | 国产精品观看在线亚洲人成网| 国产一级片中文字幕| 高潮在线视频| 成人aaaa免费全部观看| 久久97精品久久久久久久不卡| 色播五月激情五月| 8888四色奇米在线观看| 日日夜夜免费精品| 亚洲视频专区在线| 国产成人综合一区| 黄色大片在线看| 视频一区视频二区中文字幕| 亚洲欧美中文字幕在线一区| 欧美性受xxxx黒人xyx性爽| 老司机午夜在线| 精品一区二区三区免费| 2024亚洲男人天堂| 动漫精品一区二区三区| 日韩电影大全网站| 国产欧美va欧美不卡在线| 国产精品久久久久免费a∨| 手机av在线不卡| 日韩在线激情| 一区二区久久久久久| av噜噜色噜噜久久| 国产精品久久久久久久妇| 亚洲精品国产动漫| 欧美性感一区二区三区| 一区二区免费在线观看| 国产成人精品亚洲精品色欲| 国产精品hd| 亚洲区免费影片| 亚洲天堂美女视频| 亚洲mmav| 亚洲精品乱码久久久久久久久 | 国产精品国产三级国产有无不卡 | 99在线精品视频免费观看软件| 丝袜脚交一区二区| 国产91免费观看| 日韩欧美在线视频播放| 成人亚洲精品| 亚洲国产美国国产综合一区二区| 久久久99国产精品免费| 日批视频免费观看| 欧美高清不卡| 亚洲美腿欧美激情另类| 精品无码人妻一区| 色爱av综合网| 欧美一级日韩不卡播放免费| 日本黄色播放器| 日韩一级免费视频| 奇米一区二区三区| 欧美日韩xxxxx| 精品99在线观看| 神马电影久久| 日韩一区二区在线观看视频| 国产大学生av| 制服诱惑亚洲| 91官网在线观看| 国产精品三级一区二区| 日韩电影免费观看| 亚洲国产精品精华液网站| 成年人午夜免费视频| 日本欧美在线视频免费观看| av一区二区三区黑人| 91精品久久久久久久久久入口| 日本一二三区视频| 99久久婷婷| 亚洲人成电影在线观看天堂色| 受虐m奴xxx在线观看| 成人在线视频你懂的| 欧美日韩免费一区二区三区 | 在线不卡av电影| 人人狠狠综合久久亚洲婷婷| 亚洲精品美女久久| 潘金莲一级淫片aaaaaaa| 麻豆精品av| 日韩午夜激情视频| 亚洲蜜桃精久久久久久久久久久久| 免费精品一区| 欧美日韩不卡在线| 美女露出粉嫩尿囗让男人桶| 91国产一区| 欧美日韩一二三区| 国内自拍偷拍视频| 精品香蕉视频| 一本色道久久综合狠狠躁篇的优点| 欧亚乱熟女一区二区在线| 欧美美女在线观看| 九色91av视频| 涩涩视频在线观看| 成人va在线观看| 亚洲三级一区| 国产自产自拍视频在线观看| 欧美日韩性生活| 涩视频在线观看| 国产精品videosex性欧美| 97超碰色婷婷| 国产小视频在线观看免费| 国产精品v亚洲精品v日韩精品| 国产成人福利视频| 男操女视频网站| 久久视频一区| 国产精品99久久久久久久 | 国产精品一区二区在线观看不卡 | 日韩精品视频一区二区| 国产国产精品| 国产精品久久久久久久久久久久久| 蜜桃视频在线观看www| 亚洲丝袜另类动漫二区| 亚洲午夜精品一区二区| 中国色在线日|韩| 91久久精品国产91性色tv| 韩国三级在线看| 外国成人激情视频| 国产精品香蕉在线观看| 国产麻豆精品一区| 国产成人啪午夜精品网站男同| av一区二区三区四区电影| 午夜视频在线免费观看| 在线观看av不卡| 亚洲国产日韩欧美在线观看| 国产精品99久久免费| 在线观看欧美视频| 天干夜夜爽爽日日日日| 蜜乳av一区二区| 亚洲一区二区三区乱码aⅴ蜜桃女| 99精品视频在线播放免费| 中文字幕 久热精品 视频在线| 中文字幕一区二区三区有限公司| 色av手机在线| 日韩一区二区视频| 538任你躁在线精品视频网站| 亚洲性图久久| 国产精品久久9| 国产精品一区二区婷婷| 亚洲欧美电影院| 日韩精品视频一区二区在线观看| 亚洲一区二区三区中文字幕在线观看| 日韩精品在线观看视频| 日韩视频免费观看高清| 蜜臀av性久久久久蜜臀av麻豆 | 波多野结衣一区| 国产97在线|亚洲| 国产粉嫩一区二区三区在线观看| 色综合激情久久| 午夜一区二区视频| 女同久久另类99精品国产| 中文字幕日韩免费视频| 日本三级欧美三级| 99视频在线精品| 日本精品免费在线观看| 怕怕欧美视频免费大全| 国产精品video| 免费黄色在线网站| 色综合久久综合网欧美综合网| 西西444www无码大胆| 麻豆精品一区二区三区| 久久综合伊人77777麻豆| 黄网站视频在线观看| 日韩欧美一二区| 国产大屁股喷水视频在线观看| 精一区二区三区| 国产精品久久久久久久久电影网| 成人国产一区二区三区精品麻豆| 日韩中文字幕亚洲| 青青草视频在线观看免费| 国产精品美日韩| 日韩欧美在线免费观看视频| 成人vr资源| 成人资源视频网站免费| 亚洲天堂资源| 亚洲国产精品热久久| 午夜免费激情视频| 91玉足脚交白嫩脚丫在线播放| 4444在线观看| 高清一区二区中文字幕| 久久久中精品2020中文| 亚洲国产日韩在线观看| 中文字幕在线一区免费| 欧美性生交xxxxx| 日本麻豆一区二区三区视频| 日本a级片在线播放| 国产精品最新| 日韩av手机在线观看| 精品51国产黑色丝袜高跟鞋| 国产丝袜一区二区三区免费视频| 国产老女人乱淫免费| 日本韩国欧美一区二区三区| 麻豆91精品91久久久| 99久久精品免费看国产| 加勒比av中文字幕| 日韩专区欧美专区| 一卡二卡三卡视频| 大桥未久女教师av一区二区| 欧美激情xxxxx| 成人毛片在线免费观看| 亚洲国产日韩在线一区模特| 免费黄色片网站| 另类成人小视频在线| 欧美亚洲精品一区二区| 亚洲人成伊人成综合图片| 91视频免费在线观看| 激情小说亚洲| 欧美成年人在线观看| 国内老熟妇对白hdxxxx| 欧美亚洲日本一区| 欧美日韩精品区| 亚洲一区二区在线观看视频| 在线黄色免费网站| 国产一区二区不卡在线| www.夜夜爱| 国产精品毛片一区二区在线看| 麻豆视频成人| 少妇高潮一区二区三区| 国产精品国产三级欧美二区| www.综合| 久久久久国色av免费观看性色| 色wwwwww| 在线欧美小视频| 免费看日韩毛片| 午夜久久久久久| 三上悠亚ssⅰn939无码播放| 国产91在线观看丝袜| 欧美三级一级片| 亚洲高清在线| 成人黄色大片网站| 亚洲福利电影| 妞干网在线视频观看| 欧洲grand老妇人| 欧美日韩日本网| 日本一区二区三区电影免费观看| 7777kkkk成人观看| 密臀av在线播放| 久久精品中文字幕免费mv| 亚洲AV无码精品自拍| 欧美一级高清大全免费观看| 国产成人麻豆精品午夜在线| 日韩欧美一二区| 你懂的网站在线| 日韩精品欧美国产精品忘忧草| 完全免费av在线播放| 亚洲午夜精品久久久久久性色| 亚洲无码精品国产| 亚洲成人av一区二区三区| 久久久久久久久久99| 亚洲超碰精品一区二区| 在线免费黄色av| 一区二区成人在线视频| 欧美极品aaaaabbbbb| 午夜精品影院在线观看| 久久99国产综合精品免费| 色久综合一二码| 一区二区日韩视频| 天天综合日日夜夜精品| 色老板免费视频| 久久精品一二三| 国产ts在线观看| 99久久99久久精品国产片果冻| 伊人网伊人影院| 中文字幕在线播放不卡一区| 麻豆亚洲av成人无码久久精品| 欧美日韩国产影院| 久久久国产成人| 欧美日韩激情网| 中文字幕在线播放日韩| 色视频成人在线观看免| 一区二区www| 亚洲国产成人精品一区二区 | 欧美大胆成人| 国产精品自产拍在线观| 91嫩草精品| 水蜜桃一区二区三区| 欧美巨大xxxx| 日韩欧美亚洲日产国产| 台湾色综合娱乐中文网| 亚洲精品日韩成人| 国产精品一区二区av交换| a级黄色片网站| 国产精品尤物| 一本久道高清无码视频| 日本欧美加勒比视频| 曰本三级日本三级日本三级| 狠狠狠色丁香婷婷综合激情| 亚洲成人av免费看| 久久成人免费| 日本久久久精品视频| 国产精品久久久久毛片大屁完整版| 亚洲天堂av线| 99re8在线精品视频免费播放| 一级免费黄色录像| 欧美性videos高清精品| 狠狠躁夜夜躁人人爽天天高潮| 欧美日韩视频在线第一区| 秋霞av鲁丝片一区二区| 精品国产区一区二区三区在线观看| 免费看男女www网站入口在线 | 精品视频自拍| 日本丰满大乳奶| 国产综合欧美| 欧美激情第3页| 久久精品在这里| 中文字幕在线观看免费视频| 在线播放日韩导航| aaa一区二区三区| 在线视频免费一区二区| 在线人成日本视频| 国产一区二区视频在线免费观看| 啪啪国产精品| 97中文字幕在线| 国产精品白丝jk黑袜喷水| 五月婷婷综合激情网| 亚洲欧美色图小说| 中日韩在线观看视频| 亚洲毛片一区二区| 丝袜老师在线| 久久精品日产第一区二区三区精品版 | 懂色av中文一区二区三区| 国产第一页浮力| 欧美绝品在线观看成人午夜影视| 国产精品视频一二区| 这里只有精品丝袜| 四虎成人在线| 91久久极品少妇xxxxⅹ软件 | 91丨九色丨蝌蚪丨老版| 法国空姐电影在线观看| 欧美日韩午夜视频在线观看| 手机看片福利在线| 91超碰caoporn97人人| 日本成人中文| 黄色片久久久久| 久久久久久久电影| 久草视频在线免费| 中文字幕日韩在线播放| 久久久久久久性潮| www亚洲国产| 国产精品综合一区二区三区| 深夜福利影院在线观看| 精品乱人伦小说| 成人高清网站| 欧美精品福利视频| 97精品久久| 激情深爱综合网| 2021久久国产精品不只是精品| 波多野结衣久久久久| 欧美剧在线免费观看网站| 在线播放蜜桃麻豆| 国产精品第1页| 四季av一区二区凹凸精品| а 天堂 在线| 亚洲成人自拍网| 你懂的视频在线观看| 欧美激情极品视频| 久久九九热re6这里有精品 | 欧美久久久久久久久久久久| 欧美成人在线直播| 在线观看特色大片免费视频| 青青草国产精品| 亚洲国产一区二区三区高清| 五月花丁香婷婷| 一区二区三区四区高清精品免费观看 | 亚洲成年人在线| videos性欧美另类高清| 一区二区国产日产| 成人精品免费视频| 免费黄色片视频| 欧美大片免费观看| 国产成人ay| 黄页网站在线看| 色综合久久99| 搞黄网站在线观看| 国产精品视频永久免费播放| 亚洲理论电影网| 午夜一级免费视频| 亚洲成人激情自拍| 婷婷五月在线视频| 国产伦精品一区二区三区在线| 日韩影院精彩在线| 日本a在线观看| www国产91| 妖精视频一区二区三区| 1314成人网| 欧美亚洲日本一区| 日本在线播放一二三区|