精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

DeepMind | 在生成的過程中進行檢索:一種有潛力完全替代RAG的思路"RICHES"

發(fā)布于 2024-7-29 00:29
瀏覽
0收藏

大家好,我是HxShine

今天分享一篇 Google DeepMind 公司的一篇文章,Title: From RAG to RICHES: Retrieval Interlaced with Sequence Generation:從 RAG 到 RICHES:在生成過程中完成檢索。

這篇文章提出了一種新的方法 RICHES,它將檢索RAG與生成完全結(jié)合在一塊。RICHES 消除了對單獨構(gòu)建RAG系統(tǒng)再結(jié)合LLM進行生成的模式,為傳統(tǒng)的 RAG 系統(tǒng)提供了一種替代方案。它通過直接解碼其內(nèi)容來檢索文檔,并受到語料庫的約束。RICHES允許我們僅通過提示即可適應各種新任務。RICHES 可以與任何指令微調(diào)模型一起使用,而無需額外的訓練。它提供屬性證據(jù),支持多跳檢索,并在單個 LLM 解碼過程中交織思維以規(guī)劃下一步要檢索的內(nèi)容。 實驗表明RICHES 在 ODQA 任務(包括屬性和多跳 QA)中都有非常好的性能。

RICHES是非常有潛力能替代RAG的一種方案,他能做到在生成的過程中完成檢索,并且能做到邊檢索,邊思考,邊糾錯,能解決復雜的多步推理問題。后續(xù)RICHES或許能成為LLM接入外部知識的一種新方案。同時其對檢索數(shù)據(jù)的構(gòu)建方法也有了更高的要求,需要在decode上做額外的設(shè)計,也增加了其使用難度。

一、概述

? Title: From RAG to RICHES: Retrieval Interlaced with Sequence Generation

? URL:?? https://arxiv.org/pdf/2407.00361??

? Authors: Palak Jain, Livio Baldini Soares, Tom Kwiatkowski

? Institution: Google DeepMind

1 Motivation

? 當前的 RAG 系統(tǒng)需要將檢索和生成分開,導致多系統(tǒng)流水線復雜且難以訓練。

? LLMs 容易產(chǎn)生幻覺,無法及時引入新內(nèi)容,無法解釋新鮮的、在訓練時無法獲得的知識。

2 Methods

RICHES 通過將檢索與生成統(tǒng)一到單一的解碼過程中,RICHES旨在通過提示(prompting)適應多樣化的新任務,從而減少對額外訓練的需求。其通過直接解碼文檔內(nèi)容或與之相關(guān)的自然語言檢索鍵,提高了檢索效率,并允許在單個解碼過程中進行多跳檢索和思考規(guī)劃。

DeepMind | 在生成的過程中進行檢索:一種有潛力完全替代RAG的思路"RICHES"-AI.x社區(qū)


1)RICHES 的工作流程

  • 輸入問題:用戶輸入一個問題。
  • 生成檢索鍵:從 FM-Index 中生成指向相關(guān)文檔的檢索鍵。
  • 解碼過程:使用 LLM 進行解碼,生成包含檢索鍵和非約束文本的序列。
  • 選擇最優(yōu)序列:從多個候選序列中選擇最優(yōu)序列作為答案。
  • 輸出答案:輸出答案,并可以提供屬性證據(jù),指明答案的來源。

2)詳細方法和步驟

  • 檢索鍵生成: 通過解碼文檔內(nèi)容或相關(guān)的自然語言檢索鍵來檢索文檔,這些鍵指向它們生成的文檔。

FM-Index 索引:使用 FM-Index 索引檢索語料庫,將文本的所有后綴按照字典序排列并壓縮成更緊湊的形式。

檢索鍵:從 FM-Index 中生成指向文檔的檢索鍵,例如段落、句子或命題。檢索鍵可以是文本片段,也可以是經(jīng)過命題化處理的文本片段。

  • 約束解碼: 使用 FM-index 對模型輸出進行約束,以確保它們存在于語料庫中。

約束條件:在解碼過程中添加約束條件,確保生成的序列與檢索語料庫中的序列一致。

約束解碼技術(shù): 使用多種約束解碼技術(shù),例如:

? 掩碼技術(shù):將不在檢索語料庫中的詞匯的概率設(shè)置為 0,防止模型生成不存在的詞匯。

? 前綴匹配:確保生成的序列以檢索鍵開頭。

? 長度限制:限制生成序列的長度,避免生成過長的序列。

def constrain(input_prefix):
    # Fetch continuations for prefix 
    allowed_tokens = fm_index.get_continuations(input_prefix)
    # Get next token probabilities
    logprobs = LLM.logprobs(input_prefix)
    # Disallowed tokens are set to -inf
    for i in logprobs:
        token = vocab[i]
        if token not in allowed_tokens:
                logprobs[i] -= np.inf 
    return logprobs

3)自適應beamsearch大小: 使用自適應beamsearch大小來平衡約束和非約束生成。

? 束搜索:使用束搜索技術(shù)來生成多個候選序列,從中選擇最優(yōu)序列作為答案。

? 自適應束大小:根據(jù)是受限序列還是非受限序列自適應調(diào)整beamsearch窗口大小。

約束序列:對于約束序列,使用較小的束大小,因為約束序列的搜索空間較小。

非約束序列:對于非約束序列,使用較大的束大小,因為非約束序列的搜索空間較大。

3 Few-shot prompt(QA的提示詞)

1)single-hop QA

DeepMind | 在生成的過程中進行檢索:一種有潛力完全替代RAG的思路"RICHES"-AI.x社區(qū)


特點:

? keyword引入思考過程,輔助檢索相關(guān)內(nèi)容,同時keyword生成為非受限解碼,給足充分的思考空間。

? passage生成《》內(nèi)部用限制解碼,精確解碼檢索相關(guān)知識,同時可以設(shè)置大的Beam size,充分發(fā)揮其能力。

? 迭代生成多個keyword,可以用于檢索多個知識,以及修復檢索錯誤的結(jié)果。

2)multi-hop QA

DeepMind | 在生成的過程中進行檢索:一種有潛力完全替代RAG的思路"RICHES"-AI.x社區(qū)


特點:

? keyword引入思考過程,輔助檢索相關(guān)內(nèi)容,同時keyword生成為非受限解碼,給足充分的思考空間。

? passage生成《》內(nèi)部用限制解碼,精確解碼檢索相關(guān)知識,同時可以設(shè)置大的Beam size,充分發(fā)揮其能力。

? 迭代生成多個keyword,解決多跳問答需要搜索多個知識問題,同時迭代生成還能對其進行糾錯,修復檢索錯誤的結(jié)果。

3)特點總結(jié)

  • 統(tǒng)一檢索與生成:將檢索操作與文本生成過程統(tǒng)一到一個單一的解碼過程中,消除了對單獨檢索器和生成器的需求。
  • 受限解碼(Constrained Decoding):通過標記特殊的開始和結(jié)束符號來識別檢索鍵,確保生成的文本是存在于預定義的語料庫中的序列。
  • 自適應束搜索(Adaptive Beam Search):為了處理交替出現(xiàn)的受限和非受限文本生成任務,引入了自適應束搜索策略,在受限序列生成時使用全束搜索,而在非受限生成時則使用貪心解碼。
  • 高效的約束實現(xiàn):利用FM-index數(shù)據(jù)結(jié)構(gòu)來支持快速的子字符串搜索操作,從而在解碼過程中對模型輸出進行語料庫約束,確保生成的文本符合要求。
  • 多種檢索鍵選擇:提供了多種檢索鍵的選擇,包括文檔標題、段落子字符串、句子子字符串和命題索引,以適應不同的檢索需求。
  • 無需額外訓練:可以與任何指令調(diào)整(Instruction-tuned)模型一起工作,無需額外的訓練,這得益于統(tǒng)一檢索與生成的方法可以直接通過提示適應新任務。
  • 多跳檢索和思考規(guī)劃:支持多跳檢索任務,允許模型在生成過程中穿插“思考”步驟,以幫助指導搜索過程,避免重復檢索,并在必要時糾正錯誤的檢索。

DeepMind | 在生成的過程中進行檢索:一種有潛力完全替代RAG的思路"RICHES"-AI.x社區(qū)


4)索引構(gòu)建策略對比

DeepMind | 在生成的過程中進行檢索:一種有潛力完全替代RAG的思路"RICHES"-AI.x社區(qū)


多種索引策略優(yōu)缺點分析:

? 文檔標題和章節(jié)標題:

優(yōu)點:這種策略利用了檢索語料庫的結(jié)構(gòu)化信息,例如 Wikipedia 中的標題和章節(jié)標題,可以有效地組織文檔并提供層次化的檢索。

缺點:這種策略依賴于檢索語料庫的結(jié)構(gòu),對于結(jié)構(gòu)不規(guī)范的語料庫可能不適用。

? 段落子字符串:

? 優(yōu)點:這種策略將段落作為檢索單元,可以有效地檢索段落級別的信息,例如開放式問答中的證據(jù)段落。

? 缺點:這種策略可能導致檢索結(jié)果過多,因為每個段落都可能對應多個檢索鍵。

? 句子子字符串:

? 優(yōu)點:這種策略將句子作為檢索單元,可以檢索句子級別的信息,例如翻譯任務中的翻譯示例。

? 缺點:句子可能不夠完整,無法提供足夠的信息來回答問題。

? 命題索引(需要額外對文本進行分析拆解):

? 優(yōu)點:這種策略將文檔分解為原子命題,每個命題包含一個事實性信息。命題索引可以有效地檢索事實性信息,例如開放式問答中的答案。

? 缺點:命題化過程需要額外的計算成本,并且可能無法涵蓋所有類型的知識。

4 QA

Q1:如何選擇合適的索引策略?:

? 任務類型:根據(jù)任務類型選擇合適的索引策略。例如,對于開放式問答任務,可以選擇段落子字符串或命題索引。

? 語料庫結(jié)構(gòu):根據(jù)檢索語料庫的結(jié)構(gòu)選擇合適的索引策略。例如,**對于結(jié)構(gòu)化的語料庫,可以選擇文檔標題和章節(jié)標題。

實驗結(jié)論:RICHES 論文中的實驗結(jié)果表明,命題索引在開放式問答任務中表現(xiàn)最好,因為它可以有效地檢索事實性信息,并且與 RICHES 的解碼搜索策略更匹配。

Q2:基于命題索引究竟是什么,怎么來的?

  • ? Proposition定義:其需要對原始passage做原子處理,為文本中的原子表達式,每個Proposition命題都封裝了獨特的特征,并以簡潔、自成一體的自然語言格式呈現(xiàn)一個知識點。

DeepMind | 在生成的過程中進行檢索:一種有潛力完全替代RAG的思路"RICHES"-AI.x社區(qū)


? Proposition命題構(gòu)建步驟一:利用GPT4將passage轉(zhuǎn)化成propositions(構(gòu)建Flan-T5-large模型的訓練語料)


? Proposition命題構(gòu)建步驟二:訓練Flan-T5-large model生成大量Proposition

DeepMind | 在生成的過程中進行檢索:一種有潛力完全替代RAG的思路"RICHES"-AI.x社區(qū)


5 Conclusion

? RICHES 可以將檢索與序列生成統(tǒng)一在一起,不用去構(gòu)建復雜的pipeline。

? RICHES可以解決各種 ODQA 任務,同時其復雜任務推理能力中表現(xiàn)出色,并可以與任何指令微調(diào)模型一起使用,而無需額外的訓練。

? RICHES能在推理的過程中,一邊檢索知識,一邊進行思考,還能對生成的結(jié)果進行校驗,是比較有潛力替代RAG的一種方法。

本文轉(zhuǎn)載自 ??NLP PaperWeekly??,作者: NLP PaperWeekly

已于2024-7-29 10:24:32修改
收藏
回復
舉報
回復
相關(guān)推薦
久久成人精品无人区| 日韩精品欧美大片| 亚洲女人****多毛耸耸8| 亚洲在线视频观看| 成人午夜淫片100集| 色777狠狠狠综合伊人| 日韩片之四级片| 农村妇女精品一二区| www在线免费观看视频| 91在线免费视频观看| 国产日韩在线看片| 亚洲男人第一av| 亚洲成人精品| 亚洲色图在线观看| 成人做爰69片免费| 国产成人福利夜色影视| 亚洲电影中文字幕在线观看| 亚洲精品成人三区| 熟妇人妻av无码一区二区三区| 亚洲免费综合| 欧美高清一级大片| 日本视频在线免费| 亚洲资源网站| 精品国产伦一区二区三区观看方式| 久久久久久三级| av白虎一区| 亚洲精品v日韩精品| 日韩一区国产在线观看| 亚洲 小说区 图片区 都市| 精品一区二区三区欧美| 国产精品国产自产拍高清av水多| 香蕉视频一区二区| 亚洲色图网站| 精品国内亚洲在观看18黄| 精品成人av一区二区三区| 噜噜噜天天躁狠狠躁夜夜精品| 337p亚洲精品色噜噜噜| 污污视频网站免费观看| 亚洲深夜视频| 五月天一区二区三区| 神马午夜伦理影院| 久久亚洲天堂| 18欧美乱大交hd1984| 污视频在线免费观看一区二区三区 | 外国精品视频在线观看| 美女脱光内衣内裤视频久久影院| 国产精品ⅴa在线观看h| 欧美一区二区三区网站| 尤物网精品视频| 欧美激情图片区| 久久国产精品二区| 激情综合激情| 国内精品小视频| 天海翼一区二区| 亚洲经典在线看| 国内精品美女av在线播放| 国产一级一级片| 亚洲午夜极品| 国内久久久精品| 中文字幕超碰在线| 久久av最新网址| 国产精品成av人在线视午夜片| 无码人妻精品一区二区50| 久久不射2019中文字幕| 国产精品国产三级国产aⅴ9色| www.久久网| 久久99精品视频| 114国产精品久久免费观看| 国产黄色一区二区| 成人不卡免费av| 精品一区日韩成人| 粉嫩av一区| 亚洲欧美另类在线| 人妻av无码专区| 2022成人影院| 欧美精品亚洲二区| wwwww在线观看| 欧美a一欧美| 一区二区亚洲精品国产| 少妇高潮在线观看| 国内久久视频| 国产91露脸中文字幕在线| 中文字幕理论片| 国产高清亚洲一区| 鲁丝一区二区三区免费| 欧美黄色激情| 亚洲成人av福利| 婷婷丁香激情网| 日韩欧美高清一区二区三区| 亚洲女人天堂色在线7777| 91ts人妖另类精品系列| 一区在线观看| 国产精品日日做人人爱| 亚洲av无码乱码在线观看性色| 91色在线porny| 中文字幕久久综合| 国产理论在线| 91麻豆精品国产91久久久资源速度| 国产一精品一aⅴ一免费| 在线日本制服中文欧美| 久久综合伊人77777蜜臀| 伊人久久综合视频| 韩国v欧美v日本v亚洲v| 久久久久久久久久久久久久久久av| av在线播放av| 欧美日韩亚洲精品一区二区三区| 不卡中文字幕在线观看| 色橹橹欧美在线观看视频高清| 久久韩国免费视频| 日日骚av一区二区| 国产成a人无v码亚洲福利| 性欧美videosex高清少妇| 好看的中文字幕在线播放| 欧美日韩一区二区欧美激情| 在线免费观看污视频| 99久久夜色精品国产亚洲1000部| 欧美一区二区影院| 性少妇videosexfreexxx片| 国产三级精品三级在线专区| 高清欧美精品xxxxx| 国产午夜亚洲精品一级在线| 亚洲天堂免费观看| 波多野结衣视频网站| 高清在线不卡av| 激情图片qvod| 久久国内精品| 中文字幕精品久久| 精品一区二区无码| 2020国产精品自拍| 美女日批免费视频| 国产成人夜色高潮福利影视| 久久在线精品视频| 国产精品久久免费| 国产精品福利一区二区三区| 爆乳熟妇一区二区三区霸乳| 亚洲欧美日本伦理| 91高潮精品免费porn| 日韩在线观看视频网站| 亚洲综合在线五月| 国模大尺度视频| 在线看片不卡| 亚洲精品免费网站| 特级毛片在线| 欧美大片在线观看| 久久国产一级片| 成人午夜激情在线| 人人妻人人做人人爽| 黑色丝袜福利片av久久| 午夜精品久久17c| 亚洲 精品 综合 精品 自拍| 欧美性猛交xxxx黑人猛交| 国产精品jizz| 久久国产一二区| 日韩精品在在线一区二区中文| 欧美男体视频| 中文字幕v亚洲ⅴv天堂| 亚洲影视一区二区| 国产精品福利电影一区二区三区四区| 亚洲欧美aaa| 中文无码久久精品| 国产精品乱码视频| 免费毛片b在线观看| 日韩精品免费一线在线观看| 中文人妻av久久人妻18| 欧美激情中文字幕一区二区| 91亚洲精品久久久蜜桃借种| 66视频精品| 国产精品对白刺激久久久| 高清在线视频不卡| 伊人男人综合视频网| 国产一区二区女内射| 一区二区在线免费| 中文字幕免费在线播放| 久久综合婷婷| 福利网在线观看| 久久夜色电影| 国产一区红桃视频| 蜜桃传媒在线观看免费进入| 精品视频久久久久久久| 亚洲男人天堂网址| 亚洲精品视频免费看| 国产麻豆天美果冻无码视频| 日本强好片久久久久久aaa| 国产对白在线播放| 欧美大片网址| 国产欧美日韩91| 超碰97免费在线| 亚洲一级一级97网| 性生活黄色大片| 日本道免费精品一区二区三区| 亚洲av无一区二区三区| 成人av免费在线观看| 一区二区三区韩国| 激情视频一区| 亚洲一区二区在| 婷婷精品在线观看| 91麻豆国产精品| 在线精品亚洲欧美日韩国产| 伦伦影院午夜日韩欧美限制| 麻豆app在线观看| 日韩欧美国产精品一区| 国产真人无遮挡作爱免费视频| 伊人婷婷欧美激情| 欧美福利在线视频| 91免费视频大全| jjzz黄色片| 久久99精品久久久久久久久久久久| 成人毛片视频网站| 欧美va天堂| 五月婷婷综合色| 亚洲妇女av| 国产福利久久| 精品国产亚洲一区二区在线观看| 国产精品吹潮在线观看| av成人福利| 色综合男人天堂| 久操视频在线| 一区二区成人精品| 四虎影视2018在线播放alocalhost| 欧美一区二区在线看| 中文字幕 日韩有码| 欧美性69xxxx肥| 男人的天堂一区| 亚洲国产精品久久久久婷婷884| 香蕉成人在线视频| 中文欧美字幕免费| 日韩一级av毛片| 久久久久9999亚洲精品| 亚洲一区二区三区综合| 成人综合婷婷国产精品久久蜜臀| 欧美激情国内自拍| 久久99在线观看| 亚洲人视频在线| 蜜桃视频在线观看一区二区| 激情五月婷婷久久| 轻轻草成人在线| 欧美午夜性生活| 日本少妇一区二区| 无码内射中文字幕岛国片| 亚洲永久免费| 一本色道无码道dvd在线观看| 夜夜夜久久久| 日韩a级在线观看| 精品99视频| 精品国产av无码一区二区三区| 国产一区观看| 欧美男女爱爱视频| 一级成人国产| 国产l精品国产亚洲区久久| 香蕉国产精品偷在线观看不卡| 日韩精品xxxx| 久久精品首页| 在线观看国产一级片| 激情综合色播激情啊| 97人人模人人爽人人澡| 国产成人精品亚洲日本在线桃色 | www.久久久久久.com| 美女隐私在线观看| 久久99精品久久久久久青青91| 蜜乳av一区| 欧洲亚洲免费视频| 日韩高清成人| 成人性生交大片免费看小说| 这里视频有精品| 久久国产欧美精品| 欧美精品系列| japanese在线视频| 黄色日韩在线| 91淫黄看大片| 国产成人av影院| 一区二区三区免费在线观看视频| 中文字幕欧美激情一区| 97在线观看免费高| 亚洲电影第三页| 无码人妻精品一区二区50| 欧美久久久久久蜜桃| 欧美 日韩 人妻 高清 中文| 亚洲免费视频网站| 国产秀色在线www免费观看| 久久久欧美精品| 怡红院成人在线| 亚洲伊人久久综合| 一区二区美女| 综合操久久久| 午夜一区二区三区不卡视频| av免费一区二区| 不卡的av网站| 91狠狠综合久久久| 精品免费在线观看| 在线观看国产黄| 亚洲经典中文字幕| 米奇精品一区二区三区| 26uuu另类亚洲欧美日本老年| 伦一区二区三区中文字幕v亚洲| 国产精品久久亚洲7777| 欧美wwwww| 青青在线视频观看| 国产精品一二三四区| 国内精品卡一卡二卡三| 亚洲资源在线观看| 一级片在线观看视频| 日韩国产精品一区| 国产精品一区二区三区在线播放| 精品三级av在线导航| 青青草原网站在线观看| 久久久久综合| 喷水视频在线观看| 亚洲欧美日韩国产手机在线 | 欧美高清视频在线高清观看mv色露露十八 | 久久香蕉视频网站| 免费亚洲电影在线| 国产伦精品一区二区三区妓女| 亚洲免费观看在线视频| 丰满熟女人妻一区二区三| 亚洲精品久久久久久久久久久久久 | 一区二区三区日韩在线观看| 综合久久中文字幕| 日韩电影第一页| av蜜臀在线| 成人免费视频网站| 欧美激情1区2区3区| 色戒在线免费观看| 日本一区二区三区在线不卡| 黑人一级大毛片| 亚洲电影第1页| 色呦呦久久久| 96pao国产成视频永久免费| 日韩精品91| 日日噜噜夜夜狠狠| 国产欧美日韩在线观看| 69国产精品视频免费观看| 日韩精品欧美国产精品忘忧草 | 亚洲国产精品一区制服丝袜| 日韩精品在线播放视频| 亚洲欧美日韩国产中文在线| 国产手机精品视频| 久久亚洲私人国产精品va| 亚洲成人高清| 中文字幕av日韩精品| 另类调教123区| youjizz亚洲女人| 欧美日韩在线播放| 淫片在线观看| 成人激情视频在线观看| 亚洲精品电影| 欧美日韩一区二区区别是什么| 一区二区欧美国产| 亚洲精选一区二区三区| 国模精品视频一区二区| 东京久久高清| 精品国产一二三四区| 99re热视频这里只精品| 中文字幕高清在线免费播放| 亚洲欧美制服丝袜| 韩国理伦片久久电影网| 中文字幕成人一区| 国产成人99久久亚洲综合精品| 日本免费一二三区| 亚洲男人天堂古典| 日本国产欧美| 400部精品国偷自产在线观看| 国产suv精品一区二区三区| 国产黄色片视频| 亚洲欧美在线看| 香蕉成人在线| 男女私大尺度视频| 国产亚洲一二三区| 91精品人妻一区二区三区果冻| 精品中文字幕乱| 四虎影视精品| 欧美女同在线观看| 亚洲一卡二卡三卡四卡| 亚洲三区在线观看无套内射| 国产精品久久久久久影视| 先锋资源久久| 在线精品一区二区三区| 在线观看网站黄不卡| 日韩av毛片| 欧美日韩在线一区二区三区| 精品一区在线看| 在线观看精品国产| 日日骚久久av| 日韩高清一级| 岛国av免费在线| 亚洲成精国产精品女| 9i精品一二三区| 国产精品区一区二区三在线播放| 日韩精品久久理论片| 国产十六处破外女视频| 亚洲欧洲av一区二区| 精品国产亚洲一区二区在线观看| 日韩av在线第一页| 亚洲欧美激情插| 日本福利片在线| 成人一区二区三区四区| 日韩黄色免费网站| 日韩三级小视频| 久热爱精品视频线路一| 久久99国产精品视频| 国产伦理在线观看|