精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

詳解 SELF-RAG 框架

人工智能
自我反思檢索增強生成(Self-Reflective Retrieval-Augmented Generation,SELF-RAG)是一種通過檢索和自我反思提高 LLM 質量和事實準確性的框架,而不損害 LLM 的原始創造力和多功能性。本文將詳細介紹 SELF-RAG 框架。

當前先進的大語言模型在回答問題時依然會存在胡說八道的現象,而檢索增強生成(RAG)方法通過將相關的檢索段落與語言模型的輸入結合,可以減少在知識密集型任務中的事實錯誤。然而,這些方法可能會影響語言模型的通用性,引入不必要或離題的段落,導致生成的回答質量較低。此外,由于 RAG 檢索段落時不考慮事實基礎是否有幫助,生成的結果也不能保證與檢索到的相關段落一致。

自我反思檢索增強生成(Self-Reflective Retrieval-Augmented Generation,SELF-RAG)是一種通過檢索和自我反思提高 LLM 質量和事實準確性的框架,而不損害 LLM 的原始創造力和多功能性。本文將詳細介紹 SELF-RAG 框架。

概述

SELF-RAG 允許語言模型 根據檢索到的段落生成信息,并且通過自我批判生成的內容來生成特殊 token。這些特殊的 token 稱之為 reflection token(反思 token),表示是否需要檢索或確認輸出的相關性、或完整性。相比之下,常規的 RAG 方法會無差別地檢索段落,且不確保引用來源的是否完全支持輸入。

圖片圖片

具體而言,SELF-RAG 首先確定是否通過在繼續生成時使用檢索到的段落來幫助生成,如果是,它會輸出一個檢索標記,調用一個檢索模型(第一步)。接下來,SELF-RAG 同時處理多個檢索到的段落,評估它們的相關性,然后生成相應的任務輸出(第二步)。然后生成評論標記,對自己的輸出進行批評并選擇最佳輸出(第三步),評價標準是事實準確性和整體質量。接下來將進一步介紹 SELF-RAG 的幾個重要概念與算法。

反思 token

給定輸入 x,SELF-RAG 會訓練語言模型 M 順序生成文本 y,且 y 由多個段落組成,記為 y=[y_1,...,y_t],其中,y_t 表示第 t 個段落的 token 序列,y_t 中的生成 token 包括原始文本和反思 token。

而反思 token 主要有 4 種,分別為 Retrieve,IsRel,IsSup,IsUse,其含義分別如下:

圖片圖片

按需檢索(Retrieve)

表示對于給定輸入,判斷是否需要額外檢索信息。

比如:

  • 問題 x :提供保持健康的三個秘訣
  • 輸出:yes
  • 原因:因為可能有一些可靠的資源來解釋不同行為對健康的影響。因此檢索文檔有助于提高對此查詢的響應。

再比如:

  • 問題 x :描述一次你不得不做出艱難決定的經歷
  • 輸出:no
  • 原因:因為這個問題詢問的是一些個人經驗,因此不需要尋找一些外部文檔。

相關性(IsRel)

表示對于給定輸入,檢索出的信息是否提供了有用信息來解決輸入問題。

比如:

  • 問題 x :競選美國眾議院的年齡
  • 檢索信息 d :憲法規定了在美國參議院任職的三項資格:年齡(至少三十歲);美國公民身份(至少九年);以及參議員在選舉時所代表的州的居住權。
  • 輸出:Irrelevant
  • 原因:這些檢索信息僅討論了競選美國參議院議員的年齡,而不是討論眾議院議員的年齡。

支撐性(IsSup)

評估檢索信息中提供的信息是否完全支持輸出,輸出為 “Fully supported, partially supported, no support”。

比如:

  • 問題 x :解釋 embedding 在自然語言處理中的使用
  • 檢索信息 d :embedding 是自然語言處理 (NLP) 中一組語言建模和特征學習技術的統稱,其中詞匯表中的單詞或短語被映射到實數向量。單詞和短語嵌入用作底層輸入表示時,已被證明可以提高 NLP 任務的性能,例如句法解析、情感分析、下一個標記預測以及類比檢測。
  • 回答 y :詞嵌入對于情感分析、文本分類、預測序列中的下一個詞以及理解同義詞和類比等任務非常有用。
  • 輸出:Fully supported
  • 原因:輸出句子討論了詞嵌入的應用,證據提到了所有應用句法解析、情感分析、下一個標記預測以及類比檢測作為應用。因此,評分應為 “Fully supported”。

有用性(IsUse)

表示回答是否對問題有用,輸出為 “5,4,3,2,1”,5 為非常有用,1 為幾乎不切題或完全不相關。

比如:

  • 問題 x :“2023 年英國現任首相是誰?”
  • 回答 y :“鮑里斯·約翰遜 (Boris Johnson) 于 2019 年至 2022 年擔任英國首相。”
  • 輸出:2
  • 原因:雖然輸出提供了關于 2019 年至 2022 年英國首相的事實正確的陳述,但該指令詢問 2023 年的首相是誰,因此它沒有回答該指令。因此,評分為2。

SELF-RAG 訓練

圖片圖片

給定一組輸入輸出數據 D={X, Y},Generator 模型 M,Critic 模型 C。

  1. 用預訓練的語言模型 LM 對 C 進行初始化;
  2. 對 {X, Y} 進行采樣得到訓練數據
  3. 對采樣數據中每一對 (x, y):

通過 GPT-4 收集 reflection token r;

將 {(x, y, r)} 添加到 D{critic} 中;

  1. 用下一個 token 預測損失更新 C;
  2. 用預訓練的語言模型 LM 對 M 進行初始化;
  3. 對 (X, Y) 中的每一對 (x, y):
  4. 運行 C 得到 reflection token r;

  5. 將 (x, y, r) 添加到 D{gen} 中;

  6. 基于 D_{gen} 用下一個 token 預測損失更新 M;

訓練評論者模型

評論者模型數據生成

手動標記每個段落的反思 token 是不現實的,而我們可以使用像 GPT-4 這樣的最先進的大語言模型來生成反思 token。通過引導 GPT-4 生成反思 token,可以將其知識提煉到內部的評論者模型 C 中,從而創建了監督數據。如下圖所示:

圖片圖片

對每組反思 token,從原始訓練數據中隨機采樣。由于每組反思 token 有自己的定義和輸入,我們會針對性使用不同的 prompt。

這里以 Retrieve 為例,通過使用類型特定的指令來引導 GPT-4,比如給定一條指令,在原始任務輸入 x 和輸出 y 上進行少量示范,判斷從網絡中找到一些外部文檔是否有助于生成更好的響應,以生成適當的反思 token:p(r|I,x,y) 。

評論者模型訓練

生成數據 D{critic} 后,使用預訓練語言模型 LM 初始化評論者模型 C,并用 D{critic} 對其進行訓練。其目標函數為(對每對 reflection token 來說):

圖片圖片

初始模型可以是任意的預訓練語言模型 LM,評論者模型在大多數 reflection token 類別上都與基于 GPT-4 的預測達成了超過 90% 的一致性。

訓練生成器模型

生成器模型的數據生成

給定一個輸入輸出對 (x,y),使用檢索和評論者模型來擴充原始輸出 y,從而創建監督數據,精確地模擬 SELF-RAG 推理時的過程。整個過程如下:

圖片圖片

對 y_t,運行批評者模型 C 來評估需要額外的檢索信息來幫助增強生成。如果需要,則加上 Retrieve=Yes token,并且使用 R 來獲取前 K 個信息段落 D。對每個段落來說,C 會進一步評估相關性并預測 IsRel。如果某個段落是相關的,則 C 會進一步評估該段落是否支持模型的輸出,并預測 IsSup。評論 token IsRel 和 IsSup 會被附加到檢索的段落或輸出后面。在最后的輸出 y 中,C 會預測整體效用 token IsUSE,并將帶有反思 token 和原始輸入對的擴充輸出添加到 D_{gen}。

生成器模型訓練

通過使用精選的增強語料庫,以及 reflection token D{gen} 來訓練生成器模型 M。目標函數為:

圖片圖片

與評判模型 C 訓練不同,生成器 M 學習預測目標輸出以及 reflection tokens。訓練期間,將檢索到的文本塊(由 <p> 和 </p> 標記)進行遮擋以進行損失計算,這意味著模型在計算損失時不考慮這些檢索到的文本塊。原始詞匯 V 通過一組 reflection tokens(如 <Critique> 和 <Retrieve>)進行擴展,這表示這些 tokens 被加入到詞匯中,使模型能夠使用這些特定的 tokens 來生成輸出。

SELF-RAG 推理

最后再來介紹一下 SELF-RAG 的推理過程。如下圖所示:

圖片圖片

對于每個輸入 x 和前一代生成的 y{<t},模型解碼檢索 token 以評估檢索的效用。如果不需要檢索,模型將直接預測下一段輸出,這與標準的語言模型行為一致。如果需要檢索,模型會生成:一個評估檢索段落的相關性的反思 token、下一個回答段落、以及評估回答段落是否被檢索信息支持的反思 token。最后,一個評估整體效用的新的反思 token。每生成一個回答,SELF-RAG 都會并行處理多個段落,并且使用其自動生成的反思 token 來控制生成的輸出。

生成反思 token 以自我評估輸出使得在推理階段 SELF-RAG 更加可控,能夠調整其行為以滿足多樣的任務要求。對于要求事實準確性的任務,目標是使模型更頻繁地檢索段落,以確保輸出與現有證據緊密對齊。相反,在更為開放的任務中,例如撰寫個人經歷文章,重點轉向更少的檢索,優先考慮整體創造力或效用。接下來,將介紹在推理過程中如何實施控制以滿足這些不同目標的方法。

基于閾值的自適應檢索

SELF-RAG 可以動態決定何時檢索文本段落,這是通過預測 Retrieve token 來完成的。此外,框架還允許設定一個閾值。具體而言,如果生成的 token 是 Retrieve=Yes,且在所有輸出 token 中的標準化值超過了指定的閾值,則觸發檢索。

基于評判 tokens 的樹解碼

在每個段落步驟 t 中,當需要檢索時,基于硬性或軟性條件,R 檢索 K 個段落,并且生成器模型 M 并行處理每個段落并輸出 K 個不同的候選值。我們進行段落級的 Beam Search(使用 Beam 大小為 B)以獲取每個時間戳 t 的前 B 個段落,并在生成結束時返回最佳序列。

每個段落 y_t 相對于段落 d 的分數通過評論者模型的評分 S 進行更新,該評分是每個評論 token 類型的標準化概率的線性加權和。對于每個評論 token 組 G(例如 IsREL),我們將其在時間戳 t 的分數表示為 s^G_t,然后按以下方式計算段落分數:

圖片圖片

其中,

圖片圖片

代表最理想的反射 token 的生成概率

圖片圖片

其中 N_G 個不同的令牌表示 G 的不同可能值。

權重 wG 為可以調整的超參,以自定義模型在推理期間的行為。另外,通過調整這些權重,可以強調某些期望的行為并降低其他行為。

責任編輯:武曉燕 來源: CS實驗室
相關推薦

2025-04-01 09:25:09

2025-01-02 11:54:01

2011-07-08 18:44:09

Objective-C Self Super

2025-02-06 11:20:00

開發工具AI

2025-03-19 08:43:17

檢索增強生成RAG大型語言模型

2025-03-10 08:00:00

RAG檢索Reranker

2025-05-06 10:05:23

2025-02-06 13:50:06

2025-02-17 03:00:00

RAG開源DeepSeek

2025-03-04 11:01:00

2025-06-30 13:57:59

開源模型AI

2024-10-09 11:14:37

2025-05-23 06:00:00

RAGAI人工智能

2025-02-27 09:00:00

RAG檢索增強生成RAG框架

2025-03-21 14:34:17

2025-05-19 08:26:37

RAG架構項目

2025-10-29 12:00:00

RAGLGMGC 框架

2011-10-10 09:11:09

Java

2010-08-30 13:46:09

MeeGoMeeGo Touch

2009-08-11 17:29:53

.NET遠程處理框架
點贊
收藏

51CTO技術棧公眾號

午夜在线视频免费观看| 国产精品吴梦梦| fc2成人免费视频| 超碰在线公开| 欧美精彩视频一区二区三区| 国产精品黄色影片导航在线观看| 亚洲精品天堂网| 国产人与zoxxxx另类91| 午夜国产精品影院在线观看| 日本一区二区精品视频| 国产剧情久久久| 亚洲日本久久| 中文字幕日韩在线播放| 久久久久亚洲av片无码v| 忘忧草在线日韩www影院| 国产精品久久久久一区二区三区 | 亚洲美女91| 一本色道久久综合狠狠躁篇怎么玩 | 亚洲天堂2018av| 国产三级伦理在线| 国产欧美精品国产国产专区| 亚洲自拍偷拍一区| 欧美一区免费看| 亚洲欧美综合| 永久免费看mv网站入口亚洲| 不许穿内裤随时挨c调教h苏绵 | 第一区免费在线观看| 欧美日韩经典丝袜| 中文欧美字幕免费| 久久一区二区精品| 亚洲av综合色区无码一二三区 | 殴美一级特黄aaaaaa| 免费一级欧美片在线观看| 高清欧美性猛交xxxx| 国产极品美女在线| 欧美日韩一二三四| 日韩禁在线播放| 亚洲av无码成人精品区| 欧洲精品久久久久毛片完整版| 精品久久久中文| 国产尤物av一区二区三区| 天堂资源在线中文| 日本一区免费视频| 欧美日韩国产精品一区二区| 男人天堂av网| 国产成人免费视频网站高清观看视频 | 亚洲国产精品狼友在线观看| 亚洲精品aa| 欧美性videosxxxxx| 成年人观看网站| av女在线播放| 亚洲国产一区二区视频| 国产精品视频一二三四区| 美女国产在线| 中文字幕一区二区在线观看| 婷婷精品国产一区二区三区日韩| 日本福利午夜视频在线| 91亚洲永久精品| 国产亚洲一区二区三区在线播放| 性做久久久久久久久久| 高清国产午夜精品久久久久久| 91老司机精品视频| 国产精品久久久久久免费播放 | 国产成人高潮免费观看精品| 精品成人av一区二区在线播放| 伊人成年综合电影网| 久久久久亚洲精品| 日韩乱码人妻无码中文字幕| 日韩视频在线一区二区三区 | 免费一级黄色大片| 国产综合激情| 欧美国产日韩一区| 久久精品国产av一区二区三区| 国语精品一区| 2021久久精品国产99国产精品| 自拍偷拍欧美亚洲| 久久国产日韩| 国产精品日韩欧美| 国产毛片毛片毛片毛片| 国产精品资源网站| 精品视频免费观看| 北条麻妃在线| 亚洲欧美成aⅴ人在线观看 | 中文在线一区| 国产精品xxx视频| 91国内精品久久久| 成人一区二区三区| 欧美一级二级三级| 麻豆传媒在线免费看| 一区二区三区日本| av动漫免费看| 在线观看欧美| 亚洲激情视频网站| 日本午夜精品视频| 亚洲私拍自拍| 国产精品成人免费视频| 国产乱人乱偷精品视频a人人澡| 懂色av一区二区三区蜜臀| 欧美二级三级| 麻豆tv在线| 精品久久久久久久久久久久久久| 天天影视综合色| 日本一区精品视频| 亚洲天堂精品在线| 欧美日韩激情在线观看| 日韩精品久久久久久| 91亚色免费| 黄色视屏网站在线免费观看| 亚洲婷婷国产精品电影人久久| www在线观看免费| 国产精品美女午夜爽爽| 亚洲成人国产精品| 国产亚洲精品久久久久久豆腐| 黑丝一区二区三区| 国产欧美在线观看| 午夜黄色小视频| 日韩理论在线观看| 久久国产色av免费观看| 91免费精品国偷自产在线在线| 亚洲午夜久久久久久久| 日韩激情一区二区三区| 久久国产视频网| 欧美二区三区| 国产第一页在线视频| 欧美日韩精品三区| 亚洲a v网站| 天天揉久久久久亚洲精品| 浅井舞香一区二区| 黄色片一区二区三区| 国产欧美精品一区二区色综合| 五十路熟女丰满大屁股| 欧美午夜网站| 北条麻妃在线一区二区| 波多野结衣高清在线| 99久久精品久久久久久清纯| 国产欧美123| av一级久久| 色妞久久福利网| 亚洲天堂五月天| av电影天堂一区二区在线观看| 一本色道久久综合亚洲精品婷婷 | 美女毛片一区二区三区四区| 久久久亚洲精选| 国产黄色片免费观看| 亚洲色图在线播放| 亚洲天堂av一区二区| 成人在线免费观看视频| 日韩av片电影专区| 免费在线黄色网址| 日韩欧美在线免费| 免费看污片网站| 久久一区亚洲| 日韩国产美国| 亚洲国产尤物| 色爱av美腿丝袜综合粉嫩av| 在线观看国产精品视频| 国产精品美女久久久久久 | 欧美三级日本三级| 国内精品免费**视频| 中国成人在线视频| 99tv成人影院| 欧美成人在线免费视频| 精品国产伦一区二区三| 亚洲资源中文字幕| 看全色黄大色黄女片18| 99热精品在线| 欧美12av| 国产精品亚洲d| 日韩亚洲综合在线| 99久久国产热无码精品免费| 一级日本不卡的影视| 久久久久亚洲无码| 久久午夜av| 在线观看日本一区| 色播一区二区| 91精品国产一区| 青梅竹马是消防员在线| 在线看国产一区| 免费成人美女女在线观看| 国产九色精品成人porny| 女人帮男人橹视频播放| 日韩mv欧美mv国产网站| 国产精品电影在线观看| 菠萝蜜视频国产在线播放| 欧美va亚洲va| 在线观看免费av片| 国产精品白丝在线| 亚洲精品久久一区二区三区777| 亚洲深夜av| 亚洲欧洲一区二区福利| 中文字幕一区日韩精品| 57pao成人国产永久免费| 九色视频网站在线观看| 欧美日韩一区二区三区四区| 青娱乐免费在线视频| 91女神在线视频| 粉色视频免费看| 亚洲私人影院| 色中色综合成人| 精品中文字幕一区二区三区四区| 97激碰免费视频| jizz视频在线观看| 精品免费视频一区二区| 国产第一页在线观看| 一区二区三区视频在线看| 精品国产无码在线观看| 国产精品白丝jk黑袜喷水| 97超碰青青草| 欧美1区2区3区| 日韩国产欧美一区| 国产主播性色av福利精品一区| 国产精品美女无圣光视频| 国模私拍视频在线播放| 色婷婷综合久久久久| 香蕉久久国产av一区二区| 911精品产国品一二三产区| 天天干天天干天天干天天| 亚洲精选一二三| 日韩福利在线视频| 91蜜桃网址入口| 在线观看你懂的视频| 蜜臀精品一区二区三区在线观看| 久久国产精品网| 一区二区电影| 亚洲欧美日韩精品久久久| 欧美jizz19性欧美| 亚洲一区二区三区久久| 影视一区二区三区| 91精品国产高清自在线看超| 男人添女人下部高潮视频在线观看 | 激情五月综合| 久久精品国产美女| 国产精品久久久久av蜜臀| 92裸体在线视频网站| 久久爱.com| 国产精品久久视频| 亚洲天堂一区二区| 国产va免费精品高清在线观看| 97人澡人人添人人爽欧美| 欧美激情女人20p| 在线网址91| 超碰91人人草人人干| 日本三级在线视频| 中文字幕精品一区久久久久| 国产精品免费播放| 在线播放国产一区中文字幕剧情欧美| 免费在线毛片| 国产亚洲精品高潮| 黄色片视频在线观看| 国产亚洲成av人片在线观看桃| 日本一区高清| 亚洲精品视频在线播放| 日本ー区在线视频| 亚洲精选在线观看| 麻豆app在线观看| 亚洲天堂久久av| 在线观看免费版| 久久精品久久精品亚洲人| 黄色成人在线观看| 久国内精品在线| 美女91在线| 97久久精品在线| 中文字幕乱码中文乱码51精品| 日韩av大片免费看| www.26天天久久天堂| 成人免费视频网址| 日韩av综合| 精品91免费| 欧美裸体在线版观看完整版| 在线观看一区二区三区三州| 牛牛国产精品| 无码av天堂一区二区三区| 国产日韩一区二区三区在线| 蜜臀久久99精品久久久酒店新书| 日韩不卡一区二区三区| 亚洲va综合va国产va中文| 国产麻豆精品theporn| 亚洲欧美日韩偷拍| 国产欧美日韩三级| 欧洲第一无人区观看| 亚洲国产中文字幕| av首页在线观看| 91精品国产免费久久综合| 亚洲国产精品久久久久久久| 日韩精品免费电影| 阿v免费在线观看| 欧美成人免费观看| 亚洲私拍视频| 91久久精品国产91久久性色| 国产精品白丝av嫩草影院| 色狠狠久久av五月综合| 午夜久久久久| 人人干人人视频| 国产不卡一区视频| 男人天堂av电影| 日韩美女久久久| 日韩人妻精品中文字幕| 欧美一区二区三区日韩| 青青草手机在线| 欧美精品做受xxx性少妇| 中文字幕在线看片| 99高清视频有精品视频| 欧美女王vk| 男人添女荫道口女人有什么感觉| 老**午夜毛片一区二区三区 | 草莓视频成人appios| 99视频在线免费观看| 精品av一区二区| 欧美图片激情小说| 久久电影网电视剧免费观看| 亚洲久久久久久| 亚洲欧洲中文日韩久久av乱码| 男人日女人网站| 欧美xxxxxxxx| 欧美激情二区| 国产va免费精品高清在线| 亚洲视频国产| 综合色婷婷一区二区亚洲欧美国产| 99热这里只有精品8| 97超碰免费在线观看| 国产欧美精品一区二区色综合 | www.88av| 亚洲精品视频一区二区| 综合久久中文字幕| 国产午夜精品理论片a级探花| 丝袜综合欧美| 国产区精品在线观看| 九九精品久久| 尤物av无码色av无码| 国产成人精品亚洲日本在线桃色| 亚洲欧美综合7777色婷婷| 一本到一区二区三区| 日本高清视频网站| 欧美老少做受xxxx高潮| 亚洲成人1区| 亚洲欧美精品| 奇米一区二区三区av| 中国毛片在线观看| 色综合天天综合网国产成人综合天 | 欧美日韩专区在线| 国产高清免费av在线| 日韩免费观看网站| 亚洲精华一区二区三区| 国产黄页在线观看| 91天堂素人约啪| 日本午夜视频在线观看| 日韩av一区二区在线| 不卡专区在线| 国产欧美一区二区在线播放| 国内精品久久久久久久97牛牛 | 99久久精品久久亚洲精品| 欧洲人成人精品| yjizz视频网站在线播放| 国产成人精品网站| 日韩黄色大片| 日本在线播放一区二区| 亚洲视频免费看| 99久久精品日本一区二区免费| 久久中文久久字幕| 久久69av| 全黄性性激高免费视频| 91丨九色丨蝌蚪富婆spa| 99久热在线精品996热是什么| 亚洲欧美第一页| 欧亚一区二区| 久久久成人精品一区二区三区| 国产真实乱偷精品视频免| 亚洲色婷婷一区二区三区| 欧美成人女星排行榜| 国产乱码午夜在线视频| 蜜桃视频日韩| 毛片av一区二区| 成年人一级黄色片| 亚洲第一中文字幕| 尤物网在线观看| 97免费高清电视剧观看| 亚洲精品激情| 能免费看av的网站| 欧美电影一区二区| h片在线观看视频免费| 欧美国产综合视频| 美女一区二区视频| 激情五月婷婷在线| 精品在线观看国产| 日韩在线电影| 免费av手机在线观看| 亚洲国产经典视频| 成人免费视频国产| 国产成人欧美在线观看| 亚洲视频在线免费| 亚洲色图14p| 欧美三级日韩三级国产三级| 青青草视频在线免费直播| 日本高清不卡三区| 国产精品亚洲专一区二区三区 | 欧美人狂配大交3d怪物一区| 女囚岛在线观看| 亚洲精品中文综合第一页| 成人性生交大片免费看中文网站| 91porny九色|