微軟：RAG并不是你唯一的解決方案！

PaperAgent

發(fā)布于 2024-9-25 12:56

瀏覽

0收藏

將外部數(shù)據(jù)整合到LLMs中的技術，如檢索增強生成（RAG）和微調，得到廣泛應用，但在不同專業(yè)領域有效部署數(shù)據(jù)增強LLMs面臨著重大挑戰(zhàn)：

從檢索相關數(shù)據(jù)和準確解釋用戶意圖到充分利用LLMs的推理能力來處理復雜任務
對于數(shù)據(jù)增強LLM應用來說，沒有一種放之四海而皆準的解決方案。
應用落地性能不佳往往是由于未能正確識別任務的核心焦點，或者任務本身就需要多種能力結合，必須被分離出來以獲得更好解決方案。

數(shù)據(jù)增強LLM應用中不同查詢層次的主要技術總結?

微軟亞洲研究院（MSRA）提出了一種RAG任務分類方法，根據(jù)所需的外部數(shù)據(jù)類型和任務的主要焦點，將用戶查詢分為四個層次：

顯式事實查詢（Level-1）：直接從數(shù)據(jù)中檢索明確的事實。
隱式事實查詢（Level-2）：需要推理或整合數(shù)據(jù)中的隱含信息。
可解釋推理查詢（Level-3）：需要理解并應用領域特定的理由和邏輯。
隱式推理查詢（Level-4）：需要從數(shù)據(jù)中推斷出隱含的推理邏輯。?

四個層次查詢的主要焦點?

微軟：RAG并不是你唯一的解決方案！-AI.x社區(qū)

同時，也將外部數(shù)據(jù)整合到LLMs中的形式歸為三種：上下文、小型模型和微調，強調了它們各自的優(yōu)勢、局限性以及它們適合解決的問題類型。

將特定領域數(shù)據(jù)注入到大型語言模型（LLM）的三種方式：a) 根據(jù)查詢提取部分領域數(shù)據(jù)作為LLM的上下文輸入，b) 用特定領域數(shù)據(jù)訓練一個較小的模型，然后指導后續(xù)輸入到LLM的外部信息的整合，以及 c) 直接使用外部領域知識對通用的大型語言模型進行微調，使其成為領域專家模型。

微軟：RAG并不是你唯一的解決方案！-AI.x社區(qū)

L1：顯式事實查詢

定義：

顯式事實查詢（L1）是最簡單的數(shù)據(jù)增強查詢類型，可以直接通過訪問特定領域的文檔或文檔片段來回答。
答案通常在文檔的純文本中，需要最小的推理或簡單的邏輯。

提供事實信息的常見數(shù)據(jù)集分層

微軟：RAG并不是你唯一的解決方案！-AI.x社區(qū)

挑戰(zhàn)：

數(shù)據(jù)處理困難：外部數(shù)據(jù)通常是高度非結構化的，包含多種模式（如表格、圖像、視頻等），處理這些數(shù)據(jù)時保持原始上下文和意義是一個挑戰(zhàn)。
數(shù)據(jù)檢索困難：從大型非結構化數(shù)據(jù)集中檢索相關數(shù)據(jù)段計算密集且容易出錯。
評估困難：評估RAG系統(tǒng)的性能，尤其是在組件級別，需要開發(fā)能夠準確評估數(shù)據(jù)檢索和響應生成質量的穩(wěn)健指標。

解決方案：