被動式RAG和主動式RAG——主動式RAG才更符合人類的思維習慣 原創
“ 主動式RAG就是一個會使用搜索引擎的人,它會根據需要使用搜索引擎。”
關于RAG事實上分為兩種架構,一種是傳統的被動式RAG,另一種是主動式RAG;作者在上一篇文章中說過RAG并不是一項具體的技術,而是一種方法論。
因此,所謂的被動式RAG是基于傳統的檢索召回,增強生成的流程;而主動式RAG是把RAG技術與智能體技術相結合的一種主動式架構——其主動主要體現在智能體能夠自行規劃和使用工具來回答問題,而不需要每次都去召回,然后再進行回答。
主動式RAG
傳統的被動式RAG存在很多缺點,比如說太傻叉了,每次都要先去知識庫中進行文檔召回,哪怕你只是簡單的說一句你好;當然,也可以通過增加一個前端路由的方式來避免這個問題,但在復雜問題下就不太行了;因此總體來說,被動式RAG存在很多問題。
但結合了智能體技術的主動式RAG相比就存在很多優點,而且其更符合人類的思維習慣。

主動式RAG的工作流程是什么樣的?
主動式RAG的本質還是一個智能體,只不過給它配置的是召回工具,也就是特定應用場景下的智能體。
智能體的運作邏輯是什么?為什么說智能體更符合人類的思維模式?
智能體 = 大模型+工具+ (用戶問題 + 記憶 + 上下文管理),其中主要還是大模型和工具扮演著重要角色。

在智能體中,大模型就是一個人,然后給它配備了能夠解決問題的工具;比如說,給你一臺電腦,讓你做一份PPT,其中你就是大模型,電腦就是工具。
具體這個PPT怎么做,有哪些內容是由你(大模型)決定的,而做PPT必須使用電腦才可以。
在RAG中也是如此,用戶提出問題,然后交給大模型,然后大模型根據自己的經驗判斷是否能夠回答問題,如果回答不了是否有工具能夠使用,之后再回答用戶問題。
這個流程是不是很符合我們人類的思維模式,應該說和人類的思維模式一模一樣。
假如說你是一個計算機領域的工作人員,有人問你計算機相關的問題,我想大部分問題你應該都不需要看書或查資料就能夠回答;只有遇到那些比較復雜或者你拿不準的問題時才需要查閱資料,比如說計算機類的書籍,搜索引擎等。

但傳統的被動式RAG是怎么做的?
不管用戶問什么問題,先去資料庫里查一遍,然后再來回答用戶問題;但我們知道很多簡單的問題,其實沒必要去查資料,這樣雖然從理論上能提升準確率,但會嚴重影響效率。
總之就是被動式RAG的執行邏輯太傻了,就像開卷考試一樣,問你1+1等于幾,你還要去翻一下書,這不是浪費時間嘛。
而基于主動式的RAG,我能夠自己回答的問題就自己回答,不能自己回答的問題再去使用工具做檢索;并且,由于記憶的存在,如果是用戶重復問的問題,還可以自己根據記憶進行回答,這樣可以大大提升響應速度,提升用戶體驗。
?
本文轉載自??AI探索時代?? 作者:DFires

















