精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

RAG 架構設計五種分塊技術剖析和選型 原創

發布于 2025-6-30 07:44
瀏覽
0收藏

RAG (檢索增強生成)是企業 AI 大模型應用落地的主要應用形態之一,特別是在智能問答、報告生成、內容審核、Text2SQL、流程自動化和 AI 編程等領域大規模應用和落地 RAG 架構。

RAG 架構設計五種分塊技術剖析和選型-AI.x社區

從技術本質來分析,RAG 架構設計是由兩部分構成:數據工程和信息抽取。其中數據工程是最重要的部分,數據工程的最重要的工作之一是對文檔進行分塊(Chunking)。

因為要處理的文檔可能會相當大,所以第一步還包括“分塊”,就是把一個大文件分成更小的、更容易處理的部分。

RAG 架構設計五種分塊技術剖析和選型-AI.x社區

這個步驟非常重要,因為它確保文本能夠適應嵌入模型的輸入大小。

而且,它還能提高信息抽取步驟的效率和準確性,這直接影響到生成回答的質量。

下文我們詳細剖析兩大問題:

第一、 RAG 架構落地中常用的5種分塊技術;

第二、企業 RAG 架構落地分塊技術如何選型。

RAG 架構設計的5種分塊技術剖析

企業 RAG 架構落地,常常使用5種分塊技術:固定大小分塊、語義分塊、遞歸分塊、基于文檔結構分塊、基于 LLM 分塊。

RAG 架構設計五種分塊技術剖析和選型-AI.x社區

第一、固定大小分塊(Fixed-size chunking)

生成文本塊最直觀和簡單的方法就是根據預先設定的字符數、單詞數或 tokens,把文本切成大小一致的小段。

RAG 架構設計五種分塊技術剖析和選型-AI.x社區

因為直接切分可能會打斷文本的語義流暢性,所以建議在兩個連續的文本塊之間保留一些重疊部分(就像上面圖中藍色區域那樣)。

這個方法很容易實現。而且,因為所有文本塊大小都一樣,所以批量處理起來也更簡單。

但是,這樣做有個大問題。它通常會把句子(或想法)從中間切斷。這樣一來,重要信息就可能會分散到不同的文本塊里。

第二、語義分塊(Semantic chunking)

語義分塊方法很簡單。

RAG 架構設計五種分塊技術剖析和選型-AI.x社區

就是根據有意義的單元來切分文檔,比如:句子、段落或者主題部分。

然后,為每個部分創建嵌入向量(一種能表示文本意義的數字)。

假設我從第一個部分和它的嵌入向量開始。

  • 如果第一個部分的嵌入向量和第二個部分的嵌入向量之間的余弦相似度很高,那么這兩個部分就組成一個文本塊。
  • 這個過程會一直繼續,直到余弦相似度明顯下降。
  • 一旦相似度下降了,我們就開始一個新的文本塊,并重復這個過程。

輸出的結果可能如下:

RAG 架構設計五種分塊技術剖析和選型-AI.x社區

和固定大小的文本塊不同,這種方法保持了語言的自然流暢性,并保留了完整的思想。

因為每個文本塊包含的信息更豐富,它提高了檢索的準確性,這反過來又使得大語言模型(LLM)生成的回答更加連貫和相關。

一個小問題是,它依賴于一個閾值來確定余弦相似度是否顯著下降,這個閾值可能因文檔而異。

第三、遞歸分塊(Recursive chunking)

遞歸分塊方法也很容易理解。

RAG 架構設計五種分塊技術剖析和選型-AI.x社區

首先,根據文檔中的自然分隔符來分塊,比如:段落或章節。

然后,如果某個塊的大小超過了我們預先設定的塊大小限制,就把它再分成更小的塊。如果塊的大小已經在限制范圍內,就不用再分了。

可能的輸出結果是這樣的:

RAG 架構設計五種分塊技術剖析和選型-AI.x社區

如上所示:

  • 我們首先定義了兩個塊(紫色的兩個段落)。
  • 然后,第一段被進一步分成了更小的塊。

和固定大小的塊相比,這種方法同樣保留了語言的自然流暢性,并且保留了完整的語義。

不過,這種方法在實現和計算復雜度上會稍微復雜一些。

第四、基于文檔結構分塊(Document structure-based chunking)

基于文檔結構分塊是一種很直觀的方法。

RAG 架構設計五種分塊技術剖析和選型-AI.x社區

它利用文檔本身的結構,比如:標題、章節或段落,來確定分塊的邊界。

這樣做的好處是,它能夠保持文檔結構的完整性,因為它和文檔的邏輯部分是對齊的。

輸出的結果可能看起來像這樣:

RAG 架構設計五種分塊技術剖析和選型-AI.x社區

話雖如此,這種方法假設文檔有一個清晰的結構,但有時候可能并非如此。

而且,分出來的塊長度可能會不一樣,有可能超出大模型處理的字數限制。實際落地是會把它和遞歸分塊結合起來使用。

第五、基于 LLM 分塊(LLM-based chunking)

既然每種分塊方法都有優點和缺點,那為什么不讓大語言模型(LLM)來創建文本塊呢?

RAG 架構設計五種分塊技術剖析和選型-AI.x社區

大語言模型可以被引導生成語義上獨立且有意義的文本塊。

很明顯,這種方法將確保高語義準確性,因為大語言模型具備世界知識,能理解上下文和含義,這超出了上面四種方法中使用的簡單啟發式方法。

唯一的問題是,這是這里討論的五種技術中計算量最大的文本塊劃分技術。

另外,由于大語言模型通常有一個有限的上下文窗口,這也是需要考慮的一點。

總之,每種技術都有它自己的優勢和權衡,5種分塊技術總結對比如下:

RAG 架構設計五種分塊技術剖析和選型-AI.x社區

我們實際落地發現,語義分塊在很多情況下都效果很好,你在 RAG 應用落地的時候可以首選,但是最好針對你的業務場景進行測試下。

RAG 架構落地過程中最終選擇哪種分塊技術,將很大程度上取決于你的內容性質、嵌入模型的能力、計算資源等等。


本文轉載自??玄姐聊AGI??  作者:玄姐

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2025-6-30 07:44:47修改
收藏
回復
舉報
回復
相關推薦
欧美亚韩一区二区三区| 国产香蕉精品视频| 亚洲第一图区| 99久久精品国产导航| 国产成人欧美在线观看| www.99re7| 视频一区在线观看| 欧美一级xxx| 无码人妻丰满熟妇区五十路百度| 国产不卡在线| 久久女同精品一区二区| 18成人在线| 久久久免费高清视频| 亚洲第一偷拍| 国产一区二区三区毛片| 日本黄色大片在线观看| 色一情一交一乱一区二区三区| 麻豆蜜桃在线| 国产精品美女久久久久aⅴ| 国产伦精品一区二区三区视频免费| 国产三级精品三级在线观看| 欧美va天堂在线| 亚洲图片欧美午夜| av av在线| 高清一区二区中文字幕| 日本乱码高清不卡字幕| 国产一区二区四区| 免费av不卡| 久久久99久久| 精品国产一区二区三区日日嗨| 内射国产内射夫妻免费频道| 成人三级视频在线观看| 小嫩嫩12欧美| 亚洲成人黄色网址| 中文字幕在线看视频国产欧美| 日韩一级在线免费观看| 成人黄色动漫| 一区二区免费看| 中文字幕日韩一区二区三区 | 国产精品一区hongkong| 一区免费观看视频| 手机看片福利永久国产日韩| 日本大片在线观看| 91免费精品国自产拍在线不卡| 国产乱码精品一区二区三区卡| 精品国产无码AV| 国模娜娜一区二区三区| 成人免费xxxxx在线观看| 69亚洲精品久久久蜜桃小说| 9色精品在线| 91高清视频在线免费观看| 欧美黄色免费在线观看| 欧美午夜不卡影院在线观看完整版免费| www日韩欧美| 大地资源高清在线视频观看| 午夜精品久久久久久久四虎美女版| 中文字幕精品一区二区精品| 亚洲一二三四视频| 日韩一区三区| 久久精品国产久精国产一老狼| 亚洲aaa视频| 99精品视频在线观看免费播放| 日韩中文字幕在线视频| 免费精品在线视频| 中文字幕一区二区精品区| 美日韩精品免费视频| 欧美久久久久久久久久久久| 欧美日本一区| 97免费中文视频在线观看| 免费一级特黄特色大片| 亚洲精品婷婷| 国产成人一区二区在线| 无码人妻丰满熟妇区五十路| 美国三级日本三级久久99| 国产一区二区在线免费视频| 国产精品久久久久久69| 国产成人午夜视频| 久久久精品国产一区二区三区| 韩国三级在线观看久| 中文字幕一区二区在线观看| 毛片在线视频观看| 一区二区三区四区日本视频| 欧美日韩中文字幕一区| 韩国三级丰满少妇高潮| 日本免费精品| 亚洲人免费视频| 日韩三级久久久| 亚洲先锋成人| 国产精品igao视频| av网站在线观看免费| 91网站在线播放| 一本一本久久a久久精品综合妖精| 影音先锋在线视频| 色成年激情久久综合| 激情久久综合网| 日本欧美韩国国产| xxxxx91麻豆| av中文在线播放| 精品一区二区三区免费视频| 国产一区二区黄色| 欧美一区二区三区| 欧美日韩中文字幕| 国产裸体视频网站| 精品国产一区一区二区三亚瑟| 欧美成人三级视频网站| 在线观看污污网站| 成人午夜在线播放| 一区二区三区视频在线播放| 国产色播av在线| 91精品视频网| av手机在线播放| 日韩视频一区| 91成人伦理在线电影| 你懂的视频在线播放| 亚洲永久免费视频| 高清av免费看| 妖精视频一区二区三区| 久久99久久久久久久噜噜| 中文字幕无线码一区| 久久久一区二区| 给我免费播放片在线观看| 婷婷激情成人| 亚洲偷欧美偷国内偷| 亚洲男人的天堂在线视频| 国产成人午夜精品影院观看视频 | 波多野结衣家庭教师在线观看 | 欧美一级电影久久| 午夜精品一二三区| 亚洲欧美日韩在线| 五月天激情播播| 精品久久久久中文字幕小说| 91精品国产电影| 人妻夜夜爽天天爽| 亚洲一区二区精品久久av| 久久精品视频在线观看免费| 日韩欧美精品综合| 国产精品网红福利| 国产午夜在线观看| 色综合久久99| www.色多多| 免费看亚洲片| 欧美日韩国产高清视频| a日韩av网址| 亚洲美女av黄| 国产黄色免费观看| 2021久久国产精品不只是精品 | 国产一区二区三区久久悠悠色av| 亚洲精品乱码视频| 国产精品亲子伦av一区二区三区| 在线播放日韩精品| 中文字幕精品在线观看| 国产精品成人网| 三级av免费观看| 色综合蜜月久久综合网| 国产日韩专区在线| 岛国中文字幕在线| 精品日本一线二线三线不卡| 国产亚洲自拍av| av在线不卡电影| 成人性生活视频免费看| 欧美欧美在线| 久久久噜噜噜久久久| 三级视频在线看| 日韩人在线观看| 国产三级短视频| 国产在线一区观看| www.avtt| 国产精品片aa在线观看| 成人国产在线视频| 性xxxfreexxxx性欧美| 亚洲国内高清视频| 成人a v视频| 最新不卡av在线| zjzjzjzjzj亚洲女人| 每日更新成人在线视频| 先锋影音日韩| 日韩第一区第二区| 欧美在线视频免费播放| 成人亚洲综合天堂| 日韩欧美在线观看一区二区三区| 久一视频在线观看| 久久人人爽爽爽人久久久| 一区二区三区韩国| 91精品婷婷色在线观看| 成人自拍偷拍| av在线日韩| 欧美第一黄网免费网站| 免费在线国产| 日韩精品一区二区三区中文不卡 | 亚洲激情图片| 一区二区三区免费在线看| 欧美在线影院在线视频| 黄色网址在线免费播放| 日韩精品免费看| 国产精品毛片久久久久久久av| 性感美女极品91精品| 亚洲不卡的av| 91小视频免费看| 中文字幕线观看| 香蕉亚洲视频| 男人添女人下部视频免费| 国产欧美日韩精品一区二区免费| 91成人理论电影| 成人1区2区| 57pao国产精品一区| 草莓福利社区在线| 一色桃子一区二区| 天堂在线视频网站| 日韩一区二区免费视频| 久久精品偷拍视频| 黄色一区二区在线| 欧美日韩亚洲国产另类| 国产精品人妖ts系列视频| 屁屁影院国产第一页| 国产一区二区在线观看免费| 成人在线观看黄| 亚洲高清免费| www国产免费| 国产精品97| 日韩av一区二区三区在线观看| 成人搞黄视频| 91久久精品国产91久久性色tv | 圆产精品久久久久久久久久久 | 成人精品免费在线观看| 亚洲欧美日韩国产成人精品影院| x88av在线| 久久亚洲私人国产精品va媚药| wwwxx日本| 国产精品夜夜爽| 亚洲午夜激情影院| 热久久久久久久| 热久久精品免费视频| 手机精品视频在线观看| 青青草原成人网| 99日韩精品| 国产人妻777人伦精品hd| 欧美日韩午夜| 妞干网视频在线观看| 欧美1区2区3区| 日韩一二区视频| 中文精品久久| 特级西西444| 欧美精品黄色| 欧美高清中文字幕| 亚洲午夜视频| 国产美女网站在线观看| 亚洲成人资源| 精品一区二区中文字幕| 男女精品视频| 欧在线一二三四区| 亚洲欧美视频| 一级在线免费视频| 久久电影国产免费久久电影| 17c国产在线| 国产一区免费电影| 亚洲天堂小视频| 成人午夜激情在线| 法国伦理少妇愉情| 国产视频一区二区在线| 亚洲色图第四色| 亚洲视频 欧洲视频| 免费毛片在线播放免费| 亚洲不卡一区二区三区| 性无码专区无码| 欧美亚洲国产怡红院影院| 亚洲天堂中文在线| 日韩欧美在线不卡| 欧美在线观看在线观看| 中文字幕国产亚洲| 在线观看h网| 57pao精品| 精品美女一区| 99热99热| 国产videos久久| 熟妇熟女乱妇乱女网站| 在线观看视频免费一区二区三区| 免费在线观看亚洲视频| 日韩**一区毛片| 日韩在线免费视频| 香蕉视频网站在线| 中文字幕视频在线免费欧美日韩综合在线看 | 欧美激情影院| 亚洲精品视频一区二区三区| 香蕉综合视频| 成人一区二区免费视频| 免费成人av在线播放| 国内自拍偷拍视频| 国产欧美日韩中文久久| 欧美黄色免费在线观看| 色婷婷av久久久久久久| 国产视频第二页| 亚洲情综合五月天| 日本在线观看高清完整版| 日av在线播放中文不卡| 欧美不卡在线观看| 欧美在线日韩精品| 国产精品99一区二区| 别急慢慢来1978如如2| 风间由美性色一区二区三区| 毛片aaaaaa| 精品色蜜蜜精品视频在线观看| 一二三四区在线| 亚洲欧美日韩天堂| 四虎亚洲成人| 国产精品视频网站| 亚洲欧美日本伦理| 欧美这里只有精品| 极品尤物av久久免费看| 亚洲激情视频小说| 亚洲成人手机在线| 国产精品无码专区av免费播放| 亚洲欧美一区二区三区情侣bbw| 欧美xxxx做受欧美88bbw| 国产精品香蕉在线观看| 宅男在线一区| 浮妇高潮喷白浆视频| 成人午夜av在线| 九九九久久久久| 555夜色666亚洲国产免| wwwxxx在线观看| 国产91亚洲精品| 欧美人成在线观看ccc36| www.国产亚洲| 国产在线一区观看| 又嫩又硬又黄又爽的视频| 在线视频欧美精品| 免费播放片a高清在线观看| 91成人在线播放| 另类ts人妖一区二区三区| 欧美国产视频一区| 国产酒店精品激情| av激情在线观看| 91精品国产综合久久香蕉麻豆| 中文字幕在线播放| 国产精品免费视频xxxx| 欧美亚洲高清| 国产精品一区二区三区在线播放| 青青草视频在线免费观看| 欧美激情久久久| 97久久综合精品久久久综合| 青青草综合视频| 国产盗摄视频一区二区三区| 我家有个日本女人| 日韩精品一区二区三区四区视频| av软件在线观看| av日韩中文字幕| 亚洲视频观看| av网页在线观看| 一本到不卡免费一区二区| 久久久pmvav| 国产精品久久精品| 久久婷婷蜜乳一本欲蜜臀| 五月婷婷六月合| 亚洲欧美综合另类在线卡通| 国产又粗又猛又黄又爽| 欧美成人午夜影院| 国产精品对白久久久久粗| 久久国产亚洲精品无码| 久久影院午夜论| 伊人久久成人网| 美女啪啪无遮挡免费久久网站| 成人资源在线播放| 九九九九免费视频| 欧美韩国日本综合| 国产又色又爽又黄又免费| 欧美成人h版在线观看| 精品国内亚洲2022精品成人| 日本a级片免费观看| 国产精品色噜噜| 国产黄a三级三级看三级| 欧美极度另类性三渗透| 羞羞答答一区二区| 蜜臀一区二区三区精品免费视频| ...中文天堂在线一区| 成人毛片在线免费观看| 欧美怡红院视频一区二区三区 | 佐佐木明希av| 91女厕偷拍女厕偷拍高清| 中文字幕日韩国产| 久久久久久国产免费| 免费一区二区| 欧美性受xxxx黒人xyx性爽| 丁香五六月婷婷久久激情| 91福利在线视频| 成人区精品一区二区| 玖玖视频精品| 精品无码m3u8在线观看| 一区二区福利视频| 日韩在线精品强乱中文字幕| 久久久噜噜噜www成人网| 成人免费在线播放视频| 色呦呦中文字幕| 国产主播在线一区| 亚洲自啪免费| 欧美成人三级视频| 一本色道久久综合狠狠躁篇的优点 | 在线日韩国产精品| 美女精品视频| 一区二区三视频| 久久精品男人天堂av|