精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

RAG分塊優化之語義分塊方法CrossFormer模型技術思路 原創

發布于 2025-4-2 07:36
瀏覽
0收藏

筆者在前期文章中總結了RAG的分塊《??RAG常見13種分塊策略大總結(一覽表)??》,本文介紹一個語義分段的工作,該工作解決的問題是文本語義分割,即將文檔分割成多個具有連續語義的段落。傳統方法通常依賴于預處理文檔以分段來解決輸入長度限制問題,但這會導致段間關鍵語義信息的丟失。RAG系統中的文本分塊方法主要分為基于規則和基于LLM的方法。

插入一個思路,其實,語義分段的方式筆者在很早實踐過一個思路,不管是RAG分塊還是基于規則分塊,都會或多或少的都是段落信息,如何通過語義的方式分割段落?筆者之前的思路最初的想法來源于序列標注模型,那么是否能應用序列標注的方法,來預測文本行之間的跳轉概率?答案是肯定的,以pdf為例,具體實施步驟如下: 先放上筆者之前的老圖:

RAG分塊優化之語義分塊方法CrossFormer模型技術思路-AI.x社區

  1. 從pdf讀取程序或ocr引擎中得到文本行及其坐標;
  2. 使用神經網絡對第i行的文本進行編碼,得到文本嵌入向量text_emb(i);
  3. 提取對應行的圖像,得到圖像嵌入向量img_emb(i);
  4. 提取字號、文字長度特征,并進行歸一化得到特征向量;
  5. 聚合步驟2、3、4得到的向量,得到行嵌入line_emb(i);
  6. 使用神經網絡對行向量序列[line_emb(i)]進行序列標注。

整體方案流程圖如下:

RAG分塊優化之語義分塊方法CrossFormer模型技術思路-AI.x社區

接下來,本文介紹的方法有異曲同工之處,也是采用序列標注的方式進行,供參考。

方法-CrossFormer

RAG分塊優化之語義分塊方法CrossFormer模型技術思路-AI.x社區

任務定義

CrossFormer 將文本語義分割任務定義為句子級別的序列標注問題。給定一個文檔 ,包含  個句子,每個句子  被分配一個二分類標簽 。標簽  表示由語義連貫性統一的一個段落的終端邊界,而  表示在同一主題段落內的連續性。目標是訓練一個函數 ,能夠根據上下文預測每個句子的標簽 。

為了實現這一點,模型在每個句子  的末尾添加一個特殊的標記 [SENT],并評估這個標記是否標志著一個段落邊界。通過這種方式,文檔被分割成一組不相交的語義段落。

文檔預處理

RAG分塊優化之語義分塊方法CrossFormer模型技術思路-AI.x社區

由于文本語義分割任務通常涉及長文檔,需要采用適當的建模方法來有效處理這些文檔。論文中采用了截斷和分段的方法。步驟如下:

  1. 分段:根據任務指定的分隔符(如換行符或句號)對文檔進行分段。
  2. 截斷:將每個句子截斷到最大長度 。
  3. 拼接:將截斷后的句子按順序拼接,形成多個文檔段,每個段的長度不超過 。
  4. 批處理:將這些文檔段組裝成一個批次,并輸入模型進行訓練或推理。

跨段融合模塊 (CSFM)

CSFM 是 CrossFormer 的核心組件,用于增強文檔段之間的語義連貫性。原理如下:

  1. 全局語義表示:通過選擇預訓練的特殊標記 [CLS] 和 [SEP],提取每個段落的語義表示 。然后,通過最大池化從這些表示中獲取最大的語義成分,得到全局語義信息 。
  2. 拼接和線性變換:將全局語義嵌入  與每個分隔符嵌入  進行拼接,并通過兩個線性層進行處理,得到 ,即結合了全局語義信息的分隔符表示。
  3. 分類:將  輸入線性層并應用 Softmax 函數,得到分類結果,從而確定段落邊界。

訓練模型使用交叉熵損失函數即可。

通過這種方式,CSFM 能夠有效地捕捉文檔段之間的語義依賴關系,提高分割性能。

CrossFormer 作為 RAG 文本塊分割器

RAG分塊優化之語義分塊方法CrossFormer模型技術思路-AI.x社區

CrossFormer 可以作為RAG系統中的文本塊分割器,生成更具語義連貫性的文本塊。流程如下:

RAG分塊優化之語義分塊方法CrossFormer模型技術思路-AI.x社區

流程圖

  1. 分割長文檔:首先使用 CrossFormer 對輸入文檔進行分割,生成一系列文本塊。
  2. 長度評估:評估每個文本塊的長度。如果長度超過預設閾值,則將其輸入分割隊列進行進一步處理,直到確定不需要額外分割或文本塊長度低于指定閾值。
  3. 檢索和生成:使用分割后的文本塊進行檢索和生成。通過檢索器和問題提示進行相關性檢索,生成上下文,并將其輸入到LLM中以獲得最終答案。

局限性

  • CrossFormer不能精確控制文本塊長度的上限。因此,可能需要結合基于規則的方法來輸出合適的長度。
  • 作為線性文本語義分割模型,CrossFormer不能輸出部分重疊的文本塊,這在RAG系統的某些場景中是必需的

實驗效果

RAG分塊優化之語義分塊方法CrossFormer模型技術思路-AI.x社區

文本語義分割的結果

RAG分塊優化之語義分塊方法CrossFormer模型技術思路-AI.x社區

在RAG基準測試上的結果

RAG分塊優化之語義分塊方法CrossFormer模型技術思路-AI.x社區

參考文獻:CrossFormer: Cross-Segment Semantic Fusion for Document Segmentation,https://arxiv.org/pdf/2503.23671v1


公眾號大模型自然語言處理  作者:余俊暉

原文鏈接:??https://mp.weixin.qq.com/s/YSt1G-M5yEJCb8VcW0OlnA??

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2025-4-2 07:36:18修改
收藏
回復
舉報
回復
相關推薦
欧美婷婷久久| 精品国产一区久久久| 俄罗斯av网站| 男人天堂网在线| 美女脱光内衣内裤视频久久影院| 久久精品国产精品| bl动漫在线观看| 日韩av首页| 亚洲精品日韩综合观看成人91| 国产在线精品一区| 97人妻精品一区二区三区| 亚洲大胆视频| 久久国内精品一国内精品| 日韩精品一区二区三区视频在线观看| 成人久久一区二区三区| 久久9999久久免费精品国产| 狠狠色狠狠色综合婷婷tag| 91精品国产日韩91久久久久久| 欧美大黑帍在线播放| 国产区高清在线| 丁香六月综合激情| 国产精品情侣自拍| 免费在线不卡视频| 色小子综合网| 亚洲欧洲一区二区三区在线观看| 极品白嫩少妇无套内谢| 久久免费资源| 在线视频一区二区三区| 国产精品又粗又长| 3d玉蒲团在线观看| 国产精品乱码人人做人人爱| 九9re精品视频在线观看re6| 懂色一区二区三区av片| 美女又爽又黄视频毛茸茸| 久久久久久久久久久久电影| 在线中文字幕一区| 国产二区视频在线播放| 黄网av在线| 亚洲视频 欧洲视频| 日韩精品久久久免费观看| 亚洲免费视频网| 国产激情精品久久久第一区二区 | 日韩欧美国产1| www.精品在线| 国产精品天堂蜜av在线播放| 欧美色另类天堂2015| 福利视频一二区| 男男gaygays亚洲| 一区二区三区精品| 手机看片日韩国产| 亚洲一区精彩视频| 天堂网视频在线| 在线一区免费观看| 26uuu亚洲国产精品| 日韩男人的天堂| 国产一区二区三区久久| 欧美自拍视频在线观看| 在线精品免费视| 日产欧产美韩系列久久99| 国产成人精品午夜| 国产日韩在线免费观看| 蜜臂av日日欢夜夜爽一区| 国产精品一区二区久久精品| 国产精品欧美综合亚洲| 国产一区二区不卡| 成人h视频在线观看| 国产综合无码一区二区色蜜蜜| 粉嫩aⅴ一区二区三区四区 | 日韩av资源在线| 亚洲韩国在线| 亚洲AV午夜精品| 成人美女在线观看| 国产乱人伦精品一区二区| 亚洲h视频在线观看| 不卡免费追剧大全电视剧网站| 国产伦精品一区二区三区高清| 天堂中文在线资| 国产清纯白嫩初高生在线观看91 | 91麻豆精品国产91久久久资源速度| 日韩av自拍偷拍| 亚洲一区二区三区日本久久九| 亚洲第一精品夜夜躁人人躁| 六月婷婷七月丁香| 97精品97| 91精品成人久久| 久久久久久在线观看| 天堂网在线播放| 国产情侣一区| 国产精品一区=区| 国产免费一区二区三区免费视频| 国产91精品欧美| 青青成人在线| 色呦呦视频在线观看| 精品人伦一区二区三区蜜桃免费| 一级特黄性色生活片| 午夜电影一区| 亚洲人成五月天| 极品颜值美女露脸啪啪| 免费在线观看成人av| 国产欧美在线观看| 日韩一级片免费观看| 国产欧美日韩精品在线| 欧美黄色免费网址| 福利视频一区| 亚洲精品久久久久中文字幕欢迎你| 亚洲精品国产精品国自产网站| 中文字幕人成人乱码| 91丝袜国产在线播放| 亚洲美女免费精品视频在线观看| 极品久久久久久久| 在线高清一区| 成人黄色av网站| 蜜桃视频在线观看网站| 亚洲精品欧美二区三区中文字幕| 日韩五码在线观看| 精品视频在线一区| 中文字幕少妇一区二区三区| 偷偷操不一样的久久| 国产乱码精品一区二区三区五月婷| 欧美高清性xxxxhd| 福利在线免费视频| 欧美成va人片在线观看| www.xx日本| 久久九九电影| 久久偷窥视频| √天堂8资源中文在线| 欧美一区二区播放| 91禁男男在线观看| 天堂成人国产精品一区| 在线观看国产精品91| 久久亚洲免费| 免费网站看v片在线a| 日韩欧美国产网站| 日本五十肥熟交尾| 亚洲欧美伊人| 91美女福利视频高清| 1769在线观看| 欧美日韩视频在线观看一区二区三区 | 成人影院av| 亚洲精品不卡在线| 日本熟妇乱子伦xxxx| 国产成人精品综合在线观看| 在线视频一二三区| 精品一区视频| 成人97在线观看视频| 国产精品视频一区二区三区,| 欧美国产精品v| 最新中文字幕免费视频| 欧美三级三级| 亚洲三级免费观看| 国产精品亚洲片夜色在线| 欧美日韩影视| 色94色欧美sute亚洲13| 波多野吉衣中文字幕| 久久久久免费| 日韩精品一区二区三区色偷偷| 韩国久久久久久| 亚洲三级黄色在线观看| 成人a v视频| 国产精品久久午夜| 亚洲天堂av一区二区三区| 综合精品一区| 国产99午夜精品一区二区三区| 成人免费高清| 亚洲国产日韩一区| 五月天婷婷导航| 中文无字幕一区二区三区| 91亚洲精品久久久蜜桃借种| 中文字幕午夜精品一区二区三区| 国产精品国产一区二区| 少妇视频在线观看| 一区二区欧美久久| 国产精品探花视频| av香蕉成人| 日韩写真欧美这视频| 国产一级片免费看| 久久亚洲精品小早川怜子| 免费大片在线观看| 亚洲精品国产成人影院| 国产精品毛片va一区二区三区| 欧美男人天堂| 日韩中文娱乐网| 老司机午夜福利视频| 91福利社在线观看| 成人性生活毛片| 99国产精品国产精品毛片| 成人亚洲视频在线观看| 综合久久精品| 鲁鲁狠狠狠7777一区二区| 日韩av一级| 久久久久五月天| 国产粉嫩一区二区三区在线观看| 制服丝袜亚洲色图| 亚洲天堂视频网站| 亚洲女同ⅹxx女同tv| 黄色短视频在线观看| 国产在线日韩欧美| 日韩欧美国产一区二区三区| 一级特黄a大片免费| 久久精品999| 精品国产免费av| 性欧美69xoxoxoxo| 欧美午夜精品理论片a级大开眼界 欧美午夜精品久久久久免费视 | 亚洲天天做日日做天天谢日日欢| 国产又粗又长又爽| 国产真实乱偷精品视频免| 亚洲国产精品久久久久婷蜜芽| 欧美成人精品一区二区三区在线看| 国产尤物91| 国产激情一区| 国产精品国模在线| 日本在线播放一二三区| 欧美xxxx做受欧美.88| 国产日本在线视频| 亚洲国产高清自拍| 国产xxxxxx| 欧美喷潮久久久xxxxx| 男人天堂2024| 亚洲成a人v欧美综合天堂| 极品日韩久久| 波多野结衣电车痴汉| 亚洲一区二区综合| 色欲一区二区三区精品a片| 国产视频一区在线播放| 国产美女视频免费观看下载软件| 国产曰批免费观看久久久| 嫩草影院国产精品| 三级不卡在线观看| 日韩精品一区二区三区久久| 伊人影院久久| 福利在线一区二区| 欧美精选一区| 欧洲xxxxx| 亚洲影视一区| 女同性恋一区二区| 雨宫琴音一区二区三区| 永久免费精品视频网站| 久久社区一区| 一区二区三区四区五区精品| 日韩欧美视频在线播放| 色一情一乱一伦一区二区三欧美| 国产成人3p视频免费观看| 欧美精品123| 精品在线91| 欧美在线激情| 国产一区二区三区电影在线观看| 伊人影院久久| 久久青青草原| 亚洲人成网www| 欧美一区二区高清在线观看| 亚洲福利网站| 欧美日韩另类综合| 国产在线观看91一区二区三区 | 国产精品国语对白| 成人国产精品| 国产主播在线一区| 久久久久久久久久久久电影| av在线不卡一区| 红杏aⅴ成人免费视频| 麻豆av一区二区三区久久| 亚洲三级精品| 视频二区一区| 欧美~级网站不卡| www.夜夜爱| 国产视频一区免费看| 国产熟女高潮视频| 蜜臀av一级做a爰片久久| 国产黄片一区二区三区| 国产亚洲福利社区一区| 高清国产在线观看| 免费视频国产一区| 亚洲欧美成人网| 337p日本欧洲亚洲大胆鲁鲁| 日韩亚洲欧美中文高清在线| 成人看片免费| 亚州av一区二区| 国精产品一区二区三区有限公司| 国产色综合天天综合网| 日韩精品一级| 久久av一区二区三区漫画| 欧美日韩精品在线一区| 水蜜桃在线免费观看| 一区二区三区成人精品| 色一情一乱一伦一区二区三区日本| 免费看精品久久片| 美女露出粉嫩尿囗让男人桶| 26uuu亚洲综合色欧美| 一本在线免费视频| 婷婷中文字幕一区三区| 亚洲精品无码久久久久| 精品乱人伦一区二区三区| 欧美成人片在线| 欧美黑人性视频| 91九色综合| 激情五月综合色婷婷一区二区| 欧美韩日一区| 青青青青草视频| 激情五月婷婷综合网| 免费中文字幕av| 9l视频自拍九色9l视频成人| 久久久国产精品免费| 激情国产在线| 91精品视频免费看| 久久av资源| 日韩a∨精品日韩在线观看| 麻豆freexxxx性91精品| 一级做a爰片毛片| 一级精品视频在线观看宜春院| 最好看的日本字幕mv视频大全| 精品福利视频一区二区三区| 亚洲视频tv| 日韩av不卡电影| 精品亚洲自拍| 欧洲金发美女大战黑人| 日韩av网站免费在线| 黄色片视频免费观看| 亚洲黄一区二区三区| 在线观看中文字幕码| 亚洲欧美日韩国产成人| yellow在线观看网址| 91pron在线| 天天综合网91| 性欧美videossex精品| 久久久久久久久久久电影| 国产精品 欧美 日韩| 日韩午夜av电影| 成人免费看片| 91精品久久久久久综合乱菊 | 国产婷婷色综合av蜜臀av| 最新国产露脸在线观看| 国产欧美 在线欧美| 久久av中文| 日韩毛片在线免费看| 99精品欧美一区二区蜜桃免费| 久久久久亚洲AV| 日韩欧美激情在线| 天堂亚洲精品| 97碰碰视频| 欧美国产三区| 麻豆精品国产传媒| 亚洲精品乱码久久久久久黑人| 中文字幕在线2019| 中文国产成人精品| 国产在视频一区二区三区吞精| 午夜午夜精品一区二区三区文| 久久最新视频| 亚洲黄色小说视频| 欧美亚洲尤物久久| 成人免费在线电影| 国产精品热视频| 午夜激情久久| 久草福利在线观看| 亚洲国产一区在线观看| 天堂av资源在线| 57pao成人国产永久免费| 日韩欧美黄色| 黄色一级免费大片| 国产精品国产自产拍在线| 亚洲视屏在线观看| 99国产欧美久久久精品| 91看片淫黄大片91| 麻豆精品在线看| 亚洲国产成人精品综合99| 精品国产乱码久久久久久牛牛| 七七久久电影网| 国产欧美日韩综合精品二区| 欧美亚洲免费| 国产精品suv一区二区88| 欧美一区二区播放| 欧美激情网站| 亚洲高清在线观看一区| 韩国成人在线视频| 国产一级久久久| 日韩精品在线观| 日韩欧美激情| 黄页网站在线观看视频| 久久视频一区二区| 亚洲图片在线播放| 欧美激情女人20p| 九九久久精品| 欧美在线a视频| 欧美日韩色婷婷| 无遮挡的视频在线观看| 成人午夜电影在线播放| 麻豆9191精品国产| 中文字幕影音先锋| 亚洲欧美日韩天堂一区二区| 欧美成人免费全部网站| 性一交一乱一伧国产女士spa| 久久久久久久久久久久久女国产乱| 亚洲综合免费视频| 国模精品视频一区二区三区| 欧美精选一区二区三区| 91成人在线观看喷潮蘑菇| 丝袜美腿诱惑一区二区三区| 91av视频在线| 91精品国产自产拍在线观看蜜| 妖精视频一区二区| 这里是久久伊人| 欧美在线va视频|