精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI 與非結構化數據:簡單 RAG 的局限及生產級解決方案全解析

人工智能
非結構化數據涵蓋了電子郵件、PDF 文件、會議記錄等多種形式,它們充斥在各個角落,卻由于缺乏固定的格式,給傳統的數據處理工具帶來了巨大的挑戰。而人工智能(AI)的出現,尤其是大型語言模型(LLMs),為解決非結構化數據的難題帶來了新的希望。

非結構化數據涵蓋了電子郵件、PDF 文件、會議記錄等多種形式,它們充斥在各個角落,卻由于缺乏固定的格式,給傳統的數據處理工具帶來了巨大的挑戰。而人工智能(AI)的出現,尤其是大型語言模型(LLMs),為解決非結構化數據的難題帶來了新的希望。但在實際應用中,簡單的檢索增強生成(RAG)方法卻存在諸多不足,無法滿足復雜的生產級場景需求。本文將深入探討這些問題,并詳細闡述如何構建適用于生產環境的有效解決方案。

簡單 RAG 為何行不通:深入剖析

RAG 作為 AI 領域的熱門技術,將檢索和生成相結合,理論上能夠從大量數據中找到相關信息并生成答案。但在實際應用中,它存在著諸多局限性。

實際案例 1:缺乏上下文和精確性

假設在研究論文和報告的語料庫中搜索 “具有戰略領導經驗的可再生能源專家”。簡單的 RAG 系統可能會檢索到包含 “可再生能源” 和 “領導” 這兩個詞的文檔,但很可能會忽略一些關鍵細節。如果一篇論文討論的是 “可持續能源戰略”,但沒有直接使用 “可再生能源” 這個短語,RAG 系統就可能會遺漏這篇文檔,因為它過度依賴詞匯的相似性。更糟糕的是,大型語言模型在生成回答時,可能會在沒有核實戰略角度的情況下,將 “領導” 和 “項目管理” 混淆,從而給出模糊或錯誤的答案。

實際案例 2:可擴展性和延遲問題

當處理數百萬份文檔時,比如十年的客戶反饋數據,簡單 RAG 系統的問題就會更加凸顯。由于向量相似性過于寬泛,它可能會檢索到大量不相關的文本塊,這不僅會拖慢響應時間,還會讓大型語言模型在篩選信息時感到困惑。例如,當詢問 “客戶對產品可靠性有什么看法” 時,系統可能會返回數千個提到 “產品” 和 “問題” 的文本塊,但其中很多可能是關于定價或運輸延遲等無關話題的。這樣一來,大型語言模型很難從中提取出有用的信息,導致回答不一致或不完整。

實際案例 3:缺乏控制和可解釋性

在使用簡單 RAG 時,用戶往往對檢索和生成的內容缺乏精細的控制。如果用戶要求 “顯示 2023 年討論數據隱私的法律文件”,RAG 系統可能僅僅根據向量相似性來檢索文檔,忽略了 “日期” 和 “主題” 等關鍵結構化篩選條件。最終生成的輸出可能只是一個通用的摘要,難以進行驗證和審計,這對于受監管的行業來說是完全不可接受的。

正確的方法:適用于生產的藍圖

那么,如何構建一個能夠超越簡單 RAG 和簡單 AI 聊天機器人局限性的生產級解決方案呢?這需要一個全面的方法,包括使用大型語言模型結構化數據、進行文本分塊以提高效率、生成向量嵌入以理解語義,以及使用混合搜索引擎進行搜索。

利用 LLMs 和提示將非結構化數據轉換為結構化洞察

首先要面對的挑戰是將雜亂無章的非結構化數據轉化為可用的形式。這就需要借助大型語言模型和精心設計的提示。用戶可以將非結構化數據輸入到大型語言模型中,這些模型可以在本地托管,也可以通過像 Hugging Face Inference 這樣的平臺進行訪問。關鍵在于使用有針對性的提示來引導大型語言模型的輸出。

例如,對于一系列研究論文,可以設計這樣的提示:“從每份文檔中提取以下內容:標題、作者、出版日期、摘要(不超過 200 字)以及關鍵主題。將輸出格式化為每個類別都有相應字段的 JSON 格式。” 大型語言模型會根據對語言的理解,對每份文檔進行處理,將相關信息識別并組織成結構化的字段。

對于更復雜的情況,如客戶反饋或法律合同,提示可以進一步細化。假設處理客戶電子郵件,可以設計這樣的提示:“對于每封電子郵件,識別發件人、收件人、日期、情感(積極、消極、中性)、主要主題(如產品問題、賬單問題)以及緊急程度(高、中、低)。將結果以結構化的 CSV 格式返回。” 大型語言模型的推理引擎會分析文本,利用其預訓練的知識推斷語義和關系,輸出清晰的、機器可讀的數據。

為了優化成本和性能,用戶可以使用 RunPod、vLLM 或 SGLang 等工具來托管自己的大型語言模型。在進行初始批量加載時,可以在 RunPod 上部署 vLLM,一次性處理數千份文檔,并使用連續批處理來最小化內存使用和成本。SGLang 的優化推理內核可以進一步加快令牌生成速度,確保即使是大型數據集也能高效地進行結構化處理。這樣的方法使得用戶可以在不依賴昂貴的云 API 的情況下擴展推理能力,非常適合生產環境。

一旦大型語言模型輸出了結構化數據,如 JSON 或 CSV 文件,用戶就有了進一步構建的基礎。每份文檔現在都有了相關的元數據(如 “標題”“日期”“主題”),可以通過分塊和向量化進行進一步的豐富,以實現高級搜索。

在 Elasticsearch 中存儲數據:為何它是正確的選擇

有了結構化數據后,下一步就是存儲和索引。Elasticsearch 作為一個分布式的、基于 RESTful 的搜索和分析引擎,基于 Apache Lucene 構建,非常適合處理這種情況。

Elasticsearch 具有先進的搜索功能。它原生支持基于關鍵詞的 Query DSL 搜索、用于向量搜索的 k 最近鄰(k-NN)算法,以及通過插件或自定義配置實現的混合搜索。這意味著用戶可以同時查詢結構化字段(如 “2023 年的文檔”)和向量空間(如 “與可持續性語義相似的內容”),這是其他系統無法如此無縫實現的。

此外,Elasticsearch 的相關性排名和優化功能也很強大。它使用像 TF-IDF 和 BM25 這樣的評分算法進行詞匯搜索,使用余弦相似度或 L2 距離進行向量搜索,確保結果按相關性進行排名。它還能夠通過互惠排名融合(RRF)等技術將這些方法結合起來,實現混合搜索,平衡精確性和上下文。

將自然語言查詢轉換為 DSL、混合和語義搜索

接下來,讓我們看看用戶如何與這個系統進行交互。目標是讓用戶能夠用自然語言提問,比如 “給我展示具有戰略經驗的可持續性專家” 或 “查找去年討論數據隱私的文檔”,并獲得精確、相關的結果。

用戶通過界面(如 Web 應用程序或 API)輸入查詢,該界面會將自然語言提示傳遞給大型語言模型進行處理。大型語言模型可以通過 Hugging Face、RunPod 或類似的設置進行托管,它會解釋查詢并將其轉換為搜索引擎能夠理解的格式。例如,對于 “給我展示具有戰略經驗的可持續性專家” 這個查詢,大型語言模型可能會將其分解為 “可持續性”(語義概念)、“專家”(角色或領域)和 “戰略經驗”(技能或上下文)等組件。

然后,系統會生成三種類型的查詢,它們協同工作:

  • 關鍵詞驅動的 DSL 查詢大型語言模型為 Elasticsearch 構建一個 DSL 查詢,針對結構化字段進行搜索。對于上述示例,它可能生成 {"bool": {"must": [{"match": {"topic": "sustainability"}}, {"match": {"role": "expert"}}, {"match": {"skills": "strategic experience"}}]}}。這樣可以確保在 “主題” 或 “技能” 等字段上進行精確匹配,為需要特定術語的用戶提供精確性。
  • 語義向量查詢同時,大型語言模型或專門的嵌入模型(如 Sentence-BERT)會將查詢轉換為向量,然后在 Elasticsearch 中用于 k-NN 搜索。對于 “可持續性與戰略經驗”,該向量可能會找到討論 “綠色能源戰略” 或 “可持續領導力” 的文檔,即使這些確切的短語沒有出現,也會根據余弦相似度進行排名。
  • 混合查詢真正的強大之處在于將這兩種查詢結合起來。Elasticsearch 的混合搜索功能允許用戶合并 DSL 和向量搜索的結果,并根據相關性對每個結果進行加權。例如,可以將 DSL 查詢的權重設置為 0.6(以提高精確性),將向量查詢的權重設置為 0.4(以提供上下文),然后使用 RRF 融合排名。這樣可以確保既獲得精確匹配(如明確標記為 “可持續性” 的文檔),又獲得相關概念(如 “環境戰略”),實現兩者的優勢互補。

這些查詢協同工作是因為它們各自利用了不同的優勢。DSL 對于結構化數據的搜索快速且精確,向量搜索對于非結構化數據的洞察靈活且具有上下文感知,而混合搜索則彌補了兩者之間的差距,在準確性和相關性方面進行了優化。大型語言模型就像是一個指揮家,確保自然語言查詢被智能地解析并轉換為正確的搜索組合,而 Elasticsearch 則快速、大規模地執行這些搜索。

整合所有環節以獲得最佳結果

這種方法的美妙之處在于它的協同效應。用戶通過提示大型語言模型來結構化數據、分塊并生成嵌入,這些嵌入隨后在 Elasticsearch 中進行索引,以便存儲和搜索。當查詢進來時,大型語言模型將其轉換為 DSL、向量和混合搜索的組合,Elasticsearch 實時執行這些搜索,并根據相關性對結果進行排名。例如,當用戶詢問 “查找 2023 年關于數據隱私的法律文件” 時,可能會通過 DSL 匹配到 “2023 年” 和 “數據隱私”,通過向量匹配到相關術語(如 “GDPR”),并通過混合排名優先顯示最具上下文相關性的文檔。

這并非只是理論,而是一個適用于生產的藍圖。通過在像 RunPod 這樣具有成本效益的平臺上使用 vLLM 或 SGLang 托管大型語言模型,使用精確的提示來結構化數據,并利用 Elasticsearch 無與倫比的搜索能力,用戶可以創建一個可擴展、安全且高效的系統。這不是關于快速修復或花哨的演示,而是關于構建在現實世界中真正有效的 AI,通過每次查詢將非結構化數據轉化為可操作的洞察。

責任編輯:武曉燕 來源: 大模型之路
相關推薦

2025-07-15 16:36:25

2025-06-05 01:22:00

2021-12-12 08:37:18

結構化數據非結構化數據數據

2024-05-27 00:32:45

2019-10-18 13:07:14

PB數據非結構化數據數據集

2018-04-03 14:00:03

結構化數據非結構化數據數據庫

2011-04-11 15:27:11

結構化布線

2009-10-15 17:32:53

結構化布線解決方案

2019-07-13 15:00:17

結構化SQLNOSQL數據庫

2018-10-08 13:31:56

華為AI人工智能

2020-11-20 19:07:27

PB級數據銀行

2017-11-16 05:22:34

非結構化數據分析數據

2020-09-07 11:42:40

Hitachi Van

2014-02-09 09:53:05

2011-05-25 15:16:55

非結構化數據庫異構數據庫

2024-05-10 12:52:01

2009-02-16 15:41:04

非結構化數據SQL Server SQL Server

2018-05-14 12:30:49

數據備份非結構
點贊
收藏

51CTO技術棧公眾號

欧美日韩成人一区| 久久一日本道色综合| 久久最新资源网| 波多野结衣三级视频| f2c人成在线观看免费视频| 91视频免费观看| 国产精品一区二区三区免费视频 | 亚洲国产天堂久久综合| 成年人免费在线播放| 免费观看久久久久| 99国产欧美另类久久久精品| 国产精品最新在线观看| 久久午夜无码鲁丝片午夜精品| 一本久久青青| 日韩一本二本av| 免费午夜视频在线观看| 亚洲综合影视| 日本一区二区三区免费乱视频| 亚洲精品欧美极品| 91精品一区二区三区四区| 一区二区黄色片| 欧美精品三级在线| 日本高清无吗v一区| 国产又粗又长又爽视频| 你懂的免费在线观看视频网站| 久久精品国产**网站演员| 久久久久久久999| 欧美精品hd| 91成人免费| 精品亚洲一区二区| 日韩久久久久久久久久久| 日日夜夜天天综合| 性做久久久久久免费观看欧美| 亚洲欧洲日韩综合二区| 免费福利在线视频| 99精品视频一区二区三区| 91精品久久久久久久久久另类| 日韩综合在线观看| 韩日精品视频| 欧美成人免费在线观看| 特级西西人体高清大胆| 国产精品一区二区av日韩在线| 精品国产一区二区在线观看| aaa一级黄色片| 成人黄色在线| 欧美在线观看18| 国产精彩免费视频| 偷拍精品精品一区二区三区| 五月婷婷另类国产| aa视频在线播放| 免费不卡av| 一区二区三区欧美日| 亚洲午夜精品一区二区三区| 国产尤物视频在线| 国产午夜精品久久久久久久 | 真实的国产乱xxxx在线91| 国产视频亚洲| 欧美在线www| 国产精品久久久久久人| 亚洲尤物精选| 国产成人一区二区| 免费一级a毛片| 奇米在线7777在线精品| 国产欧美日韩中文字幕| 一区二区www| 国产精品自产自拍| 国产成人精品免费视频大全最热 | 精品一区二区亚洲| www.久久av| 蜜桃精品噜噜噜成人av| 一区二区三区美女xx视频| 欧美黄色高清视频| 性欧美欧美巨大69| 欧美黑人xxxⅹ高潮交| 国产在线拍揄自揄拍无码视频| 亚洲国产日本| 日韩免费在线视频| 亚洲综合网av| 国产不卡免费视频| 精品乱码一区二区三区| 国产综合在线观看| 亚洲特级片在线| 成人av在线不卡| 天天综合av| 欧美三级乱人伦电影| 麻豆传媒在线看| 欧美人妖在线观看| 在线播放亚洲激情| 欧美黄色免费在线观看| 99视频精品免费观看| 日本午夜精品理论片a级appf发布| 国产真人无遮挡作爱免费视频| 久久电影国产免费久久电影| 亚洲在线免费看| 午夜性色福利影院| 国产精品天天摸av网| 妺妺窝人体色www看人体| 无码小电影在线观看网站免费| 欧美日韩亚洲综合在线 欧美亚洲特黄一级| 久久久久亚洲av无码麻豆| 九九综合在线| 欧美日韩999| 国产一级片免费视频| 国产精品乡下勾搭老头1| 久久久久久久久一区二区| 免费在线你懂的| 狠狠综合久久av一区二区小说| 亚洲精品手机在线观看| 麻豆国产欧美一区二区三区r| 中国china体内裑精亚洲片| 久久久久亚洲av无码专区 | 国产99视频在线| 久久老女人爱爱| 亚洲精品少妇一区二区| 色老太综合网| 精品国产乱子伦一区| 黄色免费一级视频| 国产精品视频久久一区| 91热精品视频| av午夜在线| 欧美日韩国产中文精品字幕自在自线| 色91精品久久久久久久久| 美日韩黄色大片| 久久6精品影院| 伊人成人在线观看| 国产日韩精品一区| 女人和拘做爰正片视频| 亚洲国产高清在线观看| 中文字幕亚洲情99在线| 无码人妻精品一区二| 成人av网站免费观看| 日本xxxxx18| 日本国产亚洲| 中文字幕久精品免费视频| 欧美性猛交bbbbb精品| 成人午夜av影视| 五月天激情图片| 国产精品美女久久久久| 色777狠狠综合秋免鲁丝| 无码免费一区二区三区| 久久综合九色综合欧美98| 男人添女人下面高潮视频| jizz国产精品| 欧美精品www| 午夜久久久久久噜噜噜噜| 亚洲精品水蜜桃| 国产一级片中文字幕| 亚洲国产精品综合久久久| 国产色婷婷国产综合在线理论片a| 成人精品一区二区三区免费 | 欧美尺度大的性做爰视频| 一区二区日韩在线观看| 中文在线资源观看网站视频免费不卡| 日韩免费高清在线| 欧美中文字幕一区二区| 国产精品十八以下禁看| 97电影在线观看| 欧美日韩免费视频| 中国一级片在线观看| 国产一区二区在线免费观看| 亚洲 欧洲 日韩| 欧美久久一区二区三区| 欧美人在线观看| 午夜黄色小视频| 色av一区二区| 蜜桃av免费观看| 狠狠色狠狠色综合| 福利在线一区二区| 欧美18xxxx| 国产精品99久久久久久www| 草草影院在线观看| 欧美精品18+| 中国毛片直接看| 成人免费的视频| 国产最新免费视频| 成人精品影视| 亚洲影院污污.| www.九色在线| 自拍偷拍亚洲欧美| 亚洲国产剧情在线观看| 精品福利一区二区| 免费一级做a爰片久久毛片潮| 蜜桃av一区二区在线观看| 天天成人综合网| 菁菁伊人国产精品| 国产精品6699| 成人看av片| 亚洲精品狠狠操| 一区二区久久精品66国产精品| 亚洲综合精品久久| 欧美人与性囗牲恔配| 国产美女精品在线| 116极品美女午夜一级| 色喇叭免费久久综合网| 国产精品免费一区二区三区| 91精品影视| 欧美日韩aaaa| 亚欧无线一线二线三线区别| 五月激情丁香网| 亚洲人精品午夜| 西西大胆午夜视频| 国产主播一区二区| 久久网站免费视频| 久久久久久免费视频| 免费成人深夜夜行视频| 精品精品视频| 国产成一区二区| √最新版天堂资源网在线| 这里只有精品视频| 人成免费电影一二三区在线观看| 欧美日韩国产成人在线91| 永久免费看片在线播放| 自拍偷拍亚洲综合| 蜜桃精品成人影片| 国产suv精品一区二区三区| 久久婷婷综合色| 国产日韩欧美一区在线| 糖心vlog在线免费观看| 欧美一区二区三| 欧美婷婷久久| 美女视频亚洲色图| 97超级碰碰| 亚洲黑人在线| 国产精品稀缺呦系列在线| 亚洲天堂手机| 久久久久久网站| av网站免费在线观看| 色婷婷综合成人| 国产视频福利在线| 国产午夜精品久久久| 欧美视频一二区| 日韩一区二区精品葵司在线| 在线播放精品视频| 日韩欧美精品网址| 日韩视频免费观看高清| 亚洲自拍另类综合| 超碰在线国产97| 日韩码欧中文字| 日本成人精品视频| 国产精品视频一二三| www.黄色在线| 国产日韩精品一区| 日本精品在线观看视频| 国产日韩在线不卡| 丰腴饱满的极品熟妇| 久久久久久久久久久久久久久99| 国产精品久久AV无码| 成人激情午夜影院| 日本一区二区免费视频| 福利视频网站一区二区三区| 中文字幕在线视频一区二区| 国产一区二区成人久久免费影院 | 51av在线| 久久人91精品久久久久久不卡| 深夜国产在线播放| 欧美极品少妇xxxxⅹ免费视频| 在线电影福利片| 欧美激情在线视频二区| 搞黄网站在线看| 91精品国产乱码久久久久久久久| 九色porny自拍视频在线观看 | 精品夜色国产国偷在线| 日韩一区二区三区中文字幕| 亚洲精品资源美女情侣酒店| 日韩大片b站免费观看直播| 亚洲欧美日韩在线一区| 成人综合影院| 久久激情视频久久| 国产盗摄在线视频网站| 668精品在线视频| 亚洲a∨精品一区二区三区导航| 国产精品视频久久久久| 国内精品视频| 国偷自产av一区二区三区小尤奈| 亚洲人成伊人成综合图片| 亚洲第一导航| 欧美日韩视频一区二区三区| 精品久久一二三| 日本不卡视频在线| 永久看看免费大片| 亚洲网址在线观看| 欧美一二三区精品| 少妇av在线播放| 一个人看的www久久| 黄色网址在线免费播放| 久久男人的天堂| 亚洲成人看片| 亚洲一区二区三区乱码aⅴ| 免费日韩一区二区三区| 无遮挡亚洲一区| 欧美日韩亚洲一区| 噼里啪啦国语在线观看免费版高清版| 你懂的国产视频| 亚洲精品自拍动漫在线| 日韩精品视频免费播放| 在线亚洲一区二区| 精品区在线观看| 亚洲欧美激情视频| av大大超碰在线| 日本视频久久久| 51vv免费精品视频一区二区| 蜜桃av久久久亚洲精品| 一区二区在线影院| 日韩欧美xxxx| 岛国精品一区二区| 蜜桃av免费观看| 欧美体内谢she精2性欧美| 国产精品久久婷婷| 亚洲精品天天看| 毛片网站在线看| 国产精品永久免费观看| 六月丁香久久丫| 300部国产真实乱| 全国精品久久少妇| 亚洲一区二区在线免费| 日韩码欧中文字| 欧美男人天堂网| 亚洲成色999久久网站| 美女av在线播放| 国产成人免费av| 免费观看成人www动漫视频| 97超碰免费观看| 蜜臀99久久精品久久久久久软件| 成年人的黄色片| 一区二区三区资源| 97视频免费在线| 综合网中文字幕| 欧美成人h版| 激情视频一区二区| 韩日成人在线| 欧美一区二区三区影院| 国产精品久久久久影院| 无码人妻久久一区二区三区| 亚洲精品美女久久久| 欧美xxxx黑人又粗又长| 亚洲aⅴ日韩av电影在线观看| 欧美色就是色| 午夜激情在线观看视频| 久久久久久麻豆| 黄色一级片免费在线观看| 亚洲国产精品99久久| 日本中文字幕中出在线| 91在线观看欧美日韩| 在线看片不卡| 久久精品国产露脸对白| 激情欧美一区二区| 无码黑人精品一区二区| 欧美一区二区三区视频在线 | 成人在线视频国产| 一本久久a久久精品vr综合 | 国产精品久久久久av| 欧美精美视频| 欧美牲交a欧美牲交aⅴ免费真| 91丨九色丨蝌蚪富婆spa| av黄色在线看| 亚洲欧美在线免费| 色成人免费网站| 图片区小说区区亚洲五月| 日本成人在线一区| 日本激情视频一区二区三区| 欧美群妇大交群中文字幕| 欧美jizzhd69巨大| 91久久极品少妇xxxxⅹ软件 | 国产日产欧美一区二区三区 | 日日嗨av一区二区三区四区| 免费一级做a爰片久久毛片潮| 欧洲精品一区二区三区在线观看| 中文字幕在线免费| 91在线视频导航| 亚洲手机视频| 双性尿奴穿贞c带憋尿| 欧美综合亚洲图片综合区| 毛片网站在线免费观看| av一区二区三区免费| 丰满人妻妇伦又伦精品国产| 亚洲欧美激情插 | 日韩欧美一级片| 丁香花在线电影| 免费成人av网站| 九九国产精品视频| 国产中文字幕免费| 亚洲人在线观看| av在线精品| 9久久9毛片又大又硬又粗| 国产精品丝袜一区| 性欧美videos另类hd| 国产91精品久久久久久| 99成人在线视频| 国产婷婷在线观看| 欧美亚洲国产一卡| 污污视频在线| 免费看成人午夜电影| 狠狠狠色丁香婷婷综合激情| 久久伊人成人网| 国产亚洲欧美日韩美女| 日韩一二三区| 成人3d动漫一区二区三区| 亚洲欧美国产77777| 完全免费av在线播放| 日韩国产一区|