精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

LLM超長上下文查詢-性能評估實戰(zhàn)

發(fā)布于 2024-6-14 11:49
瀏覽
0收藏

在大型語言模型(LLM)的應(yīng)用中,有幾個場景需要以結(jié)構(gòu)化的方式呈現(xiàn)數(shù)據(jù),其中信息提取和查詢分析是兩個典型的例子。我們最近通過更新的文檔和一個專門的代碼倉庫強調(diào)了信息提取的重要性。對于查詢分析,我們同樣更新了相關(guān)文檔。在這些場景中,數(shù)據(jù)字段可能包括字符串、布爾值、整數(shù)等多種類型。而在這些類型中,處理高基數(shù)的分類值(即枚舉類型)是最具挑戰(zhàn)性的。

LLM超長上下文查詢-性能評估實戰(zhàn)-AI.x社區(qū)

所謂的“高基數(shù)分類值”,指的是那些必須從有限的選項中選擇的值,這些值不能隨意指定,而必須來自一個預定義的集合。當這個集合中的有效值數(shù)量非常龐大時,我們稱之為“高基數(shù)”。處理這類值之所以困難,是因為LLM本身并不知道這些可能的值是什么。因此,我們需要向LLM提供關(guān)于這些可能值的信息。如果忽略了這一點,LLM可能會自行編造值。對于只有少數(shù)幾個可能值的情況,我們可以通過在提示中明確列出這些值來解決。但是,當可能的值非常多時,問題就變得復雜了。

隨著可能值數(shù)量的增加,LLM正確選擇值的難度也隨之增加。一方面,如果可能的值太多,它們可能無法適應(yīng)LLM的上下文窗口。另一方面,即使所有可能的值都能適應(yīng)上下文,將它們?nèi)堪趦?nèi)會導致處理速度變慢、成本增加,以及LLM在處理大量上下文時的推理能力下降。

我們最近對查詢分析進行了深入研究,并在修訂相關(guān)文檔時特別增加了一個關(guān)于如何處理高基數(shù)分類值的頁面。在這篇博客中,我們將深入探討幾種實驗性方法,并提供它們的性能基準測試結(jié)果。

結(jié)果的概覽可以在LangSmithhttps://smith.langchain.com/public/8c0a4c25-426d-4582-96fc-d7def170be76/d?ref=blog.langchain.dev中查看。接下來,我們將詳細介紹:

LLM超長上下文查詢-性能評估實戰(zhàn)-AI.x社區(qū)

數(shù)據(jù)集概覽

詳細的數(shù)據(jù)集可以在這里查看https://smith.langchain.com/public/8c0a4c25-426d-4582-96fc-d7def170be76/d?ref=blog.langchain.dev。

為了模擬這一問題,我們假設(shè)了一個場景:我們要查找某位作者關(guān)于外星人的書籍。在這個場景中,作者字段是一個高基數(shù)分類變量——可能的值有很多,但它們應(yīng)該是特定的有效作者名字。為了測試這一點,我們創(chuàng)建了一個包含作者姓名和常用別名的數(shù)據(jù)集。例如,“Harry Chase”可能是“Harrison Chase”的別名。我們希望智能系統(tǒng)能夠處理這類別名。有了這個姓名和別名列表后,我們又生成了10,000個隨機姓名。需要注意的是,10,000的基數(shù)并不算高——對于企業(yè)級系統(tǒng)來說,可能要面對的是數(shù)百萬級別的基數(shù)。

利用這個數(shù)據(jù)集,我們提出了這樣的問題:“Harry Chase關(guān)于外星人的書有哪些?”我們的查詢分析系統(tǒng)應(yīng)該能夠?qū)⑦@個問題解析為結(jié)構(gòu)化格式,包含兩個字段:主題和作者。在這個例子中,預期的輸出應(yīng)該是{“topic”: “aliens”,“author”: “Harrison Chase”}。我們期望系統(tǒng)能夠識別出沒有名為Harry Chase的作者,但Harrison Chase可能是用戶想要表達的意思。

通過這種設(shè)置,我們可以針對我們創(chuàng)建的別名數(shù)據(jù)集進行測試,檢查它們是否能夠正確映射到真實姓名。同時,我們還會記錄查詢的延遲和成本。這種查詢分析系統(tǒng)通常用于搜索,因此我們非常關(guān)心這兩個指標。出于這個原因,我們也限制了所有方法只能進行一次LLM調(diào)用。我們可能會在未來的文章中對使用多次LLM調(diào)用的方法進行基準測試。

接下來,我們將介紹幾種不同的方法及其性能表現(xiàn)。

LLM超長上下文查詢-性能評估實戰(zhàn)-AI.x社區(qū)

完整的結(jié)果可以在LangSmith中查看,復現(xiàn)這些結(jié)果的代碼可以在這里找到。

基線測試

首先,我們對LLM進行了基線測試,即在不提供任何有效姓名信息的情況下,直接要求LLM進行查詢分析。結(jié)果不出所料,沒有一個問題得到了正確回答。這是因為我們故意構(gòu)建了一個需要通過別名查詢作者的數(shù)據(jù)集。

上下文填充法

在這種方法中,我們將所有10,000個合法的作者姓名都放入了提示中,并要求LLM在進行查詢分析時記住這些是合法的作者姓名。一些模型(如GPT-3.5)由于上下文窗口的限制,根本無法執(zhí)行這個任務(wù)。對于其他具有更長上下文窗口的模型,它們在準確選擇正確姓名方面也遇到了困難。GPT-4只在26%的案例中選擇了正確的姓名。它最常見的錯誤是提取了姓名但沒有進行校正。這種方法不僅速度慢,成本也高,平均需要5秒鐘才能完成,總成本為8.44美元。

LLM前過濾法

我們接下來測試的方法是在將可能的值列表傳遞給LLM之前進行過濾。這樣做的好處是只傳遞可能姓名的子集給LLM,這樣LLM需要考慮的姓名就少得多,希望能夠讓它更快、更便宜、更準確地完成查詢分析。但這也增加了一個新的潛在失敗模式——如果初步過濾出錯怎么辦?

基于嵌入的過濾法

我們最初使用的過濾方法是嵌入法,并選擇了與查詢最相似的10個姓名。需要注意的是,我們是將整個查詢與姓名進行比較,這并不是一個理想的比較方式!

我們發(fā)現(xiàn),使用這種方法,GPT-3.5能夠正確處理57%的案例。這種方法比以前的方法快得多,也便宜得多,平均只需要0.76秒就能完成,總成本僅為0.002美元。

基于NGram相似性的過濾法

我們使用的第二種過濾方法是對所有有效姓名的3-gram字符序列進行TF-IDF向量化,并使用向量化的有效姓名與向量化的用戶輸入之間的余弦相似度來選擇最相關(guān)的10個有效姓名添加到模型提示中。同樣需要注意的是,我們是將整個查詢與姓名進行比較,這并不是一個理想的比較方式!

我們發(fā)現(xiàn),使用這種方法,GPT-3.5能夠正確處理65%的案例。這種方法同樣比以前的方法快得多,也便宜得多,平均只需要0.57秒就能完成,總成本僅為0.002美元。

LLM后選擇法

我們最后測試的方法是在LLM完成初步查詢分析后,嘗試糾正任何錯誤。我們首先對用戶輸入進行了查詢分析,沒有在提示中提供任何關(guān)于有效作者姓名的信息。這與我們最初進行的基線測試相同。然后,我們進行了一個后續(xù)步驟,取作者字段中的姓名,找到最相似的有效姓名。

基于嵌入相似性的選擇法

首先,我們使用嵌入法進行了相似性檢查。

我們發(fā)現(xiàn),使用這種方法,GPT-3.5能夠正確處理83%的案例。這種方法比以前的方法快得多,也便宜得多,平均只需要0.66秒就能完成,總成本僅為0.001美元。

基于NGram相似性的選擇法

最后,我們嘗試使用3-gram向量化器進行相似性檢查。

我們發(fā)現(xiàn),使用這種方法,GPT-3.5能夠正確處理74%的案例。這種方法同樣比以前的方法快得多,也便宜得多,平均只需要0.48秒就能完成,總成本僅為0.001美元。

結(jié)論

我們對處理高基數(shù)分類值的查詢分析方法進行了多種基準測試。我們限制了自己只能進行一次LLM調(diào)用,這是為了模擬現(xiàn)實世界中的延遲限制。我們發(fā)現(xiàn),使用LLM后基于嵌入相似性的選擇方法表現(xiàn)最佳。

還有其他方法值得進一步測試。特別是,在LLM調(diào)用之前或之后尋找最相似的分類值有許多不同的方法。此外,本數(shù)據(jù)集中的類別基數(shù)并不像許多企業(yè)系統(tǒng)所面臨的那樣高。這個數(shù)據(jù)集大約有10,000個值,而許多現(xiàn)實世界中的系統(tǒng)可能需要處理的是數(shù)百萬級別的基數(shù)。因此,對更高基數(shù)的數(shù)據(jù)進行基準測試將是非常有價值的。

本文轉(zhuǎn)載自 ??AI小智??,作者: AI小智

收藏
回復
舉報
回復
相關(guān)推薦
亚洲另类春色国产| 国内精品免费在线观看| 亚洲午夜未满十八勿入免费观看全集| 熟妇人妻va精品中文字幕| 成a人v在线播放| 国产一区二区三区av电影| 久久久人成影片一区二区三区观看| 亚洲av成人无码一二三在线观看| 五月激情久久| 亚洲国产欧美在线| 亚洲国产婷婷香蕉久久久久久99| 午夜精品久久久久久久99| 亚洲少妇诱惑| 成人欧美一区二区三区| 成人永久免费| 夜夜爽8888| 亚洲一区图片| 久久婷婷国产麻豆91天堂| 最新在线黄色网址| 国产精品日韩精品在线播放| 欧美视频免费在线观看| 蜜臀在线免费观看| 国产一二三在线观看| 国产成a人亚洲精品| 国产精品国语对白| 日本在线视频免费| 91精品91| 这里只有视频精品| asian性开放少妇pics| 狂野欧美xxxx韩国少妇| 在线亚洲精品福利网址导航| 日韩网站在线免费观看| 国产写真视频在线观看| 国产精品污污网站在线观看| 精品国产免费人成电影在线观...| 一级特黄特色的免费大片视频| 国产一区二区三区久久| 久久久久久香蕉网| 欧美黑人一级片| 国产精品不卡| 中文字幕视频在线免费欧美日韩综合在线看| 国产二级一片内射视频播放 | 亚洲永久精品大片| 在线观看一区欧美| 日本免费在线观看| 国产精品久久久久久妇女6080 | 91免费看国产| 91亚洲国产成人久久精品麻豆| 国产精品美女久久久| 国内精品久久久久影院优| 欧美风情第一页| 日韩精品水蜜桃| 色一情一乱一区二区| 永久免费av无码网站性色av| 精品国产一区二区三区| 亚洲欧洲日本专区| 日韩一级av毛片| 精品国产一区探花在线观看| 国产一区二区三区在线免费观看 | 97成人精品视频在线观看| 妺妺窝人体色www在线下载| 欧美久久影院| 国内精品久久久久伊人av| 日韩av一二三区| 母乳一区在线观看| 国产精品成人久久久久| 一二三四区在线| 国产一区二区三区视频在线播放| 亚洲va欧美va国产综合久久| 国产青青草视频| 高清在线成人网| 精品国产乱码久久久久| 黄色国产在线| 国产精品二三区| 日韩精品一区二区三区电影| www.youjizz.com在线| 欧美日韩国产一区二区| 国产精品无码一本二本三本色| 欧美成人片在线| 国产日韩欧美麻豆| 一区二区在线观| 成人性生交大片免费看网站 | 日韩小视频在线播放| 偷拍自拍在线看| 欧美日韩极品在线观看一区| 僵尸世界大战2 在线播放| 国产乱码午夜在线视频| 欧美性大战久久久久久久蜜臀| 中文字幕日韩综合| 国产精品一线| 一区二区三区国产在线观看| 私库av在线播放| 久久精品二区三区| 亚洲伊人第一页| 日本大臀精品| 自拍偷自拍亚洲精品播放| 黄色www网站| 欧美aaaaaa| 精品无人区乱码1区2区3区在线| 欧美老女人性生活视频| 狠狠色狠狠色综合日日tαg| 国产成人小视频在线观看| 国产精品亚洲lv粉色| 不卡的看片网站| 中文字幕在线亚洲精品| 牛牛精品一区二区| 日韩午夜在线影院| 日韩女同一区二区三区| 狠狠88综合久久久久综合网| 国产精品久久久久久一区二区| 丰满人妻一区二区三区免费| 欧美国产一区二区| 97成人在线免费视频| gogo大尺度成人免费视频| 国产婷婷成人久久av免费高清| 九九精品视频免费| 日本不卡的三区四区五区| 激情小说网站亚洲综合网| 欧美jizzhd欧美| 色香蕉久久蜜桃| 日本在线观看a| 国产美女精品视频免费播放软件| 亚洲人成电影网站| 日本熟妇乱子伦xxxx| 国产一区二区伦理片| 亚洲国产精品综合| 中文在线免费视频| 亚洲成人久久一区| 久操免费在线视频| 国产成人日日夜夜| 国产精品国产三级欧美二区| 欧美日韩视频在线播放| 日本丰满少妇一区二区三区| 小毛片在线观看| 欧美精品午夜| 97影院在线午夜| 成人免费在线| 这里只有精品免费| а天堂中文在线资源| 日韩成人av影视| 欧美下载看逼逼| 成人看片网站| 一本色道久久88亚洲综合88| 久久精品无码av| 国产欧美一二三区| www日韩在线观看| 欧美日韩国产在线观看网站| 国产精品91久久久| 成年人在线免费观看| 91福利精品视频| 国产农村妇女精品一区| 免费在线观看视频一区| 91老司机精品视频| 欧美精品videos另类| 精品1区2区3区| 综合 欧美 亚洲日本| 久久精品二区亚洲w码| 一区二区三区日韩视频| 日韩精品一区二区三区中文| 久久精品久久久久电影| 国产精品怡红院| 一区二区三区中文字幕电影 | 国产精品人人人人| 久久婷婷成人综合色| 熟妇人妻va精品中文字幕| 欧美日韩在线播放视频| 成人激情av在线| 青草青在线视频| 国产视频精品久久久| 亚洲黄网在线观看| 国产精品久久久久影院老司| xxxx在线免费观看| 精品成人一区| 欧美日韩国产三区| 国产精品.xx视频.xxtv| 超碰91人人草人人干| 五月婷婷免费视频| 欧美日韩大陆在线| 欧美精品色哟哟| 久久免费电影网| 国产嫩草在线观看| 亚洲人成免费网站| 精品麻豆av| 国产精品永久免费观看| 国产精品久久久久久亚洲调教| 精品国产亚洲av麻豆| 亚洲成精国产精品女| 极品白嫩丰满美女无套| 六月丁香婷婷久久| 97超碰在线人人| 日韩av片子| 69174成人网| 色婷婷综合久久久中字幕精品久久| www.xxxx欧美| 午夜成人鲁丝片午夜精品| 欧美亚洲一区三区| 国产真人真事毛片| 国产精品理伦片| 97人妻精品一区二区三区免费| 首页综合国产亚洲丝袜| 亚洲欧洲国产日韩精品| 风间由美一区二区av101 | 欧美人与性禽动交精品| 青青在线精品| 91av国产在线| 超碰caoporn久久| 亚洲午夜精品久久久久久久久久久久| 国产精品一区二区三区在线免费观看| 欧美日韩精品在线播放| 人妻人人澡人人添人人爽| 国产色一区二区| 国产十八熟妇av成人一区| 久久精品国产亚洲高清剧情介绍| 亚洲国产精品成人天堂| 亚洲国产一区二区在线观看| 欧美最大成人综合网| 精品自拍偷拍| 川上优av一区二区线观看| 韩日成人影院| 97在线看福利| 国产网红在线观看| 久久av资源网站| 在线观看免费黄视频| 日韩电影中文字幕| 狠狠躁夜夜躁av无码中文幕| 欧美精品tushy高清| 中文字幕av第一页| 欧美日韩另类在线| 国产亚洲欧美精品久久久www| 国产精品久久久久久久久动漫 | 偷拍一区二区三区四区| 欧美精品久久久久性色| 综合分类小说区另类春色亚洲小说欧美| 88久久精品无码一区二区毛片| www.一区二区| 亚洲av永久无码精品| 国产美女娇喘av呻吟久久| 久久久久国产一区| 青青草国产成人av片免费| 日韩在线xxx| 欧美在线综合| 国产精品第12页| 亚洲一级在线| 欧美a在线视频| 亚洲永久字幕| 免费在线激情视频| 亚洲自啪免费| 日本精品一区二区三区四区| 亚洲一区国产| 欧美精品一区免费| 亚洲一区二区三区免费在线观看| av之家在线观看| 在线亚洲成人| 国产一区二区视频免费在线观看| 国产一区白浆| jizz欧美激情18| 日本不卡高清视频| 潘金莲激情呻吟欲求不满视频| 麻豆成人av在线| 亚洲黄色av片| 国产成人午夜电影网| 无码人妻一区二区三区在线| 豆国产96在线|亚洲| 奇米777第四色| 久久久久久久久久久久久夜| 亚洲码无人客一区二区三区| 国产日韩欧美在线一区| 性色国产成人久久久精品| 亚洲婷婷综合色高清在线| 综合五月激情网| 亚洲国产中文字幕| 天天插天天操天天干| 国产成人精品免费一区二区| 午夜诱惑痒痒网| 懂色av一区二区三区免费观看 | 欧美亚洲色图校园春色| 欧美一区二区高清在线观看| 99久久精品费精品国产| 亚洲激情免费视频| 一本色道久久综合| 污片在线免费看| 岛国精品在线播放| 亚洲第一香蕉网| 亚洲欧洲精品天堂一级| 亚洲国产综合久久| 欧美午夜精品久久久久久超碰| 国产精品无码天天爽视频| 亚洲国产精品电影| av电影在线观看| 欧美激情在线观看视频| 亚洲成av在线| 国产精品手机在线| 成人一二三区| 日本丰满少妇xxxx| 久久国内精品自在自线400部| 日本性生活一级片| 国产精品三级av在线播放| 玖玖爱免费视频| 日本国产一区二区| 国内爆初菊对白视频| 视频直播国产精品| 高清视频在线观看三级| 成人a免费视频| 色88888久久久久久影院| 福利网在线观看| 乱码第一页成人| 久草福利在线观看| 国产精品视频免费看| 天堂网一区二区三区| 在线不卡中文字幕| 国产美女性感在线观看懂色av| 久久成人一区二区| 免费污视频在线一区| 国产精品免费区二区三区观看| 俺要去色综合狠狠| 一女被多男玩喷潮视频| 国产馆精品极品| 东京热无码av男人的天堂| 精品日韩中文字幕| www.激情五月.com| 日韩网站免费观看| 日本在线中文字幕一区二区三区| 激情伦成人综合小说| 欧美99久久| 女同激情久久av久久| 国产欧美日韩另类一区| 国产精品久久久久久99| 日韩欧美一级二级| 97caopor国产在线视频| 国产免费一区二区三区在线观看| 国产一区二区三区网| 久久视频这里有精品| 丁香激情综合国产| 欧美卡一卡二卡三| 欧美一级欧美三级| av文字幕在线观看| 成人写真视频福利网| 色88久久久久高潮综合影院| 日本wwww视频| 91丨国产丨九色丨pron| 久久亚洲精品国产| 日韩电影网在线| 69久成人做爰电影| 欧美日韩精品不卡| 久久中文在线| 我不卡一区二区| 欧美偷拍一区二区| 91在线高清| 亚洲一区亚洲二区| 欧美特黄一区| caopor在线| 精品久久久一区| 日产精品久久久久久久性色| 日av在线播放中文不卡| 欧美精品尤物在线观看| 国产免费又粗又猛又爽| 国产精品伦理在线| 国产ts变态重口人妖hd| 欧美丰满老妇厨房牲生活| 操欧美女人视频| 春日野结衣av| 日本一区二区三级电影在线观看 | 亚洲国产精品高清久久久| sm在线播放| 日韩一区免费观看| 久久99精品一区二区三区三区| www青青草原| 日韩激情片免费| 97久久网站| 九九久久九九久久| av中文字幕在线不卡| 无码人妻aⅴ一区二区三区有奶水| 中文字幕在线国产精品| 久久伊人影院| aa在线观看视频| 国产精品三级av| 免费国产精品视频| 热re91久久精品国99热蜜臀| 欧美hd在线| 日本一区二区在线观看视频| 日韩欧美亚洲综合| а√中文在线8| 免费一区二区三区| 久久成人羞羞网站| 在线观看免费国产视频| xvideos亚洲人网站| 国产精品22p| 香蕉视频禁止18| 亚洲综合激情网| 国家队第一季免费高清在线观看| 亚洲free嫩bbb| 香蕉久久夜色精品国产| 午夜激情视频在线播放| 亚洲国产精品中文| 亚洲狼人在线| 国产一区亚洲二区三区| 一区二区三区高清| 成年人视频在线看| 狠狠色综合色区| 国内国产精品久久|