精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

LLooM:大語言模型時代文本聚類新思路

發布于 2024-7-10 09:41
瀏覽
0收藏

緣起

非結構化文本中蘊藏了海量的數據和知識,但是想要解讀這些知識卻并非易事。前大語言模型時代,LDA、BertTopic等算法,是非結構化文本挖掘的利器。但是這些模型生成的主題都是基于關鍵詞等基礎文本信號的,產生的關鍵詞、話題往往比較初級和寬泛,比如:早餐、打鼾等。這些低層次的文本分析,往往無法準確反映真實人類關心的話題。

為了解決傳統分析方法的局限性,提出了一種基于大語言模型的新方法 LLooM,來從非結構化文本中提取更加高層次的概念。

LLooM方法利用了大語言模型,通過Few Shot進行泛化學習。通過抽樣提取的文本,不斷地迭代出更加抽象高級的概念。LLooM的核心能力——綜合、分類和抽象——使其能夠迭代地生成概念,將它們應用于數據,并提煉出更高層次的概念。

LLooM算法被集成到LLooM工作臺(https://github.com/michelle123lam/lloom)的混合主動性文本分析工具中,它通過自動以可解釋的高級概念呈現數據集,增強了分析師的工作。LLooM工作臺還為分析師提供了一個可追溯和可塑的工作流程。每個提取的概念不僅是一個標簽,還可以展開為一個可審計的下級子概念的路徑。分析師可以使用LLooM工作臺引導算法,使其關注特定的概念,從而更精準地進行數據分析。

什么是LLooM方法

LLooM:大語言模型時代文本聚類新思路-AI.x社區圖片

上圖展示了LLooM概念歸納算法的整個工作流程:

? 1)非結構化的文本數據

? 2)LLooM借助大型語言模型輔助生成

? 3)第2步生成的高級概念,這些概念由自然語言描述和以零樣本LLM提示形式的明確標準構成

? 4) LLooM根據概念標準的提示進行(4)概念評分

? 5)LLooM工作臺——一個混合主動性的文本分析工具——以概念維度對數據進行可視化展示。

LLooM算法通過運用大型語言模型(LLM)進行迭代的概念生成和評分輪次,執行概念歸納。在實際使用中,LLooM算法采用了GPT-3.5和GPT-4。

LLooM:大語言模型時代文本聚類新思路-AI.x社區圖片

LLooM算法通過調用大語言模型(實際使用的是GPT3.5和GPT4)不斷循環迭代的“概念生成”與“概念評分”步驟進行概念歸納。如上圖所示,算法的核心目標在于執行一個關鍵的“合成(Synthesize)”步驟,將低層次的文本信號合成為高層次的概念。

在概念“合成”階段,通過使用LLM從提供的示例中進行泛化,生成自然語言的概念描述和標準。直接調用GPT4的話,往往會產生比較寬泛、通用的概念,這些概念雖然有助于對數據進行宏觀總計金額,但是實際分析時,往往需要更加具體、豐富的概念。另外一個問題是對于超出LLm上下文窗口的大型文本數據集,直接調用GPT4也是不太合理的。

為了解決上述問題,LLooM算法引入了兩個操作以提升數據規模和概念質量:

? (1) Distill(蒸餾),它將數據細化并適配至上下文窗口,同時保留關鍵信息;

? (2) Cluster(聚類),它將這些數據碎片重新組合成具有足夠共性的分組,以便從LLM中提煉出深層而非表面的概念。

在概念評分階段,利用LLM的零樣本推理能力,根據提示詞中的概念標準來給數據進行評分。

概念合成 Synthesize

概念合成是指從一組文本中,利用LLM提取出一個或多個高級概念。大型語言模型(LLM)具備的能力非常適合輔助此類任務。例如,GPT-3.5 Turbo和GPT-4能夠從少量實例中進行有效泛化,即識別出共通的概念,并將其應用于新實例。這種能力,也稱為Few Shot Learning,常在用戶已知底層規律并希望模型重復應用時使用(例如,將文本轉換為不同格式,或轉換寫作風格)。然而,當用戶尚不了解數據中存在哪些概念以輔助發現時,我們同樣可以利用這種能力。

盡管LLM可能產生幻覺并輸出不可靠的結果,但通過設計任務時,讓模型不僅生成概念,同時生成評估這些概念的標準,這樣就可以通過審查這些標準并重新評估原始數據來驗證LLM的輸出,檢驗概念是否有效。

基于這一洞察,LLooM實現了一個零樣本提示的概念合成操作,它指導一個LLM(如gpt-4)從一組示例中識別出統一的高級概念。該指令要求模型生成一個描述概念的名稱,提供最能代表該概念的示例編號,并創建一個能夠評估新文本實例并判斷概念是否適用的提示。這些組成部分對于理解概念的含義都非常有用,還采用了思維鏈(CoT)提示策略,指導模型提供其工作過程的詳細說明,從而提高內部一致性的概率。

LLooM:大語言模型時代文本聚類新思路-AI.x社區圖片

上圖是概念合成的提示詞模板。用戶可以根據需要調整概念名稱的長度、代表性示例的數量以及建議的概念數量;默認使用2到4個單詞的概念名稱,并請求1到2個代表性示例。

蒸餾 Distill

蒸餾這一步目的是使的輸入的數據更為緊湊,但同時保留關鍵特征,這樣既可以克服LLM的上下文窗口限制,有增強了對特定興趣點的聚焦能力,從而提升概念生成的效率。在LLooM框架中,作者采用了分步策略來實現蒸餾操作。

首先,通過零樣本摘要的方式進行過濾步驟,提供輸入文本實例,并引導大型語言模型(如gpt-3.5-turbo)生成抽取式摘要,精準選取原始文本中的原文;如果文本長度適中,此步驟可選擇跳過。用戶可以根據需要調整所選引用的數量,通常我們會留空此參數,賦予模型自由提取任意數量引用的靈活性。下圖是一個過濾提示的示例:

LLooM:大語言模型時代文本聚類新思路-AI.x社區圖片

接下來進行摘要操作,通過大語言模型,對內容進行摘要,以要點列表的形式輸出文本摘要。可以根據實際情況調整生成的要點數和每個要點的字數。默認設置一般是2-4個要點,每個要點包括5-8個詞。下圖是一個提示詞示例。

LLooM:大語言模型時代文本聚類新思路-AI.x社區圖片

聚類

聚類操作的輸入是蒸餾操作提取出的一系列要點。LLooM算法利用特定的 Embedding模型,將要點轉換為嵌入向量,然后根據指定的聚類算法進行聚類。在實際運用中,作者使用的是OpenAI的text-embedding-ada-002模型,原因是這個模型支持較長的上下文理解、且生成速度快。聚類算法采用的是HDBSCAN,一種基于密度的層次聚類算法,它的優勢在于不需要復雜的參數調整,且不必將所有點強行分配到某個聚類中。

評分

在概念生成階段,生成概念的同時,就為這些概念是生成了評分標準。所以評分環節,就使用這些評分標準,為每一個概念進行打分(0-1分),用來描述概念的契合程度。

此功能通過批量Zero Shot實現,提示中包含了一組JSON格式的實例、概念提示以及以多項選擇形式生成答案的指令。已有研究指出,大型語言模型在零樣本場景下并不提供經過校準的0-1置信度評分。但是,最新研究發現,對于經過指令調整的OpenAI模型如GPT-3.5,多項選擇提示能夠提供近似的答案概率。作者采用多項選擇提示法,引導模型為每個給定的實例生成一個多項選擇答案及相應的理由。這些答案經過解析,轉換成了分段的數值評分,其中“強烈同意”對應1.0分,而“強烈反對”對應0.0分。隨后,這些評分會被閾值化為二進制標簽,用戶可以調整這個閾值,以決定何時一個實例應被視為與概念相匹配。

LLooM為每個輸入項賦予一個分數(如0到1的范圍),用以描述其與特定概念的關聯度。系統針對每一個高級概念,對所有示例(輸入文本)運行“評分”操作符,生成一個概念評分,該評分評估每個實例與生成的概念提示的契合度。

在給定??個示例和??個高級概念的情況下,此階段會生成一個??×??的矩陣,其中每個示例都會有一個二進制概念標簽。

最終,依據概念評分的結果,LLooM可以借助循環操作進行多輪迭代。一旦評分階段完成,循環操作符便會識別出兩類離群點:

? 未被覆蓋的示例,即那些與現有任何高級概念都不相符的案例;

?被通用概念所覆蓋的示例,也就是那些只與“通用”概念相匹配的案例,這些概念至少與50%的示例相匹配。

所有這些示例將作為輸入數據,流入算法的下一輪迭代,而后續運行中生成的概念也將整合進概念的全集之中。

算法的局限性

? 首先,LLooM算法提供了眾多可調參數,比如在蒸餾階段要抽取的引用數量和生成的項目符號數目。盡管這些參數對用戶而言是可理解的,但用戶提前設置這些參數并不直觀,因此最佳做法是讓系統在可能的情況下自動設定這些值。系統設有默認值和計算參數值的公式,但這些尚未進行廣泛的適用性測試。

? 此外,當前版本的算法并未包含驗證步驟,例如確保引用的精確匹配、項目符號與引用的準確性,以及概念分數和理由的正確性。盡管對于大型語言模型來說,可靠的驗證始終是一個挑戰,但LLooM未來的改進版或許能從程序化的檢查和專為每個階段輸出驗證而設計的LLM操作符中獲益。我們對大型語言模型的應用也意味著,重新運行算法時結果會有變化。這種變化可以作為一個探索并行分析路徑和模擬變化的有用特性,但在分析必須可復制或需要強大且一致的對齊時,這可能是不可取的。

Arxiv

通往 AGI 的神秘代碼

if like_this_article():
    do_action('點贊')
    do_action('再看')
    add_wx_friend('iamxxn886')

if like_all_arxiv_articles():
    go_to_link('https://github.com/HuggingAGI/HuggingArxiv')    star_github_repo(''https://github.com/HuggingAGI/HuggingArxiv')

LLooM:大語言模型時代文本聚類新思路-AI.x社區

本文轉載自??大語言模型論文跟蹤??,作者:HuggingAGI ?

收藏
回復
舉報
回復
相關推薦
激情久久一区二区| 可以在线观看的av网站| 亚洲一级影院| 亚洲色图激情小说| 91日韩精品视频| 2021天堂中文幕一二区在线观| 国产亚洲精品超碰| 91久久大香伊蕉在人线| 成人h动漫精品一区二区下载| 亚洲成人精品| 亚洲人成电影网站色www| 色男人天堂av| 99re66热这里只有精品4| 亚洲另类在线一区| 日本一区二区三区视频免费看| 99久久精品国产一区二区成人| 亚洲深夜福利| 蜜臀久久99精品久久久无需会员| 美国黄色a级片| 911精品国产| 欧美另类久久久品| 激情网站五月天| 波多野结衣久久| 亚洲人成小说网站色在线| 蜜桃av噜噜一区二区三| 日韩中文字幕免费观看| 国产在线精品一区在线观看麻豆| 欧美一区二区三区免费视| 久草福利资源在线观看| 我不卡手机影院| 亚洲最新av网址| 一区二区不卡免费视频| 成人在线超碰| 欧美成人高清电影在线| 日韩av片专区| 超薄肉色丝袜脚交一区二区| 欧美日韩国产激情| 国产美女在线一区| 国产三线在线| 亚洲一二三四区不卡| 日本免费在线视频观看| 素人av在线| 国产精品免费免费| 亚洲激情一区二区三区| 欧洲伦理片一区 二区 三区| 成人黄色网址在线观看| 风间由美久久久| 亚洲av无码一区二区乱子伦| 国产麻豆午夜三级精品| 国产精品尤物福利片在线观看| 超碰在线免费97| 天堂蜜桃91精品| 国产精品久久久av久久久| 无码免费一区二区三区| 巨乳诱惑日韩免费av| 日本精品一区二区三区在线播放视频 | zzjj国产精品一区二区| 欧美日韩国产黄色| 日韩激情在线| 久久亚洲欧美日韩精品专区| 国产精品视频一区二区三| 欧美伊人影院| 午夜精品一区二区三区视频免费看| 国产一级在线免费观看| 日韩视频中文| 国产精品96久久久久久| 中文字字幕在线中文乱码| 精品一区二区三区免费毛片爱 | mm1313亚洲国产精品无码试看| 人人鲁人人莫人人爱精品| 欧洲精品一区二区| 中文字幕 日韩 欧美| 免费看日产一区二区三区| 精品久久久久香蕉网| 无码精品一区二区三区在线播放 | 福利电影一区二区三区| 丁香五月网久久综合| 五月婷婷在线播放| 日本一二三不卡| 青草全福视在线| 国产资源在线观看入口av| 欧美午夜精品久久久| 五月天六月丁香| 偷窥自拍亚洲色图精选| 在线观看日韩www视频免费| 亚洲视频重口味| 亚洲巨乳在线| 国产精品一区二区三区成人| www.蜜臀av.com| 久久久综合视频| 青青草免费在线视频观看| 忘忧草在线影院两性视频| 欧美性感一类影片在线播放| 国产精品熟女一区二区不卡| 国产精品极品国产中出| 在线电影欧美日韩一区二区私密| 免费中文字幕在线| 日韩高清在线不卡| 国产精品v欧美精品v日韩| 成人欧美亚洲| 亚洲v日本v欧美v久久精品| 一区二区三区视频在线观看免费| 中文久久电影小说| 中文字幕久久精品| 日本少妇激情视频| 国模娜娜一区二区三区| 欧美久久综合性欧美| 黄网av在线| 欧美日韩国产一级片| 网站免费在线观看| 午夜日本精品| 国产欧美一区二区三区在线看| 成人乱码一区二区三区| 国产精品美女久久久久高潮| 久久成人免费观看| 蜜桃精品视频| 日韩有码在线观看| 欧美一区免费看| 成人av在线资源| 亚洲小说欧美另类激情| 日韩在线免费| 亚洲欧美国内爽妇网| 伊人国产在线观看| 国产美女视频91| 亚洲成人自拍视频| 美女18一级毛片一品久道久久综合| 日韩精品一区二| 成年人一级黄色片| 久久99国产精品久久99| 日本高清久久一区二区三区| 人在线成免费视频| 亚洲第一福利在线观看| 激情综合五月网| 国产综合色精品一区二区三区| 午夜欧美性电影| 666av成人影院在线观看| 国产视频精品xxxx| 圆产精品久久久久久久久久久| 高潮精品一区videoshd| 精品人妻人人做人人爽| 欧美午夜网站| 久久综合色影院| 国产精品无码天天爽视频| 国产精品嫩草影院com| 一区二区三区 日韩| 久久国产成人精品| 国产热re99久久6国产精品| 91亚洲欧美| 9191久久久久久久久久久| 91高清免费看| 国产经典欧美精品| 男人添女荫道口女人有什么感觉| 一区二区三区在线资源| 国外成人在线直播| 男人的天堂在线视频| 午夜国产精品一区| v8888av| 日韩在线卡一卡二| 亚洲高清资源综合久久精品| 国外成人福利视频| 另类美女黄大片| 亚洲精品综合久久| 午夜av电影一区| 免费看污片网站| 美女视频一区二区| 996这里只有精品| 久久精品色播| 国产精品嫩草视频| 超碰在线观看免费| 精品视频久久久久久| 日韩黄色片网站| 自拍偷拍国产亚洲| 催眠调教后宫乱淫校园| 日韩国产精品久久久久久亚洲| 一区二区在线中文字幕电影视频| 一区二区三区亚洲变态调教大结局| 国内精品小视频| 超碰国产在线| 欧美岛国在线观看| 成年人av网站| 亚洲欧美日韩国产一区二区三区| 污污内射在线观看一区二区少妇 | 亚洲九九视频| 好吊色欧美一区二区三区四区| 国产v综合v| 久久大大胆人体| 手机福利小视频在线播放| 欧美日韩日本视频| 懂色av.com| 国产精品久久一卡二卡| 亚洲精品无码一区二区| 日韩不卡免费视频| a级免费在线观看| 精品久久国产| 久久爱av电影| 国内不卡的一区二区三区中文字幕| 国产69精品久久久久99| 一级毛片视频在线| 日韩高清中文字幕| a视频免费在线观看| 在线看日本不卡| 国产性猛交普通话对白| 国产精品天天摸av网| 亚洲一区二区在线免费| 精品一区二区在线视频| 99色精品视频| 精久久久久久| 最新黄色av网站| jizzjizz欧美69巨大| 国产亚洲二区| 少妇精品在线| 国产色视频一区| 蜜桃成人精品| 欧美中文字幕在线观看| 欧美xxxxhdvideosex| 色妞一区二区三区| 亚洲av片在线观看| 日韩精品中文字幕在线一区| 91尤物国产福利在线观看| 色综合久久综合网欧美综合网| 久久午夜无码鲁丝片| 亚洲欧美另类在线| 亚洲欧美另类日本| 国产日韩欧美a| 91视频在线网站| 久久这里只有精品首页| 秘密基地免费观看完整版中文| 国产精品一品二品| 欧美国产日韩另类| 另类调教123区 | 成人av色网站| 国产精品xxx视频| 国产综合色区在线观看| 国产99久久精品一区二区永久免费| rebdb初裸写真在线观看| 欧美国产欧美亚洲国产日韩mv天天看完整| 日韩大片在线永久免费观看网站| 国产亚洲xxx| 国产一二在线观看| 亚洲天堂开心观看| 国产一区精品| 国产亚洲欧美另类中文| аⅴ资源新版在线天堂| 国产亚洲精品高潮| 成年人在线看| 中文字幕亚洲第一| 午夜在线视频播放| 久久久av电影| 一二三四区在线观看| 欧美成人中文字幕在线| 丁香高清在线观看完整电影视频| 欧美高清激情视频| yellow字幕网在线| 欧美一区二区.| 全球最大av网站久久| 成人精品福利视频| 日韩三级网址| 国产日韩在线一区二区三区| 一呦二呦三呦国产精品| 日韩欧美精品一区二区| 成人综合专区| 玖玖精品在线视频| 亚洲黄色高清| 国产第一页视频| 美女视频一区二区三区| 一级片免费在线观看视频| 成人成人成人在线视频| 青青草视频播放| 国产精品全国免费观看高清| 内射一区二区三区| 精品福利在线视频| 在线播放精品视频| 日韩午夜激情免费电影| 亚洲欧美自偷自拍| 中文亚洲视频在线| 天堂亚洲精品| 国产精品91久久| 日韩在线观看中文字幕| 欧美在线日韩精品| 亚洲色图网站| 国产a级片网站| 美女视频一区在线观看| 一级黄色片毛片| 欧美极品aⅴ影院| 久久久久久久9999| 色婷婷亚洲综合| 亚洲毛片在线播放| 一区二区三区精品99久久| 色yeye免费人成网站在线观看| 国产va免费精品高清在线| 国产成年精品| 欧美 日韩 国产在线| 欧美视频不卡| 日本 片 成人 在线| 成人avav影音| 日韩女优一区二区| 在线免费观看视频一区| 亚洲精品国产精品国| 中文字幕不卡在线视频极品| heyzo高清在线| 国产日韩欧美视频在线| 日韩欧美四区| 成人毛片100部免费看| 青青草国产精品97视觉盛宴| 国产精品扒开腿做爽爽爽a片唱戏| 国产精品久久久久久久久免费相片 | 欧美高清www午色夜在线视频| 色av男人的天堂免费在线| 久久69精品久久久久久国产越南| 巨胸喷奶水www久久久免费动漫| 国产在线欧美日韩| 欧美日韩伊人| 日本高清免费在线视频| 国产精品欧美经典| 日本免费在线观看视频| 欧美精品一区二区三区高清aⅴ | 欧美精品日日鲁夜夜添| 美国一级片在线免费观看视频| 欧美日韩电影在线观看| 91精品麻豆| 亚洲国产一区二区三区在线 | 久久精品无码一区二区三区毛片| 国产亚洲女人久久久久毛片| 亚洲熟女综合色一区二区三区| 精品久久久久久久人人人人传媒| 国产成人无吗| 成人福利视频在线观看| 欧美色婷婷久久99精品红桃| 欧美v在线观看| www.日韩av| 日韩女同强女同hd| 精品久久免费看| sm在线观看| 国产成人精品一区二区三区福利 | 日韩 欧美 高清| 久久综合成人精品亚洲另类欧美 | 1024在线看片你懂得| 成人午夜影院在线观看| 国产精品精品| 亚洲午夜精品一区| 国产精品美女久久久久久 | 国模冰冰炮一区二区| 久久国产一区| 乱码第一页成人| 先锋影音av在线| 欧美日韩的一区二区| 黄网站在线免费| 成人天堂噜噜噜| 午夜久久久久| 国产免费一区二区三区最新6| 亚洲一区二区三区激情| 国 产 黄 色 大 片| 久久人人爽人人爽人人片av高请 | ccyy激情综合| 男女激情无遮挡| 久久免费精品国产久精品久久久久| 波多野结衣一本一道| 最近2019年手机中文字幕| 午夜精品久久久久久毛片| 中国女人做爰视频| 99国产欧美久久久精品| 无码人妻丰满熟妇区五十路| 中文字幕精品av| 国产精品一区三区在线观看| 日韩小视频网站| 久久久久国产免费免费| 中文字幕一区2区3区| 色综合久久88| 欧美激情15p| 亚洲一级片网站| 亚洲一线二线三线久久久| 日韩毛片在线一区二区毛片| 国产精品永久在线| 亚洲激情影院| 三区四区在线观看| 日韩欧美国产三级电影视频| 天堂√8在线中文| 一本久久a久久精品vr综合 | 亚洲国产欧美日韩精品| 欧美momandson| ijzzijzzij亚洲大全| www久久久久| 一卡二卡在线视频| 97免费在线视频| 国产精品精品| 中文字字幕码一二三区| 欧美精品丝袜中出| 亚洲精品日产| 艳母动漫在线观看| 久久久久久久久一| 国产熟女精品视频| 日本国产高清不卡| 欧美一区激情| 亚洲自拍偷拍图| 精品久久人人做人人爱| 日韩成人综合网站| 各处沟厕大尺度偷拍女厕嘘嘘| 亚洲人123区| 国产视频二区在线观看| 成人蜜桃视频|