用于小樣本對話意圖分類的動態標簽名稱優化
論文名:用于小樣本對話意圖分類的動態標簽名稱優化;2025 ACL 主會場的短篇論文
arxiv鏈接:https://arxiv.org/abs/2412.15603
短篇論文在提交review的時候,只需要寫4頁,看完這篇論文我覺得4頁紙就可以把思想表達清楚了。
使用大模型針對文本做分類的時候,需要給大模型輸入文本與候選類別標簽。大模型需要把文本與候選的標簽名稱對應起來。如果標簽名稱并不能很好的代表這個類別的含義,那么大模型在做自然語言推理的時候,效果就會不好。這篇論文提出了一種方法,讓大模型根據上下文,給每個類別動態的定義新標簽。然后大模型再針對新標簽進行分類。

圖1 類別名稱相似影響分類結果,分成上下兩部分看。圖1 的上部分是根據相似相似召回的段落,根據原始文本與標簽名稱,優化定義出新的標簽名稱。
圖1 的下部分是一個例子。原始的分類標簽名很相似會導致大模型分類效果不好。使用大模型定義新標簽,新標簽的之間的相似度會降低,這樣有利于大模型分類。

大模型在標簽重命名的時候,是一次性對所有的標簽重命名。這些類別在一起,方便大模型重新定義類別,這樣就方便針對不同的類別,定義出類別相似度較遠的新的類別名。

圖2 是流程圖,圖1與圖2有很多重復的地方。圖2透漏的額外內容就是在最后再把新標簽名再換回原始的標簽名。

表1主實驗,說明使用refined定義新的標簽名,分類效果更好。
實驗分析:

針對不同模型的新類別重定義的效果,計算舊類別名與新類別名之間的相似度。從上圖的實驗結果可以看出,強大的模型舊類別名與新類別名之間的相似度會更低。

表3的這個實驗做得很巧妙。表3 的模型有2行,頂部行的模型用于修改標簽名,第二行的模型用于文本分類。從這個表中,可以看出來,強大的模型做標簽名修改,強大的模型做文本推理,兩個都可以提高文本分類的效果。從這個表的設計來看,我覺得做的很好。因為最終效果不僅會和標簽名修改的效果有關系,也和最終用于文本分類的模型也有關系。
本文轉載自??AI悠閑區??,作者:AI悠閑區

















