精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

利用公開知識定向提升大模型,騰訊優圖&上交大提出新方法,性能達SOTA

人工智能 新聞
本文提出的方法通過 K - shot 數據在模型選擇和數據擴增中發揮重要作用,優于現有方法,并通過消融研究驗證了選擇方法的有效性,展示了一種挖掘開放知識進行定制技能整合的高效流程。

告別傳統指令微調,大模型特定任務性能提升有新方法了。

一種新型開源增強知識框架,可以從公開數據中自動提取相關知識,針對性提升任務性能。

與基線和SOTA方法對比,本文方法在各項任務上均取得了更好的性能。

圖片

該方法由上海交通大學和騰訊優圖實驗室共同提出。

圖片

研究背景

近年來,LLMs 在眾多任務和領域取得了顯著發展,但為了在實際業務場景發揮模型的專業能力,通常需要在領域特定或任務特定的數據上進行指令微調。傳統的指令微調往往需要大量的有標注數據和計算資源,對于實際業務場景這是很難獲得的。

另一方面,開源社區提供了大量的微調模型和指令數據集。這些開源知識的存在使得在特定任務上LLM在特定領域上的適配和應用成為了可能。但是,使用開源的各類SFT模型以及任務相關的數據集時,仍有以下關鍵問題需要解決:

  1. 少量有標注樣本場景下,直接對模型微調或進行in-context-learning的效果往往不能滿足需求,如何利用這些少量的樣本和海量的外部知識(開源世界的模型,數據)對目前已有的知識進行補充,提升模型的任務能力和泛化性能?
  2. 開源社區中有大量微調且對齊的模型和指令數據集,可作為提升 LLMs 特定任務專業能力的良好起點,如何在可能存在知識沖突的情況下,合理融合這些外部知識?現有工作往往聚焦于對已有模型組合方法的設計,無法最大化利用多個模型的知識儲備。
  3. 在開源模型的評價上,現有工作僅僅從單一角度(如測試集上嚴格答案匹配的準確率)進行性能評估,而忽視了這可能帶來的偏差。同時在開源數據的評價上,現有方案通常從通用數據的質量、復雜度等評估角度出發,沒有結合任務導向性來實現數據精選。

針對以上關鍵問題,研究團隊提出了一種切合業務實際的全新實驗設置:K-shot有標簽真實業務數據下的開源知識增強框架。在這樣的框架下,充分利用K-shot樣本來實現LLM的定向任務增強。

具體地,團隊設計了一套可輕松尺度拓展的LLM知識增強管線,并且充分發揮少量的K-shot樣本在開源模型、開源數據篩選上的指導作用。在方案設計上,主要面臨了以下挑戰:

挑戰1: 對于給定的感興趣任務,如何充分利用有限的 K-shot 數據,以高效地確定具有最大潛力的模型。

挑戰2: 如何從開源數據集中識別與 K-shot 任務相關性最強的一批指令數據,以便為 LLMs 注入、補充缺失的領域知識,同時避免過擬合現象。

挑戰3: 當多個 LLMs 均在任務上表現出有效性時,如何構建一個自適應的模型融合系統,以更好地利用這些模型之間互補的知識,從而提高它們在 K-shot 任務中的協同性能并展現出比單模型更優的效果。

本文貢獻

本研究提出了一種結合公開可用模型和數據集,針對特定任務提升大型語言模型性能的方法全流程。主要貢獻包括:

  1. 提出了一種高效篩選具有最大潛力的模型的方法,綜合推理困惑度模型表現模型間知識豐富度進行模型篩選,在有限的 K-shot 數據條件下,能夠充分發揮已有模型的性能。
  2. 設計了一種從開源數據集中提取與感興趣任務或領域相關知識的方法,通過相似性-多樣性的數據篩選策略,為 LLMs 提供補充信息,降低過擬合的風險。
  3. 通過混合專家模型結構構建了一種自適應的模型融合系統,能夠在多個潛在有效的 LLMs 之間實現知識互補和協同優化,從而在感興趣任務上取得更好的性能。

前提儲備:

LoRA Bank Construction:從 Huggingface 選擇 38 個具有代表性且廣泛使用的指令數據集,對每個數據集進行預處理和 LoRA 微調來構建 LoRA Bank。LoRA Bank的引入為特定任務提供了可選擇的預訓練模型集合,并保證了實驗的可重復性以及對比的公平性。

圖片

核心方法:

1、K-shot Guided Expert Model Selection:提出一種專家模型選擇方法,綜合考慮模型的推理困惑度在K-shot數據上的性能表現以及模型多樣性來篩選最有潛力的模型組。

團隊發現,僅僅從推理結果的性能評估(通常用后處理+Exact Match等手段來計算)不能很好地預測得到模型在特定任務上的表現。這是因為模型輸出的答案可能無法被完全后處理解析,導致模型被低估。

團隊發現通過答案的推理困惑度可以判斷模型對某一個領域的理解能力,因此綜合考慮了這兩種手段。

如下圖,部分直接推理指標高的模型在微調后表現可能低于原先推理指標低的模型,但推理困惑度低的模型的微調后的性能會比原先困惑度高的模型更強。

此外,還對模型組的組多樣性進行了評估,即不同模型的知識的差異性要盡量大,這對于混合專家系統的訓練效果有較大提升。

圖片

2、Mixture-of-Experts Initialization:使用混合專家模型結構來利用合理利用 LoRA Bank,用模型篩選步驟中得到的模型做MoE模型的初始化,并訓練Router使模型能夠自動將不同的 token 分配給合適的專家,從而促進不同專家之間的協同合作。

圖片

3、K-shot Guided Sim-Div Data Selection:提出一種相似性優先和多樣性感知的數據選擇策略,通過對原始指令文本進行embedding計算,計算開源數據和K-shot數據相似度,選擇與K-shot數據最相似的數據子集,并通過語義層面上的相似度去重來去除重復度過高的數據,保證數據的多樣性。

數據相似度-多樣性的平衡是篩選過程中著重考慮的點,相似的數據能保證和當前任務的強相關性,多樣性的引入能保持數據整體的豐富度和信息充分性,防止模型過擬合的情況的出現。

圖片

4、Mixture-of-Experts Fine-Tuning:結合增強數據集和K-shot數據集來優化 MoE 系統的Router權重和專家權重,使用交叉熵損失來監督語言建模的輸出。

實驗設置

數據集:使用六個開源數據集(ARC-Challenge、ARC-Easy、PiQA、BoolQ、MBPP 和 GSM8K)作為評估集,從每個數據集的官方訓練集中隨機采樣K條有標注的指令-響應對作為 K–shot數據。

基線:與五種基線方法(基礎模型、隨機選擇模型、基于整個訓練集微調的模型、在測試集上表現最佳的專家模型、對最佳專家進行微調的模型)以及其他 SOTA 方法進行比較。

實驗結果與分析

圖片

1、與基線和 SOTA 方法對比,本文方法在各項任務上均取得了更好的性能。

圖片

2、通過可視化專家的激活模式,發現 MoE 系統沒有等效地坍縮為單個模型,每個專家都對整體有貢獻。

圖片

3、在模型選擇的消融研究中,綜合考慮評測性能、推理困惑度和模型多樣性來選擇有潛力的模型優于單一依賴 K - shot 性能或推理困惑度的方法,且推理困惑度比普通困惑度在模型選擇中更有效。

圖片

4、在數據選擇的消融研究中,基于相似性優先和多樣性感知的數據選擇策略進一步提高了 MoE 系統的性能,同時發現增加數據量時性能先上升后下降,多樣性在平衡分布和緩解過擬合方面起著重要作用,不同的相似性采樣技術對性能也有影響。

圖片
圖片

5、在對 K、N 和 k 的消融研究中,發現增加僅僅需要K=5,即5條有標注樣本在感興趣任務上的就可以取得不錯的效果。

專家候選者之間的差異對于維持任務導向的 MoE 系統至關重要。此外MoE 系統訓練所需的數據量應根據任務進行優化,更困難的任務需要更多高質量訓練數據。總的訓練數據的數量不能太多,隨著k的增加,模型性能會出現先上升后下降的趨勢,證明和任務數據相似度較高的外部數據的引入才能對模型性能有所提升。

從LoRA Bank中選出的專家數量N不需要很多,證明和模型高相關性的適配器的引入才能增強模型的任務能力。

圖片

6、對MoE組合的有效性分析:將數據劃分為All-correct,All-incorrect,Mixed三類數據,其中Mixed代表至少有一個專家做對且至少有一個專家做錯(不同專家出現分歧)的樣本,通過MoE的方式,不同專家的融合能超過最優的專家的效果,證明MoE組合方案的有效性。

圖片
圖片

討論

本方法不依賴數據集和模型的元信息,這是本方法的一大優勢。實際場景下,數據和模型的源信息可能會存在描述不詳細、難以確定相關數據點等問題。開源模型的訓練數據/訓練細節很難具體獲得。

該方法具有多任務適用性和易用性,大多數開源 LLMs 是 LLaMA 和 Mistral 家族的變體,可通過 Huggingface 獲取大量模型,但不同 PEFT 方法之間計算模型間相似性可能不兼容。

結論

本文提出的方法通過 K - shot 數據在模型選擇和數據擴增中發揮重要作用,優于現有方法,并通過消融研究驗證了選擇方法的有效性,展示了一種挖掘開放知識進行定制技能整合的高效流程。


責任編輯:張燕妮 來源: 量子位
相關推薦

2022-12-12 11:31:39

數據學習

2025-06-24 09:06:00

AI推理模型

2024-08-15 15:20:00

模型生成

2024-12-30 07:11:00

大型視覺語言模型VLMs人工智能

2025-06-06 09:15:00

2023-12-18 13:11:00

AI論文

2024-09-03 14:10:00

模型測試

2025-07-25 09:22:13

2023-12-27 18:12:50

2021-11-26 18:37:39

技術人工智能計算機

2023-09-25 10:04:37

模型AI

2022-07-04 15:09:55

超大數據集數據分析瘦身

2024-02-21 12:10:00

模型數據

2025-06-11 09:17:00

2025-10-17 09:56:05

2022-12-08 13:00:10

AI性別偏見

2024-10-23 19:47:54

2024-07-08 08:47:00

2025-10-16 08:52:00

2024-12-23 15:30:00

模型AI測試
點贊
收藏

51CTO技術棧公眾號

日韩一区二区免费在线观看| 91视频国产观看| 欧美成人性色生活仑片| 日韩高清一二三区| 国产不卡人人| 欧美激情综合五月色丁香小说| 国产精品永久免费| 国产小视频在线看| 精品视频亚洲| 精品精品国产高清一毛片一天堂| 少妇高清精品毛片在线视频| 乱人伦中文视频在线| 99国产精品国产精品毛片| 国产精品国产自产拍高清av水多 | 国产xxxx振车| 国产在线一二| 成人听书哪个软件好| 国产精品久久久久久一区二区 | 一本久道久久综合婷婷鲸鱼| 中文字幕亚洲欧美日韩2019| 菠萝菠萝蜜网站| 精品中文字幕一区二区三区| 在线视频欧美精品| 国产欧美日韩小视频| 麻豆传媒免费在线观看| 久久精品欧美一区二区三区不卡| 99re视频在线| 91欧美日韩麻豆精品| 日韩激情视频网站| 欧美一区三区三区高中清蜜桃| 91精品少妇一区二区三区蜜桃臀| 日本在线中文字幕一区| 精品欧美乱码久久久久久| 最新天堂在线视频| 欧美黄色三级| 狠狠色狠色综合曰曰| 免费看欧美一级片| 国产福利视频在线| 中文av一区特黄| 日本免费高清一区| 亚洲aaa在线观看| 成人av网站在线观看免费| 91丨九色丨国产| 国产绿帽刺激高潮对白| 狠狠色丁香久久婷婷综合_中| 国产精品高清在线| 波多野结衣日韩| 麻豆91精品| 7777精品视频| 99久热在线精品996热是什么| 亚洲私人影院| 亚洲**2019国产| 日韩精品在线免费看| 亚洲第一区色| 亚州av一区二区| 久久国产黄色片| 久久免费国产| 7777精品视频| 丰满少妇xoxoxo视频| 亚洲主播在线| 国产成人精品视频在线观看| 中文字幕xxxx| 蜜桃久久av一区| 成人av在线天堂| aaa国产视频| 懂色av一区二区三区蜜臀| 99视频网站| 天堂网av在线播放| 91免费国产在线| 日本一区视频在线播放| 视频一区二区三区不卡| 亚洲欧美日韩国产一区二区三区| 国产911在线观看| 搞黄网站在线看| 色播五月激情综合网| 国产精品一区二区小说| 亚洲伊人影院| 亚洲欧美制服另类日韩| 国产真人真事毛片视频| 亚洲欧洲日韩| 91tv亚洲精品香蕉国产一区7ujn| 少妇久久久久久久| 国产在线一区观看| 国产区欧美区日韩区| 久久久久久久久亚洲精品| 国产亚洲精品福利| 青青草免费在线视频观看| av成人 com a| 欧美午夜寂寞影院| 日韩精品xxx| 国产99精品| 久久亚洲成人精品| 丰满少妇乱子伦精品看片| 免费高清在线一区| 风间由美一区二区三区| 国产高清免费在线播放| 亚洲综合丁香婷婷六月香| av观看免费在线| 成人污污www网站免费丝瓜| 精品欧美一区二区三区精品久久| 亚洲精品成人av久久| 欧美激情视频一区二区三区免费| 欧美专区福利在线| 精品毛片一区二区三区| 国产女主播一区| 97超碰国产精品| 色999久久久精品人人澡69| 欧美精品一区二区久久久| a资源在线观看| 亚洲激情婷婷| 亚洲www在线| 高清毛片在线看| 亚洲亚洲人成综合网络| 国产原创精品在线| 偷拍亚洲精品| 欧美精品videosex极品1| 亚洲中文字幕在线一区| 91视频一区二区| www.好吊操| 国产精品免费精品自在线观看| 亚洲欧洲免费视频| 日韩欧美高清在线观看| 国产成人av一区二区三区在线 | 久久精品日韩欧美| 国产传媒一区| jizz性欧美| 欧美日韩一本到| 中文字幕网站在线观看| 亚洲一区黄色| 成人黄动漫网站免费| 蜜桃视频在线观看www社区| 在线一区二区观看| 女人又爽又黄免费女仆| 久久福利影视| 国产自产精品| 欧美办公室脚交xxxx| 精品久久久久久综合日本欧美| 亚洲熟女www一区二区三区| 久久精品国产99国产精品| 水蜜桃一区二区三区| 中文字幕人成乱码在线观看| 亚洲成人网在线| 精品少妇一二三区| 成人一道本在线| 日b视频免费观看| 超碰97久久国产精品牛牛| 九九精品在线观看| www.亚洲欧美| 亚洲国产精品一区二区www在线| 中文国产在线观看| 一区二区三区四区电影| 91精品天堂| 免费污视频在线| 精品久久久久久久久久久久包黑料| 久久久久亚洲av片无码下载蜜桃 | av鲁丝一区鲁丝二区鲁丝三区| 欧美色图麻豆| 国产精品乱码| www.日韩| 色琪琪综合男人的天堂aⅴ视频| 中文字幕777| 亚洲欧洲av在线| 亚洲精品鲁一鲁一区二区三区| 韩国自拍一区| 精品久久久久久一区| 欧美韩国亚洲| 精品国产欧美成人夜夜嗨| 国产精品亚洲lv粉色| 亚洲综合丝袜美腿| 国产黄色三级网站| 日韩电影网1区2区| 大地资源网在线观看免费官网| 国产欧美啪啪| 国产精品久久久久久久av大片| 欧洲日本在线| 亚洲精品一区二区三区四区高清| 91av在线免费视频| 中文字幕av不卡| 国产chinesehd精品露脸| 亚洲欧美日韩一区在线观看| 亚洲欧洲另类精品久久综合| 欧美专区视频| 欧美专区日韩视频| 国产精品实拍| 亚洲毛片在线观看| 97人妻一区二区精品免费视频| 一区二区三区波多野结衣在线观看| 加勒比精品视频| 精品影视av免费| 少妇高潮喷水在线观看| 手机在线电影一区| 国产精品v欧美精品∨日韩| 亚洲a∨精品一区二区三区导航| 久久影院免费观看| 日本一本草久在线中文| 91精品国产入口| 天堂а√在线中文在线新版 | 国产卡一卡二在线| 天天躁日日躁狠狠躁欧美| 91精品美女在线| 黄在线观看免费网站ktv| 久久久av网站| 久蕉在线视频| 亚洲精品av在线播放| 国产精品女同一区二区| 欧美日韩午夜视频在线观看| 粉嫩av性色av蜜臀av网站| 久久久不卡网国产精品二区| 亚洲av无码专区在线播放中文| 日本成人超碰在线观看| 亚洲 自拍 另类小说综合图区| 91tv官网精品成人亚洲| 欧美激情www| 国产精品网址| 99久久无色码| 超碰国产精品一区二页| 国产成人高清激情视频在线观看| 第四色日韩影片| 久久香蕉频线观| 中文字幕日本在线| 国产一区二区三区视频| 午夜视频福利在线观看| 精品对白一区国产伦| 国产精品-色哟哟| 在线观看欧美精品| 人妻丰满熟妇av无码区| 亚洲va欧美va天堂v国产综合| 黑人操日本美女| 亚洲欧洲精品天堂一级| 欧美巨胸大乳hitomi| 日本一区二区三区在线不卡| 中文字幕国产综合| 99久久久无码国产精品| 亚洲欧美日韩偷拍| 国产成人一区在线| 人妻少妇偷人精品久久久任期| 美女视频免费一区| 一路向西2在线观看| 欧美aaaaa成人免费观看视频| 欧美成人免费高清视频| 午夜亚洲福利在线老司机| 日韩精品xxxx| 亚洲欧美日本日韩| 无遮挡又爽又刺激的视频| 久久福利精品| 波多野结衣天堂| 日韩**一区毛片| 牛夜精品久久久久久久| 青椒成人免费视频| www午夜视频| 国内久久精品视频| 波多野结衣在线免费观看| 国产资源在线一区| 久久黄色一级视频| 不卡的看片网站| 91av在线免费| 国产日本欧美一区二区| 美女三级黄色片| 亚洲免费伊人电影| 精品少妇爆乳无码av无码专区| 午夜欧美在线一二页| 国产精品久久久久久久久久久久久久久久久| 精品福利一区二区| 久久精品无码av| 欧美私人免费视频| www.天堂av.com| 日韩精品免费在线播放| 91免费在线| 欧美大尺度激情区在线播放| 超碰高清在线| 国产精品第3页| 网站一区二区| 久久久久久久免费| 久久美女精品| 欧美久久在线观看| 视频一区二区中文字幕| 国产女同无遮挡互慰高潮91| 国产v综合v亚洲欧| 短视频在线观看| 中文字幕一区av| 久久精品久久国产| 欧美在线影院一区二区| 国产高清不卡视频| 精品亚洲男同gayvideo网站| seseavlu视频在线| 欧美激情视频给我| 久久xxx视频| 国产欧美丝袜| 婷婷精品进入| 北条麻妃69av| 国内精品写真在线观看| 亚洲av无码一区二区三区网址 | 国产在线观看99| 日本久久电影网| 亚洲国产精品二区| 在线观看成人黄色| 182在线视频观看| 国产精品永久免费观看| 欧美日韩大片免费观看| 午夜探花在线观看| 日韩一区欧美二区| 亚洲av无码一区东京热久久| 欧美韩日一区二区三区四区| 久久免费在线观看视频| 欧美日韩三级视频| 日韩在线无毛| 欧美激情videoshd| 久久精品国产福利| 麻豆亚洲一区| 欧美日本精品| 日日干夜夜操s8| 91麻豆精品在线观看| 无码人妻精品一区二区三区夜夜嗨| 91久久精品一区二区| 好吊色一区二区三区| 久久精品精品电影网| 男人皇宫亚洲男人2020| 精品无人乱码一区二区三区的优势| 亚洲第一偷拍| 三上悠亚在线一区二区| 久久久电影一区二区三区| 国产精品成人国产乱| 日韩欧美中文字幕制服| 国产原创视频在线观看| 国产日产久久高清欧美一区| 欧美日韩xxxx| 日韩av一二三四区| jvid福利写真一区二区三区| 久久久久久久久毛片| 日韩一区二区三区电影在线观看| 午夜视频在线免费观看| 国产精品成人播放| 久久99视频| 日本激情视频在线| 久久久99免费| 乱子伦一区二区三区| 亚洲欧美在线第一页| 国产精品一区二区av影院萌芽| 久久涩涩网站| 免费在线欧美黄色| 波多野结衣福利| 都市激情亚洲色图| 韩国精品视频| 国产精品久久久久久网站| 日韩精品影视| 亚洲天堂2018av| 亚洲欧洲中文日韩久久av乱码| 国产女无套免费视频| 精品视频9999| 精品自拍偷拍| www黄色av| 国产欧美1区2区3区| 国产又粗又大又爽| 麻豆国产精品va在线观看不卡| 久久影院一区二区三区| 51xx午夜影福利| 成人av影院在线| 国产www在线| 色先锋资源久久综合5566| 中文字幕日本一区| 黄色成人在线免费观看| 99视频精品全部免费在线| chinese国产精品| 最近中文字幕日韩精品| 欧美在线在线| 黄色av网址在线播放| 亚洲国产精品v| 国产成人久久精品77777综合| 欧美激情在线狂野欧美精品| 亚洲国产网址| 手机免费看av网站| 亚洲影视在线观看| 精品电影在线| 91久久国产婷婷一区二区| 亚洲大片在线| 国产又粗又黄又猛| 欧美大片一区二区三区| 最近高清中文在线字幕在线观看1| 五月天综合网| 成人免费观看视频| www.久久视频| 欧美日韩国产第一页| 国产va免费精品观看精品视频 | 亚洲乱码一区| 久久无码高潮喷水| 亚洲色图欧美偷拍| 色视频在线看| 91牛牛免费视频| 欧美专区一区二区三区| 日韩a级片在线观看| 亚洲视频一区二区| 亚洲乱码一区| 国产精品久久久毛片| 欧美日韩精品国产| 国产在线观看av| 欧美尤物一区| 成人精品免费网站| 国产又黄又粗又长| 日韩av免费在线观看| 亚洲国产电影|