精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

專治大模型“套殼”!上海AI實驗室等給LLM做“指紋識別”,剪枝合并也無所遁形

人工智能
來自上海AI實驗室、中科院、人大和上交大的學者們,提出了一種大模型的“指紋識別”方法——REEF(Representation Encoding Fingerprints)。

大模型“套殼”事件防不勝防,有沒有方法可以檢測套殼行為呢?

來自上海AI實驗室、中科院、人大和上交大的學者們,提出了一種大模型的“指紋識別”方法——REEF(Representation Encoding Fingerprints)

在不改變模型性能的前提下,利用REEF就可以精準識別未經授權的后續開發行為。

圖片

REEF依賴模型在微調后表征“不變性”的特點,基于表征編碼實現對大模型的“指紋鑒別”。

并且即使經過剪枝、合并、參數排列和縮放變換等一系列操作,同樣能讓“套殼”行為無所遁形。

可以說,這項研究給大模型開發團隊提供了一種應對大模型侵權問題的新手段。

大模型表征具有“微調不變性”

注:
在下文中,“源模型”是指從頭訓練的LLM(即論文中victim model),如Llama、Qwen等;
“被測模型”(即論文中的suspect model),分為兩類——基于源模型開發/訓練的“衍生模型”和其他“無關模型”。
REEF的目標是,給定一個被測模型,檢測其是否是來自“源模型”的“衍生模型”,即所謂的“套殼”模型。

鑒于訓練大語言模型的投入巨大,模型所有者和第三方迫切需要一種準確高效的方法,以判斷被測模型是否來自某一源模型(例如Code-llama從Llama-2訓練而來)

然而,現有的水印方法不僅增加了額外的訓練成本,還可能削弱模型的通用性能,且水印容易被刪除。更重要的是,這些方法無法應用于已公開發布的模型。

此外,基于權重的指紋識別缺乏魯棒性,惡意開發者可以通過不同權重修改手段輕松繞過檢測。

由于不同模型在訓練數據和模型架構上的差異,不同的LLM的特征表示有所不同。

如下圖(a)所示,Llama的表征與Baichuan和Qwen明顯不同,但與其微調模型(如Llama-chat和Chinese-llama)更為接近。

這一現象揭示了表征作為LLM“指紋”的潛力。

圖片

基于以下兩點觀察,作者在源模型的表征上訓練了一個二元分類器,并將其應用于各種被測模型的表征,包括衍生模型和無關模型:

  • 微調后的衍生模型的表征與源模型的表征相似,而無關模型的表征顯示出不同的分布;
  • 一些高級語義概念在 LLM 的表征空間中“線性”編碼,從而可以輕松分類,如安全或不安全、誠實或不誠實等。

具體而言,作者使用TruthfulQA數據集,分別選擇 Llama-2-7B和 Llama-2-13B作為源模型,并在其數據集表征上訓練了多種深度神經網絡DNN分類器,例如線性分類器、多層感知器MLP、卷積神經網絡CNN 和圖卷積網絡GCN。

然后,作者將訓練好的DNN分類器應用于被測模型的表征。

實驗結果表明:在源模型的表征上訓練的分類器能夠有效遷移到其衍生模型的表征上,但在無關模型的表征上失效。

這意味著,表征可以作為指紋來保護源模型的知識產權。

圖片

然而,使用DNN分類器識別源模型面臨以下挑戰:

  • DNN具有固定的輸入維度,如果對源模型進行改變表征維度的剪枝操作,分類器不再適用;
  • DNN對表征的排列缺乏魯棒性,惡意開發人員可能通過變換矩陣實現參數重排來規避檢測。

REEF:一種魯棒的LLM指紋識別方法

為了解決上述挑戰,作者提出一種新的基于表征的指紋識別方法——REEF,具備良好的魯棒性。

REEF利用中心核對齊CKA相似性,重點關注LLM的內部特征表征。

在評估被測模型是否來自源模型時,REEF計算兩個模型對相同樣本的表征之間的CKA相似性。

該方法簡單高效,能夠確保捕獲到任何顯著的相似性,從而揭示模型之間的潛在衍生關系。

CKA是基于希爾伯特-施密特獨立性準則(HilbertSchmidt Independence Criterion,HSIC)的相似性指數,用于測量兩組隨機變量之間的獨立性。

X和Y之間的CKA相似度可以按如下方式計算:

圖片

通過下面的定理1,論文在理論上證明了CKA相似度在任何列排列和縮放變換下具有不變性。同時,CKA能夠在不同維度的表征之間建立對應關系。

圖片

因此,REEF 對源模型的各種后續開發(包括模型剪枝和表征排列)表現出強魯棒性,從而確保基于表征的指紋能夠準確識別源模型。

無懼后續開發,穩穩識別“套殼”模型

作者將REEF應用于通過微調、剪枝、合并、排列和縮放變換等方式從源模型衍生出的被測模型。

這些方式可能顯著改變模型的結構或參數,使得現有方法難以有效識別源模型。

然而,REEF在這些情況下依然能夠準確識別出源模型,進一步驗證了其魯棒性。

圖片

具體來說,從上面的表中,可以得出以下結論:

  • REEF對微調具有很強的魯棒性,即使在使用多達700B tokens的微調情況下(Llama-7B),REEF仍能達到0.9962的高相似度;
  • REEF對各種剪枝策略都表現出魯棒性,無論結構化剪枝還是非結構化剪枝,REEF都能夠有效識別源模型,即使剪枝比率高達90%,REEF依然能夠成功識別;
  • 無論是基于權重或基于分布的模型合并方法,REEF均能在識別合并模型的來源方面始終保持高準確性;
  • REEF 對任何列排列和縮放變換具有不變性,能夠抵御該類規避技術。

圖片

魯棒且高效:跨數據集和樣本量

作者進一步分析了REEF在不同數據集和不同樣本數量下的表現。

一方面,除了前文提到的TruthfulQA數據集,作者還選擇了SST2、ConfAIde、PKUSafeRLHF和ToxiGen等數據集進行實驗;

另一方面,對于每個數據集,別在樣本數量從10到1000、每隔10的情況下進行采樣,以測試REEF的表現。

結果,REEF在不同數據集上均表現出有效性,對數據集不具強依賴性(圖示在不同數據集上,源模型與衍生模型之間的相似性顯著高于其與無關模型之間的相似性,表明REEF能夠跨數據集穩定識別源模型);

同時,REEF依賴少量樣本即可穩健識別模型指紋,具有高效性(圖示REEF在 200-300 個樣本后結果趨于穩定,表明其可以在較少的樣本數量下實現可靠的指紋識別)。

REEF它不僅保障了模型性能,還平衡了開放性與知識產權之間的關系,能夠確保衍生模型的責任可追溯。

作者相信,REEF將為AI模型保護和知識產權管理設立新的標準,促進更透明、協作的AI社區。

責任編輯:姜華 來源: 量子位
相關推薦

2024-12-13 07:39:22

2016-10-07 21:45:21

2025-07-22 10:45:55

2024-11-08 12:18:39

SynthID谷歌AI

2018-07-05 17:50:14

AI

2013-09-14 19:51:18

2015-01-26 17:43:54

監控監控雷達Range-R隱私安全

2025-03-31 08:44:00

GPT-4o模型技術

2016-07-04 08:27:30

量子指紋識別指紋識別量子通信

2025-08-25 09:07:00

2015-11-04 15:21:07

2025-09-28 09:11:00

2021-11-26 05:27:28

指紋解鎖人臉識別物理識別

2021-08-04 09:48:05

數字化

2009-05-07 16:20:20

谷歌實驗室Gmail

2024-11-28 14:45:00

模型研究

2020-04-28 11:02:02

大數據區塊鏈技術

2025-07-30 09:05:00

AI模型訓練

2024-03-14 11:50:34

點贊
收藏

51CTO技術棧公眾號

久久亚洲av午夜福利精品一区| 伊人色在线观看| 亚洲色欧美另类| 热久久久久久久| 久久天堂电影网| 亚洲图片综合网| 久久精品97| 婷婷夜色潮精品综合在线| 日韩在线电影一区| 亚洲高清在线观看视频| 男女男精品视频| 欧美精品久久久久久久久| 91精品小视频| 欧一区二区三区| 欧美色中文字幕| 精品无码一区二区三区在线| 嫩草在线视频| 91在线观看下载| 国产日韩欧美一二三区| 国产又大又黄视频| 欧美精品入口| 色天天综合狠狠色| 大尺度做爰床戏呻吟舒畅| 色成人综合网| 在线观看国产日韩| 欧美亚洲一二三区| 国产丝袜精品丝袜| 亚洲人妖av一区二区| 日韩久久精品一区二区三区| 欧美一区二区黄片| 国产激情一区二区三区四区 | 污视频网站免费在线观看| 91网页版在线| 国产一区二区三区高清| 精品国产一级片| 久久99久久99精品免视看婷婷| 欧洲美女7788成人免费视频| 国产精品白浆一区二小说| 亚洲欧美偷拍自拍| 久久久www成人免费精品| 国产三级av在线播放| 亚洲ab电影| 亚洲精品中文字幕有码专区| 人妻 日韩 欧美 综合 制服| 哺乳挤奶一区二区三区免费看 | 日本久久中文字幕| 日韩av在线播放观看| 午夜精品久久99蜜桃的功能介绍| 啊v视频在线一区二区三区| 国产美女永久免费无遮挡| 亚洲第一论坛sis| 日韩大陆毛片av| 天堂久久久久久| 啪啪国产精品| 日韩电影免费观看在线观看| 亚洲中文字幕无码av| 欧美日韩破处| 亚洲深夜福利在线| 久久国产柳州莫菁门| 欧美中文字幕一区二区| 中文字幕亚洲字幕| 久久久久麻豆v国产| 99久久99久久精品国产片桃花| 久久精品国产视频| 婷婷色中文字幕| 红桃视频国产一区| 91精品国产电影| 中文字幕在线欧美| 蜜臀av一区二区| 92福利视频午夜1000合集在线观看| 国产乱码精品一区二三区蜜臂| 国内精品写真在线观看| 成人av资源| 深夜福利在线观看直播| 国产肉丝袜一区二区| 亚洲欧美久久234| 综合久久2019| 精品久久久久久久久久ntr影视| 欧美激情三级免费| 欧美色中文字幕| 亚洲国产影院| 久久久久国产免费免费| 狼狼综合久久久久综合网| 蜜桃视频在线入口www| 欧美经典一区二区三区| dy888午夜| 高清精品在线| 欧美色涩在线第一页| 一二三级黄色片| 国产香蕉精品| 一区二区亚洲精品国产| 538精品在线视频| 国产欧美另类| 成人免费xxxxx在线观看| 超碰福利在线观看| 久久久99精品久久| 红桃一区二区三区| 成人小电影网站| 91精品在线观看入口| 久久一区二区电影| 91av精品| 日韩av理论片| 亚洲成人黄色片| 国产日韩一级二级三级| 国产免费裸体视频| 怡红院成人在线| 精品国产乱码久久久久久1区2区| 调教驯服丰满美艳麻麻在线视频| 欧美国内亚洲| 国产精品入口日韩视频大尺度| 黄色aaa毛片| 国产精品高潮呻吟久久| 人妻熟妇乱又伦精品视频| 亚洲成人高清| 亚洲性无码av在线| 狠狠躁夜夜躁人人爽天天高潮| 另类综合日韩欧美亚洲| 欧美成人在线免费观看| 美足av综合网| 69堂精品视频| 五月婷婷六月香| 亚洲在线观看| 国产亚洲精品久久飘花| 国产三区在线观看| 欧美亚洲国产一卡| 久久无码人妻精品一区二区三区| 欧美精品入口| 亚洲伊人第一页| 色综合久久影院| 色av一区二区| 无码h肉动漫在线观看| 亚洲欧洲日本一区二区三区| 91麻豆蜜桃| 高潮毛片在线观看| 5858s免费视频成人| 欧洲av一区二区三区| 先锋影音久久| 精品中文字幕一区| 91在线三级| 亚洲成人精品久久| 久久精品女人毛片国产| 国产激情偷乱视频一区二区三区| 中文字幕一区二区三区最新 | www.色播.com| 亚洲色图在线看| 日韩成人精品视频在线观看| 日韩系列欧美系列| 国产精品久久久久久久美男| 能在线看的av| 91成人网在线| 国产精品久久久久久久av| 日韩精品电影一区亚洲| 无码免费一区二区三区免费播放 | 成人免费在线视频网址| 日本在线免费看| 6080午夜不卡| 欧美色图一区二区| 国产成人精品综合在线观看| 欧美亚洲色图视频| 久久1电影院| 日本一区二区不卡| 国产中文字幕在线看| 在线视频亚洲一区| 乱老熟女一区二区三区| 国产综合久久久久久久久久久久| 中文字幕第50页| 99久热这里只有精品视频免费观看| 欧美精品激情在线| 可以在线观看的av| 欧美另类z0zxhd电影| 538精品在线视频| 北条麻妃一区二区三区| 成人免费观看毛片| 色777狠狠狠综合伊人| 亚洲综合精品一区二区| 91超碰国产在线| 亚洲欧洲在线视频| 91麻豆成人精品国产| 一区二区三区国产豹纹内裤在线| 国产精品成人99一区无码| 国产精品普通话对白| 亚洲无玛一区| 爱高潮www亚洲精品| 国产成人精品一区| √天堂8在线网| 亚洲欧美在线磁力| 99re只有精品| 精品久久久久久中文字幕大豆网 | 欧美亚洲成人精品| 在线看免费av| 精品国产精品一区二区夜夜嗨| 中文字幕国产在线观看| 亚洲人成精品久久久久| 国产精品无码网站| 国产自产v一区二区三区c| 丰满爆乳一区二区三区| 久久中文视频| 麻豆av一区| 美女久久精品| 国产精品女人网站| 1区2区3区在线| 日韩在线视频网| 偷拍自拍在线视频| 日韩一区二区三免费高清| 999视频在线| 亚洲五月六月丁香激情| 99精品全国免费观看| av男人天堂一区| 91aaa精品| 日本欧美大码aⅴ在线播放| 国产玉足脚交久久欧美| 国产精品成人av| 免费在线观看91| 白嫩白嫩国产精品| 亚洲一区制服诱惑| 欧美xxxx性| 国产不卡av在线免费观看| 国产天堂在线播放视频| 久久在线免费视频| www.av在线| 亚洲男人天天操| 日本波多野结衣在线| 欧美一级高清片| 亚洲一区二区三区高清视频| 色一情一伦一子一伦一区| 豆国产97在线 | 亚洲| 亚洲精品老司机| 欧美三级黄色大片| 国产精品国产自产拍高清av| 国产精品扒开腿做爽爽| 99热精品一区二区| youjizz.com国产| 国产99久久久国产精品潘金 | 久久这里有精品视频| 在线视频三区| 最新69国产成人精品视频免费| 欧美男男同志| 精品亚洲国产视频| 深夜影院在线观看| 国产婷婷97碰碰久久人人蜜臀 | 中文字幕久久久av一区| 国产精品一区在线看| 亚洲欧洲在线播放| 国产高清免费在线播放| 亚洲丝袜av一区| 黄色网址在线播放| 国产亚洲欧美视频| 成a人v在线播放| 色偷偷综合社区| 男女啪啪在线观看| 久热爱精品视频线路一| 二区三区在线观看| x99av成人免费| 日本中文在线| 色综合久久精品亚洲国产| 激情图片在线观看高清国产| 久久久亚洲欧洲日产国码aⅴ| 成人影院在线播放| 91精品国产高清久久久久久| 成人免费直播| 国产精品丝袜久久久久久不卡| 主播大秀视频在线观看一区二区| 国产精品视频自拍| 99久久这里有精品| 国产精品久久亚洲7777| 色狠狠久久av综合| 午夜视频久久久| 欧美福利在线| 国产亚洲天堂网| 免费不卡在线视频| 国产精品嫩草影视| caoporm超碰国产精品| 亚洲v国产v欧美v久久久久久| 亚洲国产激情av| 美女毛片在线观看| 精品国产老师黑色丝袜高跟鞋| 亚洲熟女综合色一区二区三区| 欧美综合久久久| 国产草草影院ccyycom| 日韩电影中文字幕一区| 五月天婷婷在线视频| 欧美国产亚洲精品久久久8v| 色婷婷综合久久久中字幕精品久久| 国产精品日韩久久久久| 亚洲一区二区三区四区电影| 欧美激情导航| 欧美一区国产在线| 漂亮人妻被中出中文字幕| 狠狠色丁香婷综合久久| 中文字幕 亚洲一区| 国产精品国产三级国产普通话三级 | 亚洲女性喷水在线观看一区| 久久久国产精品成人免费| 欧美另类z0zxhd电影| 天堂在线中文字幕| 久久视频在线直播| 电影一区二区三| 亚洲资源在线看| 精品国产一区二区三区久久久蜜臀 | 欧美午夜免费电影| 国产91久久久| 精品国产一区二区三区久久久| 日本不卡免费高清视频在线| 成人免费视频网| 精品视频网站| 69堂免费视频| 波多野结衣中文一区| 中国一级片在线观看| 在线观看亚洲a| 天堂网在线资源| 欧美精品亚州精品| 国产69精品久久| 日本一区二区三区四区高清视频| 国产精品第十页| 亚洲欧美天堂在线| 亚洲国产高清在线观看视频| 日韩手机在线视频| 日韩成人在线电影网| av电影在线免费| 91成人在线看| 亚洲91视频| 亚洲精品自拍网| 国产亚洲欧美日韩在线一区| 日韩高清精品免费观看| 欧美一区二区播放| 日本中文字幕在线看| 国产精品福利无圣光在线一区| 乱中年女人伦av一区二区| av日韩在线看| 国产高清在线精品| 国产人妻精品一区二区三区不卡| 欧美日韩亚洲高清一区二区| 国产高清在线看| 国产精品久久久久久久av大片| 精品中文一区| 欧美精品第三页| 久久久久国色av免费看影院| 人人爽人人爽人人片av| 日韩精品极品毛片系列视频| 91超碰在线免费| 国产视频一区二区三区四区| 亚洲国产欧美国产综合一区| 69亚洲乱人伦| 性感美女极品91精品| 熟妇人妻一区二区三区四区 | 一区二区三区精品99久久| 第84页国产精品| 日韩av电影免费播放| 日韩av二区在线播放| 高清国产在线观看| 欧美日韩一区中文字幕| 日p在线观看| 亚洲已满18点击进入在线看片| 中文字幕人成人乱码| 伊人成人免费视频| 一区二区三区**美女毛片| 国产91免费在线观看| 2018日韩中文字幕| 视频一区在线观看| 亚洲欧美激情网| 自拍偷自拍亚洲精品播放| 99精品在线看| 久久免费视频观看| 久久97视频| 中文字幕久久av| 亚洲一级电影视频| 九九九伊在人线综合| 国产精品女人久久久久久| 亚洲女同另类| 久久人人爽人人爽人人片| 欧洲一区在线观看| 国产一二区在线| 精品久久久久久乱码天堂| 美女日韩在线中文字幕| 久久精品国产亚洲AV成人婷婷| 日韩一区二区三区四区| 国产高清自产拍av在线| 亚洲精品一区二| 粉嫩嫩av羞羞动漫久久久| 日韩欧美成人一区二区三区| 在线观看亚洲视频| 中文一区二区三区四区| 成人羞羞国产免费网站| 亚洲免费观看高清完整| 天堂中文资源在线| 91免费看片网站| 羞羞视频在线观看欧美| 国产日产精品一区二区三区的介绍| 日韩精品一区在线观看| 日韩精品麻豆| 男女日批视频在线观看| 欧美激情一区三区| 亚洲精品人妻无码| 国产精品久久久久久久app| 国产精品www994| 中文字幕91视频| 日韩精品免费看| 日韩一区二区三区精品| 国产精品免费成人| 亚洲一区二区三区在线看 |