精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

專治大模型“套殼”!上海AI實驗室等給LLM做“指紋識別”,模型剪枝、合并等也無所遁形

人工智能
來自上海AI實驗室、中科院、人大和上交大的學者們,提出了一種大模型的“指紋識別”方法——REEF(Representation Encoding Fingerprints)。在不改變模型性能的前提下,利用REEF就可以精準識別未經授權的后續開發行為。

大模型“套殼”事件防不勝防,有沒有方法可以檢測套殼行為呢?

來自上海AI實驗室、中科院、人大和上交大的學者們,提出了一種大模型的“指紋識別”方法——REEF(Representation Encoding Fingerprints)。

在不改變模型性能的前提下,利用REEF就可以精準識別未經授權的后續開發行為。

圖片

REEF依賴模型在微調后表征“不變性”的特點,基于表征編碼實現對大模型的“指紋鑒別”。

并且即使經過剪枝、合并、參數排列和縮放變換等一系列操作,同樣能讓“套殼”行為無所遁形。

可以說,這項研究給大模型開發團隊提供了一種應對大模型侵權問題的新手段。

大模型表征具有“微調不變性”

注:
在下文中,“源模型”是指從頭訓練的LLM(即論文中victim model),如Llama、Qwen等;
“被測模型”(即論文中的suspect model),分為兩類——基于源模型開發/訓練的“衍生模型”和其他“無關模型”。
REEF的目標是,給定一個被測模型,檢測其是否是來自“源模型”的“衍生模型”,即所謂的“套殼”模型。

鑒于訓練大語言模型的投入巨大,模型所有者和第三方迫切需要一種準確高效的方法,以判斷被測模型是否來自某一源模型(例如Code-llama從Llama-2訓練而來)

然而,現有的水印方法不僅增加了額外的訓練成本,還可能削弱模型的通用性能,且水印容易被刪除。更重要的是,這些方法無法應用于已公開發布的模型。

此外,基于權重的指紋識別缺乏魯棒性,惡意開發者可以通過不同權重修改手段輕松繞過檢測。

由于不同模型在訓練數據和模型架構上的差異,不同的LLM的特征表示有所不同。

如下圖(a)所示,Llama的表征與Baichuan和Qwen明顯不同,但與其微調模型(如Llama-chat和Chinese-llama)更為接近。

這一現象揭示了表征作為LLM“指紋”的潛力。

圖片

基于以下兩點觀察,作者在源模型的表征上訓練了一個二元分類器,并將其應用于各種被測模型的表征,包括衍生模型和無關模型:

  • 微調后的衍生模型的表征與源模型的表征相似,而無關模型的表征顯示出不同的分布;
  • 一些高級語義概念在 LLM 的表征空間中“線性”編碼,從而可以輕松分類,如安全或不安全、誠實或不誠實等。

具體而言,作者使用TruthfulQA數據集,分別選擇 Llama-2-7B和 Llama-2-13B作為源模型,并在其數據集表征上訓練了多種深度神經網絡DNN分類器,例如線性分類器、多層感知器MLP、卷積神經網絡CNN 和圖卷積網絡GCN。

然后,作者將訓練好的DNN分類器應用于被測模型的表征。

實驗結果表明:在源模型的表征上訓練的分類器能夠有效遷移到其衍生模型的表征上,但在無關模型的表征上失效。

這意味著,表征可以作為指紋來保護源模型的知識產權。

圖片

然而,使用DNN分類器識別源模型面臨以下挑戰:

  • DNN具有固定的輸入維度,如果對源模型進行改變表征維度的剪枝操作,分類器不再適用;
  • DNN對表征的排列缺乏魯棒性,惡意開發人員可能通過變換矩陣實現參數重排來規避檢測。

REEF:一種魯棒的LLM指紋識別方法

為了解決上述挑戰,作者提出一種新的基于表征的指紋識別方法——REEF,具備良好的魯棒性。

REEF利用中心核對齊CKA相似性,重點關注LLM的內部特征表征。

在評估被測模型是否來自源模型時,REEF計算兩個模型對相同樣本的表征之間的CKA相似性。

該方法簡單高效,能夠確保捕獲到任何顯著的相似性,從而揭示模型之間的潛在衍生關系。

CKA是基于希爾伯特-施密特獨立性準則(HilbertSchmidt Independence Criterion,HSIC)的相似性指數,用于測量兩組隨機變量之間的獨立性。

X和Y之間的CKA相似度可以按如下方式計算:

圖片

通過下面的定理1,論文在理論上證明了CKA相似度在任何列排列和縮放變換下具有不變性。同時,CKA能夠在不同維度的表征之間建立對應關系。

圖片

因此,REEF 對源模型的各種后續開發(包括模型剪枝和表征排列)表現出強魯棒性,從而確保基于表征的指紋能夠準確識別源模型。

無懼后續開發,穩穩識別“套殼”模型

作者將REEF應用于通過微調、剪枝、合并、排列和縮放變換等方式從源模型衍生出的被測模型。

這些方式可能顯著改變模型的結構或參數,使得現有方法難以有效識別源模型。

然而,REEF在這些情況下依然能夠準確識別出源模型,進一步驗證了其魯棒性。

圖片

具體來說,從上面的表中,可以得出以下結論:

  • REEF對微調具有很強的魯棒性,即使在使用多達700B tokens的微調情況下(Llama-7B),REEF仍能達到0.9962的高相似度。
  • REEF對各種剪枝策略都表現出魯棒性,無論結構化剪枝還是非結構化剪枝,REEF都能夠有效識別源模型,即使剪枝比率高達90%,REEF依然能夠成功識別。
  • 無論是基于權重或基于分布的模型合并方法,REEF均能在識別合并模型的來源方面始終保持高準確性。
  • REEF 對任何列排列和縮放變換具有不變性,能夠抵御該類規避技術。

圖片

魯棒且高效:跨數據集和樣本量

作者進一步分析了REEF在不同數據集和不同樣本數量下的表現。

一方面,除了前文提到的TruthfulQA數據集,作者還選擇了SST2、ConfAIde、PKUSafeRLHF和ToxiGen等數據集進行實驗;

另一方面,對于每個數據集,別在樣本數量從10到1000、每隔10的情況下進行采樣,以測試REEF的表現。

結果,REEF在不同數據集上均表現出有效性,對數據集不具強依賴性(圖示在不同數據集上,源模型與衍生模型之間的相似性顯著高于其與無關模型之間的相似性,表明REEF能夠跨數據集穩定識別源模型);

同時,REEF依賴少量樣本即可穩健識別模型指紋,具有高效性(圖示REEF在 200-300 個樣本后結果趨于穩定,表明其可以在較少的樣本數量下實現可靠的指紋識別)。

REEF它不僅保障了模型性能,還平衡了開放性與知識產權之間的關系,能夠確保衍生模型的責任可追溯。

作者相信,REEF將為AI模型保護和知識產權管理設立新的標準,促進更透明、協作的AI社區。

責任編輯:姜華 來源: 量子位
相關推薦

2024-12-16 07:05:00

大模型LLM指紋識別

2016-10-07 21:45:21

2025-07-22 10:45:55

2024-11-08 12:18:39

SynthID谷歌AI

2025-08-25 09:07:00

2018-07-05 17:50:14

AI

2024-04-18 10:39:57

2025-09-28 09:11:00

2013-09-14 19:51:18

2023-06-28 18:52:53

火山引擎智譜AI

2024-11-28 14:45:00

模型研究

2011-07-29 09:22:38

IBM云計算

2023-09-22 09:06:00

模型開源

2025-07-30 09:05:00

AI模型訓練

2025-06-10 11:25:06

主流大模型安全

2023-04-11 10:37:58

AI

2024-01-26 10:19:00

AI模型

2015-01-26 17:43:54

監控監控雷達Range-R隱私安全

2025-06-11 09:19:46

點贊
收藏

51CTO技術棧公眾號

成人精品国产| 欧美成人免费| 激情综合自拍| 亚洲欧美综合精品久久成人| 国产精品扒开腿爽爽爽视频| 久久久久久久久久久久久久久国产| 午夜老司机在线观看| 激情文学综合丁香| 亚洲男人天堂视频| 久久久久xxxx| 亚洲美女尤物影院| 亚洲欧美在线视频观看| 国产精品国产一区二区| 亚洲av中文无码乱人伦在线视色| 欧美日一区二区| 日韩三级视频在线观看| 欧美xxxxx在线视频| 黄色在线视频网站| 成人精品国产福利| 国产一区红桃视频| 青草视频在线观看免费| 最新精品在线| 成人免费在线视频观看| 精品蜜桃传媒| 国产免费av一区二区| 欧美日韩高清| 日韩av在线免播放器| 91热视频在线观看| 成人在线免费电影网站| 亚洲在线视频免费观看| 亚洲欧美日产图| 无码精品视频一区二区三区| 精品亚洲成a人| 国产成人精品久久二区二区| 日本亚洲色大成网站www久久| 久久高清精品| 一本色道久久88亚洲综合88| 五十路六十路七十路熟婆| 久久久国产精品入口麻豆| 欧美亚洲日本一区| 337p粉嫩大胆噜噜噜鲁| 色操视频在线| 亚洲人成在线播放网站岛国 | 国产美女裸体无遮挡免费视频| 久久99青青| 亚洲v中文字幕| 欧美 另类 交| 天天摸天天干天天操| 国产福利一区在线观看| 成人福利视频网| 真实新婚偷拍xxxxx| 三级在线观看一区二区| 日韩一区二区精品视频| 伊人网在线视频观看| 亚洲+变态+欧美+另类+精品| 日韩av一区在线| 波多野结衣影院| 欧美一级三级| 欧美视频你懂的| 日韩一级免费在线观看| 日本欧美日韩| 欧美日精品一区视频| 国产野外作爱视频播放| 成人全视频免费观看在线看| 欧美日免费三级在线| 天天干天天玩天天操| 香蕉久久一区| 日韩精品一区在线观看| 亚洲v在线观看| 电影一区二区在线观看| 日韩成人在线观看| 中文字幕免费高清视频| 亚洲自拍电影| 在线日韩欧美视频| 三级在线观看免费大全| 欧美黄在线观看| 97精品久久久中文字幕免费| 亚洲熟女综合色一区二区三区| 石原莉奈在线亚洲二区| 成人欧美一区二区三区在线湿哒哒 | 91日韩精品视频| 美女国产精品久久久| 亚洲成成品网站| 亚洲欧美激情网| 伊人久久大香| 亚洲成人中文字幕| www.黄色在线| 欧美国产三级| 日本sm极度另类视频| 亚洲天堂免费av| 国产精品18久久久久久vr| 精品久久中出| 调教视频免费在线观看| 亚洲成人资源在线| 天堂在线资源视频| 一区二区三区欧洲区| 亚洲女人天堂成人av在线| 糖心vlog免费在线观看| 亚洲人成免费| 欧美日韩高清在线观看| 黄色在线观看国产| 激情六月婷婷综合| 国产一区二区三区高清视频| 成人亚洲综合天堂| 久久9热精品视频| 高清一区二区三区视频| 精品999视频| 亚洲永久免费视频| 在线看的黄色网址| 成人精品毛片| 日韩在线观看网址| 日韩成人免费观看| 激情综合五月天| 久久一区二区精品| 青青青草视频在线| 欧美女孩性生活视频| 久久人人妻人人人人妻性色av| 五月天久久久| 日韩在线观看免费| 国产又大又黄又粗| 国产91高潮流白浆在线麻豆| 亚洲a级在线观看| 日韩精品视频无播放器在线看 | 91精品又粗又猛又爽| 国产成人视屏| 亚洲人在线视频| 国产精品999久久久| 国产在线观看免费一区| 日韩av电影在线观看| 麻豆国产在线| 亚洲第一福利在线观看| 校园春色 亚洲| 韩国三级在线一区| 亚洲区一区二区三区| 天堂中文在线资源| 亚洲男人的天堂在线aⅴ视频| 在线观看亚洲视频啊啊啊啊| 在线天堂资源www在线污| 亚洲精品一线二线三线无人区| 国产大尺度视频| 999视频精品| 国产精品一区二区性色av | 国产一区二区三区久久精品 | 亚洲午夜伦理| 懂色av一区二区三区在线播放| 九七电影韩国女主播在线观看| 欧美视频三区在线播放| 美国黑人一级大黄| 欧美aⅴ一区二区三区视频| 日产国产精品精品a∨| 欧美少妇精品| 亚洲欧美国内爽妇网| 人妻 日韩精品 中文字幕| 26uuu国产一区二区三区| 日本欧美色综合网站免费| 妞干网免费在线视频| 亚洲国产91色在线| 亚洲 欧美 日韩 综合| 91在线视频观看| 国产偷人视频免费| 成人3d动漫在线观看| 国产精品入口尤物| 成人ww免费完整版在线观看| 日韩一区二区在线观看| 久久精品一区二区三| 中文字幕一区二区三区欧美日韩| 国产日本欧美一区二区三区| 国产一二区在线| 欧美成人a视频| 日韩三级免费看| 久久女同性恋中文字幕| 中文字幕日韩精品久久| 亚洲高清国产拍精品26u| 久久伊人色综合| 东京干手机福利视频| 亚洲不卡av一区二区三区| 黄色短视频在线观看| 日韩电影在线一区二区| 成人免费视频观看视频| a级片免费在线观看| 精品调教chinesegay| 这里只有久久精品视频| 亚洲男同性恋视频| 国产麻豆xxxvideo实拍| 男人的天堂亚洲一区| 国内精品国产三级国产99| 青青操综合网| 国产精品日韩欧美| 青青青草视频在线| 国产午夜精品视频免费不卡69堂| a级片免费观看| 红桃视频成人在线观看| 99在线视频免费| 成人av资源在线观看| 国产精品久久久毛片| 欧美区日韩区| 日韩成人av电影在线| 亚洲综合影院| 国产美女扒开尿口久久久| av人人综合网| 中文字幕日韩欧美精品在线观看| 丰满人妻一区二区| 日本精品视频一区二区三区| 91麻豆免费视频网站| 久久久久久久久久久黄色| 国产在线视频三区| 久久久久综合| 成人一级生活片| 日韩精品诱惑一区?区三区| 国产精品国产三级欧美二区| 日韩久久一区| 日韩免费观看在线观看| 日本在线视频网址| 日韩在线视频网站| 精品视频一二区| 亚洲第一精品久久忘忧草社区| 97国产精品久久久| 色综合久久久久久久久| 日本一区二区不卡在线| 亚洲丝袜美腿综合| 日韩人妻无码精品综合区| 成人夜色视频网站在线观看| 日日干夜夜操s8| 久久九九精品| 国产成人无码a区在线观看视频| 在线一区免费| 椎名由奈jux491在线播放 | 亚洲最新中文字幕| 日漫免费在线观看网站| 精品国产露脸精彩对白| 国产欧美久久久| 欧美情侣在线播放| 日本成人一级片| 在线观看中文字幕不卡| 九九热精品视频在线| 五月天一区二区| 日本天堂在线视频| 无码av免费一区二区三区试看| 欧美日韩精品一区二区三区视频播放| 亚洲欧美一区二区在线观看| 国产精品久久免费观看| 国产亚洲欧美日韩在线一区| 性欧美丰满熟妇xxxx性仙踪林| www.亚洲免费av| 久章草在线视频| 99国产精品| 国产深夜男女无套内射| 日韩香蕉视频| 91视频 -- 69xx| 国产偷自视频区视频一区二区| 日韩 欧美 视频| 91久久亚洲| 欧美一级在线看| 奶水喷射视频一区| 国语对白做受xxxxx在线中国| 久久中文精品| 激情 小说 亚洲 图片: 伦| 麻豆精品在线播放| 中文字幕第三区| 国产成人av网站| 亚洲婷婷在线观看| 26uuu久久天堂性欧美| 极品人妻videosss人妻| 国产精品成人在线观看| 亚洲欧美小视频| 亚洲国产视频直播| 黄色av免费播放| 国产精品久久久久久久第一福利 | 国产精品福利网| 日韩五码电影| 国产精品久久7| 亚洲+变态+欧美+另类+精品| 亚洲精品在线免费| 欧美1区免费| 久色视频在线播放| 日韩av午夜在线观看| 久久精品久久99| aaa亚洲精品| 中文字幕欧美激情极品| 亚洲精品美国一| 九一国产在线观看| 欧美日韩精品一区二区三区蜜桃| 国产麻豆精品一区| 亚洲精品美女久久久| 欧美性猛交xxx乱大交3蜜桃| 欧美国产欧美亚洲国产日韩mv天天看完整| 成人黄色动漫| 国产女人精品视频| 久久精品色播| 一区二区三区国| 亚洲精品韩国| 亚洲欧美久久久久| av电影天堂一区二区在线| 992在线观看| 亚洲成a人片在线观看中文| 中文字幕欧美色图| 亚洲缚视频在线观看| 欧洲日本在线| 日本中文字幕不卡免费| 色妞ww精品视频7777| 成人国产精品久久久久久亚洲| 国语一区二区三区| 一区二区三区四区免费视频| 亚洲美女色禁图| 色18美女社区| 国产亚洲美州欧州综合国| 久视频在线观看| 欧美日韩一区二区三区四区五区| 三级网站在线看| 欧美成人网在线| 亚洲不卡系列| 久久影院理伦片| 国产一区二区三区四区三区四| 欧美黄色性生活| 91麻豆高清视频| 国产 日韩 欧美 成人| 在线成人av影院| а天堂8中文最新版在线官网| 97福利一区二区| 999国产精品一区| 福利网在线观看| 人妖欧美一区二区| 国产精品高清无码在线观看| 亚洲国产精品自拍| 精品国产999久久久免费| 爽爽爽爽爽爽爽成人免费观看| 欧美成人免费电影| 久久久久久久久久久久久久一区| 久久成人av| aa视频在线播放| 亚洲永久网站| 国产精品久久久久久亚洲av| 亚洲欧美日韩人成在线播放| 中文字幕日韩第一页| 亚洲系列中文字幕| 成人动漫一区| 免费成人深夜夜行视频| 日韩一区二区久久| 日本性生活一级片| 一区av在线播放| av网站免费大全| 欧美成人免费网| 亚洲视频一起| 国产在线观看欧美| 天堂在线亚洲视频| 极品粉嫩小仙女高潮喷水久久| 午夜久久久久久久久| 无码精品人妻一区二区三区影院| 国内精品模特av私拍在线观看| 国产精伦一区二区三区| 天天夜碰日日摸日日澡性色av| 成人黄色av电影| 天堂在线免费观看视频| 国产视频一区在线| 亚洲成人一区在线观看| 亚洲免费在线精品一区| 精品一区二区三区免费| 看免费黄色录像| 精品少妇一区二区三区在线播放| 欧美wwww| 欧美高清性xxxxhdvideosex| 久久精品官网| 亚洲天堂av中文字幕| 制服丝袜亚洲色图| 色呦呦在线看| 久久av一区二区三区漫画| 日日嗨av一区二区三区四区| 自拍偷拍第9页| 日韩免费一区二区三区在线播放| www在线看| 青青草成人网| 狠狠v欧美v日韩v亚洲ⅴ| 久久久久久久蜜桃| 亚洲男人7777| 色综合久久久| 黄页网站在线观看视频| 久久久噜噜噜久噜久久综合| 亚洲视频在线观看免费视频| 久久97精品久久久久久久不卡| 欧美人与动xxxxz0oz| 午夜免费一区二区| 亚洲精品一二三区| 亚洲人视频在线观看| 国产精品视频一区二区高潮| 欧美网站在线| 亚洲AV无码国产成人久久| 91麻豆精品国产91久久久久| а√在线中文在线新版| 亚洲人成影视在线观看| 成人精品视频一区二区三区尤物| 日本黄色中文字幕| 欧美黄色片免费观看| 激情婷婷综合| 91精品又粗又猛又爽| 欧美三级欧美一级| 国产福利片在线观看| 亚洲 欧洲 日韩| 2020国产精品自拍| www视频在线| 国产精品爽黄69|