精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大模型知識Out該怎么辦?浙大團隊探索大模型參數(shù)更新的方法—模型編輯

人工智能
不管從何種意義來說,模型編輯預設的問題在未來所謂的“大模型時代”都十分有潛力,模型編輯的問題需要更好的探索如“模型知識究竟存儲在哪些參數(shù)之中”、“模型編輯操作如何不影響其他模塊的輸出”等一系列非常難的問題。

夕小瑤科技說 原創(chuàng) 作者 | 小戲、Python

大模型在其巨大體量背后蘊藏著一個直觀的問題:“大模型應該怎么更新?”

在大模型極其巨大的計算開銷下,大模型知識的更新并不是一件簡單的“學習任務”,理想情況下,隨著世界各種形勢的紛繁復雜的變換,大模型也應該隨時隨地跟上時代的腳步,但是訓練全新大模型的計算負擔卻不允許大模型實現(xiàn)即時的更新,因此,一個全新的概念“Model Editing(模型編輯)”應運而生,以實現(xiàn)在特定領(lǐng)域內(nèi)對模型數(shù)據(jù)進行有效的變更,同時不會對其他輸入的結(jié)果造成不利影響。

圖片

其中, 表示  的“有效鄰居”, 則表示超出  作用范圍的領(lǐng)域。一個編輯后的模型應當滿足以下三點,分別是可靠性,普適性與局部性,可靠性即編輯后模型應該可以正確的輸出編輯前模型錯誤的例子,可以通過編輯案例的平均準確率來衡量,普適性表示對于  的“有效鄰居”,模型都應該可以給出正確的輸出,這點可以對編輯案例領(lǐng)域數(shù)據(jù)集進行均勻抽樣衡量平均正確率來衡量,最后局部性,即表示編輯后模型在超出編輯范圍的例子中仍然應該保持編輯前的正確率,可以通過分別測算編輯前編輯后的平均準確率來對局部性進行刻畫,如下圖所示,在編輯“特朗普”的位置時,一些其他的公共特征不應受到更改。同時,其他實體,例如“國務卿”,盡管與“總統(tǒng)”具有相似的特征,但也不應受到影響。

圖片

而今天介紹的這篇來自浙江大學的論文便站在一個大模型的視角,為我們詳細敘述了大模型時代下模型編輯的問題、方法以及未來,并且構(gòu)建了一個全新的基準數(shù)據(jù)集與評估指標,幫助更加全面確定的評估現(xiàn)有的技術(shù),并為社區(qū)在方法選擇上提供有意義的決策建議與見解:

論文題目:Editing Large Language Models: Problems, Methods, and Opportunities

論文鏈接:https://arxiv.org/pdf/2305.13172.pdf

主流方法

當下針對大規(guī)模語言模型(LLMs)的模型編輯方法如下圖所示主要可以分為兩類范式,分別是如下圖(a)所示的保持原模型參數(shù)不變下使用額外的參數(shù)以及如下圖(b)所示的修改模型的內(nèi)部參數(shù)。

圖片

首先來看相對簡單的增加額外參數(shù)的方法,這種方法又稱基于記憶或內(nèi)存的模型編輯方法,代表方法 SERAC 最早出現(xiàn)于 Mitchell 提出“模型編輯”的論文,其核心思想在于保持模型原始參數(shù)不變,通過一個獨立的參數(shù)集重新處理修改后的事實,具體而言,這類方法一般先增加一個“范圍分類器”判斷新輸入是否處于被“重新編輯”過的事實范圍內(nèi),如果屬于,則使用獨立參數(shù)集對該輸入進行處理,對緩存中的“正確答案”賦予更高的選擇概率。在 SERAC 的基礎上,T-Patcher 與 CaliNET 向 PLMs 的前饋模塊中引入額外可訓練的參數(shù)(而不是額外外掛一個模型),這些參數(shù)在修改后的事實數(shù)據(jù)集中進行訓練以達到模型編輯的效果。

圖片

而另一大類方法即修改原來模型中參數(shù)的方法主要應用一個 ? 矩陣去更新模型中的部分參數(shù) ,具體而言,修改參數(shù)的方法又可以分為“Locate-Then-Edit”與元學習兩類方法,從名字也可以看出,Locate-Then-Edit 方法先通過定位模型中的主要影響參數(shù),再對定位到的模型參數(shù)進行修改實現(xiàn)模型編輯,其中主要方法如 Knowledge Neuron 方法(KN)通過識別模型中的“知識神經(jīng)元”確定主要影響參數(shù),通過更新這些神經(jīng)元實現(xiàn)對模型的更新,另一種名為 ROME 的方法思想與 KN 類似,通過因果中介分析定位編輯區(qū)域,此外還有一種 MEMIT 的方法可以實現(xiàn)對一系列編輯描述的更新。這類方法最大的問題在于普遍依據(jù)一個事實知識局部性的假設,但是這一假設并沒有得到廣泛的驗證,對許多參數(shù)的編輯有可能導致意想不到的結(jié)果。

而元學習方法與 Locate-Then-Edit 方法不同,元學習方法使用 hyper network 方法,使用一個超網(wǎng)絡(hyper network)為另一個網(wǎng)絡生成權(quán)重,具體而言在 Knowledge Editor 方法中,作者使用一個雙向的 LSTM 去預測每個數(shù)據(jù)點為模型權(quán)重帶來的更新,從而實現(xiàn)對編輯目標知識的帶約束的優(yōu)化。這類知識編輯的方法由于 LLMs 的巨大參數(shù)量導致難以應用于 LLMs 中,因此 Mitchell 等又提出了 MEND(Model Editor Networks with Gradient Decomposition)使得單個的編輯描述可以對 LLMs 進行有效的更新,這種更新方法主要使用梯度的低秩分解微調(diào)大模型的梯度,從而使得可以對 LLMs 進行最小資源的更新。與 Locate-Then-Edit 方法不同,元學習方法通常花費的時間更長,消耗的內(nèi)存成本更大。

圖片

方法測評

這些不同方法在模型編輯的兩個主流數(shù)據(jù)集 ZsRE(問答數(shù)據(jù)集,使用反向翻譯生成的問題改寫作為有效領(lǐng)域) 與 COUNTERFACT(反事實數(shù)據(jù)集,將主語實體替換為同義實體作為有效領(lǐng)域) 中進行實驗如下圖所示,實驗主要針對兩個相對以往研究較大的 LLMs T5-XL(3B)和 GPT-J(6B)作為基礎模型,高效的模型編輯器應該在模型性能、推理速度和存儲空間之間取得平衡。

對比第一列微調(diào)(FT)的結(jié)果,可以發(fā)現(xiàn),SERAC 和 ROME 在 ZsRE 和 COUNTERFACT 數(shù)據(jù)集上表現(xiàn)出色,特別是 SERAC,它在多個評估指標上獲得了超過 90% 的結(jié)果,雖然 MEMIT 的通用性不如 SERAC 和 ROME,但在可靠性和局部性上表現(xiàn)出色。而 T-Patcher 方法表現(xiàn)極其不穩(wěn)定,在 COUNTERFACT 數(shù)據(jù)集中具有不錯的可靠性和局部性,但缺乏通用性,在 GPT-J 中,可靠性和通用性表現(xiàn)出色,但在局部性方面表現(xiàn)不佳。值得注意的是,KE、CaliNET 和 KN 的性能表現(xiàn)較差,相對于這些模型在“小模型”中取得的良好表現(xiàn)而言,實驗可能證明了這些方法不是非常適配大模型的環(huán)境。

圖片

而如果從時間來看,一旦訓練好網(wǎng)絡,KE 和 MEND 則表現(xiàn)相當優(yōu)秀,而如 T-Patcher 這類方法耗時則過于嚴重:

圖片

再從內(nèi)存消耗來看,大多數(shù)方法消耗內(nèi)存在同一個量級,但引入額外參數(shù)的方法會承擔額外的內(nèi)存開銷:

圖片

同時,通常對模型編輯的操作還需要考慮批次輸入編輯信息以及順序輸入編輯信息,即一次更新多個事實信息與順序更新多個事實信息,批次輸入編輯信息整體模型效果如下圖所示,可以看到 MEMIT 可以同時支持編輯超過 10000條信息,并且還能保證兩個度量指標的性能都保持穩(wěn)定,而 MEND 和 SERAC 則表現(xiàn)不佳:

圖片

而在順序輸入方面,SERAC 和 T-Patcher 表現(xiàn)出色而穩(wěn)定,ROME,MEMIT,MEND 都出現(xiàn)了在一定數(shù)量的輸入后模型性能快速下降的現(xiàn)象:

圖片

最后,作者在研究中發(fā)現(xiàn),當下這些數(shù)據(jù)集的構(gòu)造及評估指標很大程度上只關(guān)注句子措辭上的變化,但是并沒有深入到模型編輯對許多相關(guān)邏輯事實的更改,譬如如果將“Watts Humphrey 就讀哪所大學”的答案從三一學院改為密歇根大學,顯然如果當我們問模型“Watts Humphrey 大學時期居住于哪個城市?”時,理想模型應該回答安娜堡而不是哈特福德,因此,論文作者在前三個評估指標的基礎上引入了“可移植性”指標,衡量編輯后的模型在知識轉(zhuǎn)移方面的有效性。

圖片

為此,作者使用 GPT-4 構(gòu)建了一個新的數(shù)據(jù)集,通過將原始問題  的答案從  改為 ,并且構(gòu)建另一個正確答案為  的問題 ,組成  三元組,對編輯后模型輸入 ,如果模型可以正確輸出  則證明該編輯后模型具有“可移植性”,而根據(jù)這個方法,論文測試了現(xiàn)有幾大方法的可移植性得分如下圖所示:

圖片

可以看到,幾乎絕大多數(shù)模型編輯方法在可移植性方面都不太理想,曾經(jīng)表現(xiàn)優(yōu)異的 SERAC 可移植性準確率不到 10%,相對最好的 ROME 和 MEMIT 最高也只有 50% 左右,這表明當下的模型編輯方法幾乎難以做到編輯后知識的任何擴展和推廣,模型編輯尚有很長的路要走。

討論與未來

不管從何種意義來說,模型編輯預設的問題在未來所謂的“大模型時代”都十分有潛力,模型編輯的問題需要更好的探索如“模型知識究竟存儲在哪些參數(shù)之中”、“模型編輯操作如何不影響其他模塊的輸出”等一系列非常難的問題。而另一方面,解決模型“過時”的問題,除了讓模型進行“編輯”,還有一條思路在于讓模型“終身學習”并且做到“遺忘”敏感知識,不論是模型編輯還是模型終身學習,這類研究都將對 LLMs 的安全與隱私問題做出有意義的貢獻。

責任編輯:武曉燕 來源: 夕小瑤科技說
相關(guān)推薦

2024-01-02 07:15:59

大模型數(shù)據(jù)庫企業(yè)知識管家

2025-03-17 12:55:18

2024-05-06 07:58:25

大模型AI智慧芽

2025-07-08 03:22:00

大模型參數(shù)AI

2025-07-08 03:11:00

2024-10-24 10:15:00

AI模型

2024-12-23 16:02:39

2024-09-10 08:42:37

2023-11-03 07:47:12

機器資源大模型:

2024-06-17 07:49:53

2024-06-28 16:03:38

2024-02-26 08:15:43

語言模型低代碼

2024-03-11 00:09:00

模型融合場景

2025-04-01 15:35:11

2025-02-21 13:20:00

2023-10-28 13:29:27

2023-06-07 08:22:59

LLM微調(diào)技術(shù)
點贊
收藏

51CTO技術(shù)棧公眾號

丁香花视频在线观看| 成人激情四射网| 国产精品二区不卡| 精品国产一区二区精华| 日本三级免费观看| 美女黄视频在线观看| 成人久久视频在线观看| 国产精品麻豆va在线播放| 丰满少妇被猛烈进入一区二区| 福利在线一区| 欧美性生活一区| 青青草国产免费| h视频网站在线观看| 国产成人久久精品77777最新版本 国产成人鲁色资源国产91色综 | 九九久久精品一区| wwwwww日本| 日韩高清一区| 欧美性生活一区| 亚洲中文字幕无码av永久| 1pondo在线播放免费| 91影院在线免费观看| 91久久精品日日躁夜夜躁国产| 91porny在线| 欧美成人一品| 最近2019中文字幕第三页视频| 国产乱淫av麻豆国产免费| 日本h片久久| 狠狠色狠色综合曰曰| 精品国产一区二区三区在线| 国产精品一区二区婷婷| 91伊人久久大香线蕉| 99se婷婷在线视频观看| 国产精品一区二区av白丝下载| 久久一区亚洲| 午夜精品久久久久久久男人的天堂 | 中文无码精品一区二区三区| 翔田千里一区二区| 久久免费视频网站| 精品小视频在线观看| 五月天激情综合网| www.xxxx欧美| 影音先锋男人看片资源| 大片网站久久| 一区二区福利视频| 日本成人免费视频| 黑丝美女一区二区| 亚洲丝袜av一区| 色一情一交一乱一区二区三区 | 国产不卡网站| 色哟哟一区二区| 999香蕉视频| 国产综合色区在线观看| 欧美专区亚洲专区| 邪恶网站在线观看| 美女色狠狠久久| 欧美日韩一区小说| 老司机久久精品| 高清久久一区| 精品久久久久久无| 人妖粗暴刺激videos呻吟| 久久porn| 亚洲午夜色婷婷在线| 日本免费www| 色婷婷亚洲mv天堂mv在影片| 久久九九国产精品怡红院| 欧美性x x x| 国产一在线精品一区在线观看| 欧美大片网站在线观看| 国产亚洲成人av| aa级大片欧美三级| 国产精品电影在线观看| 中文字幕一区2区3区| 精品写真视频在线观看| 99国精产品一二二线| 少妇高潮一区二区三区99小说| 99久精品国产| 中日韩在线视频| 色屁屁www国产馆在线观看| 亚洲午夜电影在线| chinese少妇国语对白| 全球中文成人在线| 精品国产麻豆免费人成网站| 伊人网伊人影院| 99久久精品费精品国产风间由美| 欧美激情手机在线视频| 久操视频在线免费观看| 国产乱码字幕精品高清av| 国产一区再线| 思思99re6国产在线播放| 一片黄亚洲嫩模| 成人羞羞国产免费网站| 99久久99九九99九九九| 亚洲精品国产综合区久久久久久久 | 国产精品jk白丝蜜臀av小说| 国产一区二区三区在线观看视频| 久久中文免费视频| 久久经典综合| 97netav| av网站在线免费播放| 亚洲综合久久久久| 九九热免费精品视频| av成人男女| 国产一区二区三区在线看| 劲爆欧美第一页| 免费一级片91| 欧美lavv| 久草在线视频福利| 欧美日韩成人在线| 国产黄色网址在线观看| 国内精品99| 国产精品永久免费在线| 天堂中文在线8| 亚洲自拍偷拍麻豆| 亚洲精品视频三区| 久久av免费| 国模私拍视频一区| www.超碰在线.com| 中文字幕亚洲一区二区av在线| 日本一道本久久| 91精品啪在线观看国产爱臀| 色婷婷成人综合| 国产又粗又猛又黄视频| 99国产精品久| av女优在线播放| 国产一区二区高清在线| 一区二区成人精品| 久操视频在线免费观看| 91免费在线视频观看| 成年人网站国产| 欧美影院精品| 久久国产精品影片| 在线观看免费中文字幕| 国产日韩三级在线| 啊啊啊一区二区| 麻豆国产欧美一区二区三区r| 欧美成人性色生活仑片| 136福利视频导航| 国产精品免费观看视频| 免费黄色一级网站| 欧美日韩一区二区综合| 国产91精品久久久久久久| 午夜影院免费视频| 精品国产成人在线| 国产中文字幕一区二区| 亚洲日本黄色| 久久久久久亚洲精品不卡4k岛国| 欧美freesex黑人又粗又大| 亚洲国产天堂久久综合| 中日韩黄色大片| 91丝袜呻吟高潮美腿白嫩在线观看| 日韩av中文字幕第一页| 欧美激情影院| 日本精品视频在线播放| 精品久久久久一区二区三区| 91福利在线观看| 四季av中文字幕| 精品亚洲成a人| 欧美久久久久久久久久久久久久| 999精品视频在这里| 久久久久久久久久国产精品| 天天干在线观看| 色婷婷综合久久久久中文 | 国产精品美乳一区二区免费| 国产精品国产高清国产| 在线一区二区视频| а天堂中文在线资源| 精品一区二区三区免费播放| 久久综合亚洲精品| 精品欧美午夜寂寞影院| 日本精品视频在线| 国内精品久久久久国产| 精品国产乱码久久久久久图片| 日本在线观看视频网站| 国产蜜臀97一区二区三区| 天天摸天天舔天天操| 亚洲国内欧美| 视频一区二区综合| 精品视频一二| 欧美一区二区三区……| 日本综合在线| 欧美精品一区二区三区在线 | 久久免费高清| 一区二区三区四区久久| 美日韩黄色大片| 国产精品视频区1| 精精国产xxxx视频在线中文版| 日韩国产在线看| 国产又粗又猛又爽又黄的视频一| 亚洲一卡二卡三卡四卡无卡久久| 日韩精品无码一区二区三区久久久| 美女久久久精品| 东北少妇不带套对白| 精品av一区二区| 成人91视频| 视频精品导航| 久久久久久久色| 成人77777| 亚洲国产精品成人av| 波多野结衣网站| 亚洲韩国精品一区| 人人干在线观看| 91免费国产在线观看| 亚洲va在线va天堂va偷拍| 国产欧美一区二区三区国产幕精品| 一本一道久久久a久久久精品91| 51亚洲精品| 成人福利在线观看| 欧美freesex| 欧美国产日韩一区| 老司机精品影院| 亚洲精品色婷婷福利天堂| 性做久久久久久久| 欧美日韩一区二区三区高清| 国产又色又爽又黄的| 亚洲视频你懂的| 五月婷婷欧美激情| 97久久超碰国产精品电影| www.久久com| 韩国三级中文字幕hd久久精品| 日本wwww视频| 在线欧美视频| 97超碰在线视| 国产精品久久久久久影院8一贰佰 国产精品久久久久久麻豆一区软件 | 国产一区二区片| 51精产品一区一区三区| 亚洲欧美日韩精品在线| 国产麻豆精品久久| 久久福利电影| 99re8这里有精品热视频免费| 成人精品久久久| 国产成人a视频高清在线观看| 欧美在线视频一区| 欧美少妇精品| 国外成人性视频| 超碰激情在线| 久久久久久久久久久亚洲| 日本中文字幕中出在线| 久久成人在线视频| a免费在线观看| 欧美不卡视频一区发布| aa在线视频| 色综合久久中文字幕综合网小说| 黄网站免费在线观看| 久久精品视频99| 国产原创精品视频| 久久九九精品99国产精品| 含羞草www国产在线视频| 久久影院模特热| 99自拍视频在线观看| 欧美日韩国产成人在线观看| 日本伦理一区二区| 久久久久久国产精品美女| heyzo中文字幕在线| 97免费在线视频| 特黄毛片在线观看| 国产成人精品久久亚洲高清不卡| 欧美黑人一区| 国产精品亚洲综合天堂夜夜| 亚洲我射av| 97操在线视频| 日本妇女一区| 色一情一乱一伦一区二区三区丨| 成人三级视频| 国产精品一区在线免费观看| 精品96久久久久久中文字幕无| 国产精品国产对白熟妇| 噜噜噜躁狠狠躁狠狠精品视频| 日日碰狠狠躁久久躁婷婷| 青草av.久久免费一区| 日本77777| 成人高清伦理免费影院在线观看| 9.1成人看片| 国产欧美久久久精品影院| 亚洲人与黑人屁股眼交| 亚洲一二三四在线| 日本特级黄色片| 在线不卡a资源高清| 亚洲国产成人一区二区| 亚洲精品在线91| 毛片在线播放a| 2019中文字幕免费视频| jizzjizz少妇亚洲水多| 成人欧美一区二区三区在线观看 | 一级二级三级欧美| 好看的日韩av电影| 久久黄色免费看| 国产精品18久久久久久vr| 成年人在线观看av| 亚洲欧洲制服丝袜| 久久艹免费视频| 91麻豆精品国产| 免费在线性爱视频| 欧美成人激情在线| 欧洲一级精品| 国产另类第一区| 欧美xxxxx视频| 欧美成人三级在线视频| 国产主播一区二区三区| 91精品小视频| 亚洲欧美国产三级| 国产污视频网站| 亚洲第一免费网站| 麻豆传媒视频在线| 日韩av电影在线网| 亚洲国产一区二区三区网站| 日产精品久久久一区二区| 国产在线日韩| www.com久久久| 26uuu国产日韩综合| 曰本女人与公拘交酡| 在线观看一区二区视频| 黄片毛片在线看| 欧美成人精品一区二区三区| 欧美男体视频| 国模精品一区二区三区| 亚洲最新av| 国产九九热视频| 久久久99精品免费观看不卡| 五月天综合在线| 日韩欧美一区二区免费| 亚洲成人三级| 国产成人精品综合久久久| 久久夜色精品国产噜噜av小说| 黄色免费高清视频| 免费日本视频一区| 欧美黄色激情视频| 色94色欧美sute亚洲13| 深夜福利在线视频| 久久青草福利网站| 9999久久久久| 国产a级黄色大片| 蜜桃精品在线观看| 蜜臀久久99精品久久久久久| 亚洲va欧美va国产va天堂影院| wwwwww国产| 国产婷婷成人久久av免费高清| 川上优av中文字幕一区二区| 999国内精品视频在线| 日本女优一区| 在线免费观看av的网站| 中文字幕精品一区二区精品绿巨人| 国产www在线| 亚洲欧洲一区二区三区在线观看| 午夜不卡影院| 久久久久se| 免费亚洲视频| xxxx日本黄色| 一本色道久久综合狠狠躁的推荐| 亚洲欧美丝袜中文综合| 55夜色66夜色国产精品视频| 天天久久夜夜| 成年人小视频网站| 国产精品每日更新| 国产精品怡红院| 久热精品视频在线免费观看| 免费观看亚洲视频大全| 九一免费在线观看| 不卡的电视剧免费网站有什么| 亚洲欧美在线视频免费| 亚洲精品自产拍| 欧美大片1688网站| 宅男一区二区三区| 国产91精品露脸国语对白| 色婷婷av国产精品| 亚洲天堂日韩电影| 日韩毛片免费看| www.国产亚洲| 久久综合99re88久久爱| 在线观看黄色国产| 欧美俄罗斯乱妇| 中日韩免视频上线全都免费| 亚洲成色www.777999| 亚洲色图.com| 污视频软件在线观看| 国产精品海角社区在线观看| 91精品91| av无码一区二区三区| 日本高清无吗v一区| 婷婷视频在线| 国产精品国产精品| 久久蜜桃精品| 亚洲熟女www一区二区三区| 日韩av最新在线| 欧美一级在线| 国产免费成人在线| 亚洲欧洲成人av每日更新| 国精产品乱码一区一区三区四区| 国产精品国产亚洲伊人久久| 欧美激情第二页| 中文字幕丰满孑伦无码专区| 欧美精品视频www在线观看| 超碰91在线观看| 综合一区中文字幕| 久久青草国产手机看片福利盒子| 一区二区日韩视频| 5278欧美一区二区三区| 中文字幕亚洲综合久久五月天色无吗''| 国产精品久久无码| 9191久久久久久久久久久| 韩国美女久久|