精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大模型可解釋性你能理得清嗎?綜述已來,一文解你疑惑

人工智能
近期,中美多家研究機構聯合發布了大模型可解釋性技術的綜述,分別對傳統的 fine-tuning 模型和基于 prompting 的超大模型的可解釋性技術進行了全面的梳理,并探討了模型解釋的評估標準和未來的研究挑戰。

大規模語言模型在自然語言處理方面展現出令人驚訝的推理能力,但其內在機理尚不清晰。隨著大規模語言模型的廣泛應用,闡明模型的運行機制對應用安全性、性能局限性和可控的社會影響至關重要。

近期,中美多家研究機構(新澤西理工學院、約翰斯?霍普金斯大學、維克森林大學、佐治亞大學、上海交大、百度等)聯合發布了大模型可解釋性技術的綜述,分別對傳統的 fine-tuning 模型和基于 prompting 的超大模型的可解釋性技術進行了全面的梳理,并探討了模型解釋的評估標準和未來的研究挑戰。

  • 論文鏈接:https://arxiv.org/abs/2309.01029
  • Github 鏈接:https://github.com/hy-zhao23/Explainability-for-Large-Language-Models

解釋大模型的難點在什么地方?

為何解釋大模型有點難?大語言模型在自然語言處理任務上的驚艷表現引起了社會廣泛的關注。與此同時,如何解釋大模型在跨任務中令人驚艷的表現是學術界面臨的迫切挑戰之一。不同于傳統的機器學習或者深度學習模型,超大的模型架構和海量的學習資料使得大模型具備了強大的推理泛化能力。大語言模型 (LLMs) 提供可解釋性的幾個主要難點包括:

  • 模型復雜性高。區別于 LLM 時代之前的深度學習模型或者傳統的統計機器學習模型,LLMs 模型規模巨大,包含數十億個參數,其內部表示和推理過程非常復雜,很難針對其具體的輸出給出解釋。
  • 數據依賴性強。LLMs 在訓練過程中依賴大規模文本語料,這些訓練數據中的偏見、錯誤等都可能影響模型,但很難完整判斷訓練數據的質量對模型的影響。
  • 黑箱性質。我們通常把 LLMs 看做黑箱模型,即使是對于開源的模型來說,比如 Llama-2。我們很難顯式地判斷它的內部推理鏈和決策過程,只能根據輸入輸出進行分析,這給可解釋性帶來困難。
  • 輸出不確定性。LLMs 的輸出常常存在不確定性,對同一輸入可能產生不同輸出,這也增加了可解釋性的難度。
  • 評估指標不足。目前對話系統的自動評估指標還不足以完整反映模型的可解釋性,需要更多考慮人類理解的評估指標。

大模型的訓練范式

為了更好的歸納總結大模型的可解釋性,我們將 BERT 及以上級別的大模型的訓練范式分為兩種:1)傳統 fine-tuning 范式;2)基于 prompting 的范式。

1.傳統 fine-tuning 范式

對于傳統 fine-tuning 范式,首先在一個較大的未標記的文本庫上預訓練一個基礎語言模型,再通過來自特定領域的標記數據集進行 fine-tuning。常見的此類模型有 BERT, RoBERTa, ELECTRA, DeBERTa 等。

2.基于 prompting 的范式

基于 prompting 的范式通過使用 prompts 實現 zero-shot 或者 few-shot learning。與傳統 fine-tuning 范式相同,需要預訓練基礎模型。但是,基于 prompting 范式的微調通常由 instruction tuning 和 reinforcement learning from human feedback (RLHF) 實現。常見的此類模型包括 GPT-3.5, GPT 4, Claude, LLaMA-2-Chat, Alpaca, Vicuna 等。其訓練流程如下圖:

基于傳統 fine-tuning 范式的模型解釋

基于傳統 fine-tuning 范式的模型解釋包括對單個預測的解釋(局部解釋)和對模型結構級別組分如神經元,網絡層等的解釋(全局解釋)。

1.局部解釋

局部解釋對單個樣本預測進行解釋。其解釋方法包括特征歸因(feature attribution)、基于注意力機制的解釋(attention-based)、基于樣本的解釋(example-based)、基于自然語言的解釋(natural language explanation)。

(1) 特征歸因旨在衡量每個輸入特征(例如單詞、短語、文本范圍)與模型預測的相關性。特征歸因方法可以分類為:

  • 基于擾動的解釋,通過修改其中特定的輸入特征觀察對輸出結果的影響;
  • 基于梯度的解釋,將輸出對輸入的偏微分作為相應輸入的重要性指標;
  • 替代模型,使用簡單的人類可理解的模型去擬合復雜模型的單個輸出,從而獲取各輸入的重要性;
  • 基于分解的技術,旨在將特征相關性得分進行線性分解。

(2) 基于注意力的解釋:注意力通常被作為一種關注輸入中最相關部分的途徑,因此注意力可能學習到可以用于解釋預測的相關性信息。常見的注意力相關的解釋方法包括:

  • 注意力可視化技術,直觀地觀察注意力分數在不同尺度上的變化;
  • 基于函數的解釋,如輸出對注意力的偏微分。然而,學術界對于將注意力作為一個研究角度依然充滿爭議。

(3) 基于樣本的解釋從個例的角度對模型進行探測和解釋,主要分為:對抗樣本和反事實樣本。

  • 對抗樣本是針對模型對微小變動非常敏感的特性而生成的數據,自然語言處理中通常通過修改文本得到,人類難以區別的文本變換通常會導致模型產生不同的預測。
  • 反事實樣本則是通過將文本進行如否定的變形,通常也是對模型因果推斷能力的檢測。

(4) 自然語言解釋使用原始文本和人工標記的解釋進行模型訓練,使得模型可以生成自然語言解釋模型的決策過程。

2.全局解釋

全局解釋旨在從模型構成的層面包括如神經元,隱藏層和更大的組塊,為大模型的工作機制提供更高階的解釋。主要探究在不同網絡構成部分學習到的語義知識。

  • 基于探針的解釋 探針解釋技術主要基于分類器進行探測,通過在預訓練模型或者微調模型上訓練一個淺層分類器,然后在一個 holdout 數據集上進行評估,使得分類器能夠識別語言特征或推理能力。
  • 神經元激活 傳統神經元激活分析只考慮一部分重要的神經元,再學習神經元與語義特性之間的關系。近來,GPT-4 也被用于解釋神經元,不同于選取部分神經元進行解釋,GPT-4 可以用于解釋所有的神經元。
  • 基于概念的解釋 將輸入先映射到一組概念中,再通過測量概念對預測的重要性來對模型進行解釋。

基于 prompting 范式的模型解釋

基于 prompting 范式的模型解釋,需要對基礎模型和助手模型分別解釋以區別兩種模型的能力,并探究模型學習的路徑。其探究的問題主要包括:為模型提供解釋對 few-shot learning 的益處;理解 few-shot learning 和思維鏈能力的來源。

1.基礎模型解釋

  • 解釋對模型學習的好處 探究在 few-shot learning 的情況下解釋是否對模型學習有幫助。
  • 情境學習 探究情境學習在大模型中的作用機制,以及區分情境學習在大模型中和中等模型中的區別。
  • 思維鏈 prompting 探究思維鏈 prompting 提高模型的表現的原因。

2.助手模型解釋

  • Fine-tuning 的角色 助手模型通常先經過預訓練獲得通用語義知識,在通過監督學習和強化學習獲取領域內知識。而助手模型的知識主要來源于哪個階段依然有待研究。
  • 幻覺與不確定性 大模型預測的準確性和可信度依然是目前研究的重要課題。盡管大模型的推理能力強大,但其結果常常出現錯誤信息和幻覺。這種預測的不確定性為其廣泛應用帶來了巨大的挑戰。

模型解釋的評估

模型解釋的評估指標包含合理性 (plausibility),忠實度 (faithfulness),穩定性 (stability),魯棒性 (robustness) 等。論文主要講述了兩個被廣泛關注的圍度:1)對人類的合理性;2)對模型內在邏輯的忠實度。

對傳統 fine-tuning 模型解釋的評估主要集中在局部解釋上。合理性通常需要將模型解釋與人工標注的解釋按照設計的標準進行測量評估。而忠實性更注重量化指標的表現,由于不同的指標關注模型或數據的方面不同,對于忠實性的度量依然缺乏統一的標準。基于 prompting 模型解釋的評估則有待進一步的研究。

未來研究挑戰

1.缺乏有效的正確解釋

其挑戰來源于兩個方面:

  • 缺乏設計有效解釋的標準;
  • 有效解釋的缺乏導致對解釋的評估同樣缺乏支撐。

2.涌現現象的根源未知

對大模型涌現能力的探究可以分別從模型和數據的角度進行,從模型的角度,1)引起涌現現象的模型結構;2)具備跨語言任務超強表現的最小模型尺度和復雜度。從數據的角度,1)決定特定預測的數據子集;2)涌現能力與模型訓練和數據污染的關系;3)訓練數據的質量和數量對預訓練和微調各自的影響。

3.Fine-tuning 范式與 prompting 范式的區別

兩者在 in-distribution 和 out-of-distribution 的不同表現意味著不同的推理方式。1)在數據同分布(in-distribution)之下,其推理范式的不同之處;2)在數據不同分布的情況下,模型魯棒性的差異根源。

4.大模型的捷徑學習問題

兩種范式之下,模型的捷徑學習問題存在于不同的方面。盡管大模型由于數據來源豐富,捷徑學習的問題相對緩和。闡明捷徑學習形成的機理并提出解決辦法對模型的泛化依然重要。

5.注意力冗余

注意力模塊的冗余問題在兩種范式之中廣泛存在,對注意力冗余的研究可以為模型壓縮技術提供一種解決方式。

6.安全性和道德性

大模型的可解釋性對控制模型并限制模型的負面影響至關重要。如偏差、不公平、信息污染、社會操控等問題。建立可解釋的 AI 模型可以有效地避免上述問題,并形成符合道德規范的人工智能系統。

責任編輯:趙寧寧 來源: 機器之心
相關推薦

2019-08-29 18:07:51

機器學習人工智能

2024-05-28 08:00:00

人工智能機器學習

2023-03-07 16:48:54

算法可解釋性

2022-04-13 15:10:22

AI決策

2024-12-16 07:30:00

2021-01-08 10:47:07

機器學習模型算法

2019-03-28 09:26:26

數據科學模型機器學習

2018-04-02 10:28:10

iOSPWA蘋果

2025-01-13 08:13:18

2024-09-18 05:25:00

可解釋性人工智能AI

2023-06-25 13:28:21

2022-06-14 14:48:09

AI圖像GAN

2020-11-10 10:26:16

串口打印工具

2025-05-30 05:00:00

AI模型數據訓練

2022-09-29 10:26:59

iOSScaffoldflutter

2018-05-23 10:23:18

數據系統機器學習

2023-05-04 07:23:04

因果推斷貝葉斯因果網絡

2023-03-10 22:08:20

2025-02-28 06:35:47

2023-05-16 12:11:22

點贊
收藏

51CTO技術棧公眾號

嫩草av久久伊人妇女超级a| 久久手机视频| 久久免费在线观看视频| 日韩三级毛片| 在线国产电影不卡| 久久久无码中文字幕久...| 亚洲人妻一区二区| 久久99国内精品| 午夜精品久久久久久久99热浪潮| 久久久久亚洲av成人无码电影| 国产精品免费精品自在线观看| 亚洲国产精品尤物yw在线观看| 欧美日韩中文国产一区发布| 99久久精品国产色欲| 欧美综合二区| 欧美激情在线观看| 中文天堂资源在线| 欧美日韩一区二区三区在线电影 | www.国产精品一区| 在线观看精品一区| 欧美一区二区中文字幕| 成码无人av片在线观看网站| 久久免费国产精品| 超碰国产精品久久国产精品99| 日韩在线视频不卡| 日韩视频不卡| 九九热精品在线| av片在线免费看| 亚洲第一论坛sis| 日韩一区二区三区电影| av网站在线不卡| 正在播放日韩精品| 亚洲动漫第一页| 91免费视频黄| 在线日本视频| 中文av一区二区| 日本欧洲国产一区二区| 婷婷综合激情网| 另类综合日韩欧美亚洲| 国产精品va在线| 一级成人黄色片| 亚洲三级网站| 国内外成人免费激情在线视频网站 | 国产精品污视频| 日本不卡视频在线观看| 热re91久久精品国99热蜜臀| 日本五十熟hd丰满| 激情综合激情| 久久久久久亚洲| 国产一级在线观看视频| 精品动漫3d一区二区三区免费| 美女av一区二区| 无码黑人精品一区二区| 亚洲精品极品少妇16p| 中文字幕在线观看亚洲| 亚洲图片第一页| 欧美h版在线| 久久久国产在线视频| 国产探花在线视频| 偷拍欧美精品| 美女视频黄免费的亚洲男人天堂| www.av免费| 综合天堂久久久久久久| 欧美大片免费观看| 可以免费看的av毛片| 久久综合婷婷| 国产盗摄xxxx视频xxx69| 无码人妻丰满熟妇区五十路 | 日韩av不卡在线| 亚洲男人天堂网址| 久久精品国产在热久久| 91久久久国产精品| 蜜臀久久久久久999| 99re8在线精品视频免费播放| 久久久久久国产精品免费免费| 男人av在线| 国产精品久久久久久久久免费丝袜 | 亚洲久久一区二区| 国产成人精品av| 国产精品女人久久久| 国产91精品露脸国语对白| 久久国产精品一区二区三区四区| 黄色av网站在线| 亚洲人成网站色在线观看| 日韩精品视频在线观看视频| 都市激情亚洲综合| 777精品伊人久久久久大香线蕉| 视频区 图片区 小说区| 欧美成人一区在线观看| 色综合伊人色综合网站| 九九热精彩视频| 麻豆精品网站| 成人国产精品一区二区| 天天干天天摸天天操| 中文字幕第一区| 精品无码一区二区三区爱欲| 欧美日韩免费观看视频| 日韩精品最新网址| 国产av自拍一区| 欧美久久成人| 国产精品久久久久久久久久| 亚洲女人18毛片水真多| 日本一区二区免费在线| 国产一二三区在线播放| 日韩av电影资源网| 亚洲成人激情在线| www.av免费| 日韩高清在线观看| 国产日韩一区二区| 国产美女av在线| 一本色道久久综合精品竹菊| 久久av一区二区三| 色乱码一区二区三区网站| 97精品一区二区三区| 99热这里只有精品在线观看| 久久久久久久综合色一本| 欧美日韩激情四射| 激情久久一区二区| 亚洲四色影视在线观看| 日韩精品久久久久久久酒店| 国产一区二区日韩精品| 色噜噜一区二区| 国产福利片在线观看| 欧美一级艳片视频免费观看| 黄色片网站免费| 中文在线不卡| 国产在线精品日韩| 欧美黑人xx片| 日韩视频一区在线观看| 日韩欧美在线视频播放| 日韩二区在线观看| 日本成人三级电影网站| xxxxx性欧美特大| 亚洲精品成人av| 国产精品第108页| 粉嫩久久99精品久久久久久夜| 国产人妻互换一区二区| 日日夜夜一区| 精品国产一区二区三区在线观看 | 大香伊人久久| 精品国产sm最大网站免费看| 久久久久成人网站| 国产成人免费视频精品含羞草妖精| 丰满女人性猛交| 日韩一区二区三区四区五区| 最好看的2019年中文视频| 伊人成年综合网| 亚洲国产精品成人综合 | 国产成人超碰人人澡人人澡| 日韩人妻精品一区二区三区| 免费看日产一区二区三区| 欧美成人精品一区二区三区| 国产剧情久久久| 一区二区三区不卡视频| 国产精品19p| 亚洲欧美伊人| 成人欧美一区二区| av漫画网站在线观看| 日韩激情av在线播放| 久久久久99精品成人片三人毛片| 2023国产一二三区日本精品2022| 国产精品沙发午睡系列| 综合色就爱涩涩涩综合婷婷| 国产精品久久久久久久久久久久 | 久久久久久久久网站| 黑人乱码一区二区三区av| 午夜精品视频一区| 日韩中文字幕电影| 蜜桃传媒麻豆第一区在线观看| 一区二区三区四区国产| 九九99久久精品在免费线bt| 久久久久久国产精品三级玉女聊斋| 老司机午夜福利视频| 一本色道综合亚洲| 久久久精品少妇| 成人晚上爱看视频| 韩国一区二区av| 久久社区一区| 国严精品久久久久久亚洲影视| 欧美日韩视频免费观看| 九九视频这里只有精品| 四虎影视精品成人| 欧美久久久久免费| 日本一级淫片色费放| 国产欧美日韩另类视频免费观看| 亚洲理论中文字幕| 99精品欧美| 国产成年人在线观看| 好吊妞视频这里有精品| 91在线小视频| 欧美在线观看你懂的| 韩国一区二区三区四区| 午夜亚洲视频| 黄色网络在线观看| 亚洲精品国产setv| 2014亚洲精品| 性高爱久久久久久久久| 欧美日韩第一视频| 黑人与亚洲人色ⅹvideos| 欧美成人一区二区三区在线观看| 好吊色在线视频| 亚洲午夜久久久久| 熟女少妇a性色生活片毛片| 91丨porny丨蝌蚪视频| 加勒比av中文字幕| 亚洲欧美日韩国产一区| 日本福利视频在线观看| 精品国产一区二区三区久久久蜜臀| 91久久偷偷做嫩草影院| 久久久免费人体| 热99精品只有里视频精品| 日本一级理论片在线大全| 国产亚洲精品一区二区| 午夜黄色小视频| 精品国产免费视频| 国产一区二区在线视频观看| 色婷婷久久久亚洲一区二区三区| 国产一国产二国产三| 中文字幕亚洲欧美在线不卡| 在线小视频你懂的| 91色porny在线视频| 妖精视频一区二区| 国产精品888| 日本中文字幕二区| 秋霞国产午夜精品免费视频| 日本精品免费在线观看| 18成人免费观看视频| 日本免费黄色小视频| 亚洲精品二区三区| japanese在线视频| 三区四区不卡| 在线看成人av电影| 成人在线一区| 日韩国产欧美精品| 国产欧美日韩精品一区二区三区 | 亚洲色图另类专区| 四虎影视1304t| 中文字幕国产一区二区| 亚洲午夜精品久久久久久高潮| 久久久一区二区三区| 国产精品无码午夜福利| 久久蜜臀精品av| 精品国产av无码| 国产亚洲一区二区在线观看| 免费看黄色aaaaaa 片| 久久综合狠狠综合久久综合88| 日批在线观看视频| 久久亚洲综合av| av女人的天堂| 亚洲国产高清aⅴ视频| 三区四区在线观看| 国产精品久久久久婷婷| 精品亚洲乱码一区二区| 亚洲另类在线视频| 久久久久亚洲av成人片| 五月婷婷综合网| 亚洲欧美另类在线视频| 欧美性大战久久| 国产一区二区三区四区视频| 欧美一区二区三区日韩| 成人毛片视频免费看| 日韩av网站电影| 免费在线国产| 精品国产一区久久久| 亚洲区欧洲区| 欧美在线视频在线播放完整版免费观看 | 人妻一区二区三区免费| 亚洲女人天堂av| 91社区在线观看播放| 免费不卡欧美自拍视频| √8天堂资源地址中文在线| 欧美自拍视频在线| 黄色欧美视频| 国产精品久久久久免费| 你微笑时很美电视剧整集高清不卡| 日韩久久久久久久久久久久久| 亚洲无中文字幕| 国产黄页在线观看| 久久er99热精品一区二区| av漫画在线观看| 久久精品亚洲一区二区三区浴池 | 99高清视频有精品视频| 女同另类激情重口| 亚洲精品久久区二区三区蜜桃臀| 一区二区三区毛片免费| aa在线免费观看| 国产精品一级二级三级| 精品一区二区视频在线观看| 欧美国产精品一区二区三区| 久草视频在线资源站| 色婷婷激情久久| 国产欧美第一页| 亚洲欧美精品一区| 伦理av在线| 国产精品久久久久久五月尺| 成人影院中文字幕| 亚洲国产婷婷香蕉久久久久久99| 欧美激情五月| 色乱码一区二区三区在线| 成人午夜看片网址| 永久免费看mv网站入口| 一本色道亚洲精品aⅴ| www男人的天堂| 日韩在线观看免费全集电视剧网站| 538视频在线| 91精品视频在线免费观看| 日韩av网址大全| wwwwww欧美| 久久国产综合精品| 无码国产69精品久久久久同性| 亚洲国产美女搞黄色| 国产欧美久久久| 日韩中文在线观看| 毛片免费看不卡网站| 国产精品18毛片一区二区| 欧美mv日韩| 中文字幕av专区| 久久久不卡影院| 天天干天天干天天干天天| 精品国产污污免费网站入口| 中文字幕中文字幕在线十八区 | 免费av网站观看| 欧美精品中文字幕一区| 久久女人天堂| 色一情一乱一伦一区二区三区丨 | 亚洲电影av| 妖精视频在线观看| 亚洲色图一区二区三区| 一级视频在线播放| 中文字幕av一区二区三区谷原希美| 免费电影日韩网站| 久久99蜜桃综合影院免费观看| 韩国久久久久| 妖精视频在线观看| 亚洲美女视频在线观看| 国产精品日韩无码| www.久久撸.com| 欧美9999| 奇米777四色影视在线看| 国产不卡一区视频| 精品无码m3u8在线观看| 精品久久久久久久一区二区蜜臀| 羞羞网站在线看| 91在线精品观看| 在线看片日韩| 丰满大乳奶做爰ⅹxx视频| 婷婷久久综合九色综合绿巨人| 人妻一区二区三区| 欧美亚洲另类视频| 国产伦精品一区二区三区千人斩| 久久久久久香蕉| 中文字幕精品一区二区三区精品| 伊人久久一区二区| www.欧美精品| 精品国产鲁一鲁****| 少妇一晚三次一区二区三区| 岛国精品一区二区| 日韩字幕在线观看| 亚洲欧美中文另类| 福利一区二区| 热久久最新地址| 成人高清视频在线| 国产嫩bbwbbw高潮| 中日韩美女免费视频网址在线观看| 国精品产品一区| 老司机激情视频| 久久久久国产精品麻豆ai换脸| 中文字幕男人天堂| 欧美成人在线影院| 天天操综合520| 国产九九在线观看| 一区二区三区**美女毛片| 亚洲色图21p| 国产精品一区二区三区久久久| 亚洲综合色站| 国产精品无码毛片| 欧美日韩国产精品成人| 欧美女同一区| 欧美三日本三级少妇三99| 国产一区二区三区在线观看免费| 精品在线视频免费观看| 亚洲天堂2020| 91精品日本| 国产天堂在线播放| 一区二区在线电影| 毛片免费在线播放| 97se视频在线观看| 日韩国产成人精品| 国产亚洲精品久久777777| 亚洲午夜激情免费视频| 午夜视频在线观看精品中文| 一本久道中文无码字幕av| 亚洲欧美另类久久久精品2019| 视频二区在线| 97人人模人人爽人人喊38tv| 日韩在线a电影| 日韩成人在线免费视频| 日韩中文字幕网址| 国产欧美一区| 国产白袜脚足j棉袜在线观看 |