精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

未來將出現一個完全可解釋的GPT-3!OpenAI 華人一作重磅突破:首次揭秘AI內部的“微觀機制”,電路越小,模型越可解釋

原創 精選
人工智能
大家都知道,如今GPT、Claude等LLM越來越強大,寫文章、生成代碼、做推理,樣樣不在話下。但是,模型內部是如何“思考”的?這一直是一個黑箱問題。

編輯 | 聽雨

出品 | 51CTO技術棧(微信號:blog51cto)

就在幾個小時前,OpenAI發布了一篇重磅的最新研究,構建了一個實驗性的大語言模型,并且提出稀疏訓練+剪枝+橋接的新方法,讓原本黑箱的LLM內部機制可視化了。

大家都知道,如今GPT、Claude等LLM越來越強大,寫文章、生成代碼、做推理,樣樣不在話下。但是,模型內部是如何“思考”的?這一直是一個黑箱問題。

打個比方,傳統神經網絡的工作方式就像一堆糾纏在一起的電線:每個神經元與成千上萬個神經元相連,信號在其中不斷流動、疊加。這些連接雖然能讓模型學習復雜模式,但也形成了人類難以解讀的、高度密集的連接網絡。

圖片圖片

解釋 Transformer 的一個主要難點在于:其激活與權重并不直接可理解。例如,神經元會以難以預測的方式激活,這些激活模式往往并不對應于人類可理解的概念。

而OpenAI的最新研究,通過對語言模型進行極度稀疏權重訓練,“解開”了模型內部的機制。他們構建了一個權重稀疏的 Transformer模型,比 GPT-5、Claude 或 Gemini等主流模型要小得多。論文第一作者Leo Gao表示,它的性能大致相當于2018年的GPT-1。

相對于常規模型來說,更透明的模型有助于揭示語言模型為何會出現幻覺、行為不可預測,或在關鍵情況下做出不可靠的判斷。

圖片圖片

論文相關代碼已公開:https://github.com/openai/circuit_sparsity/

一、稀疏訓練:從“電線堆”到清晰電路

OpenAI提出對Transformer模型進行“稀疏訓練”方法,其核心思路在于:絕大多數權重設為零,讓每個神經元只連接少數節點,這樣網絡內部的信號不再在成千上萬個節點之間糾纏,而是沿著少量路徑傳遞。

他們首先在標準 Transformer 架構( GPT?2 風格)上訓練模型,并強制絕大多數權重為 0(L0 范數很小),讓每個神經元只連接少數其他神經元。

圖片圖片

二、電路可解釋性:AI任務的“微觀機制”

為了驗證稀疏訓練的效果,研究者設計了一些簡單任務,讓模型完成特定操作,例如:

  1. Python引號閉合任務:輸入 "hello,模型要輸出匹配的引號 "hello";

圖片圖片

  1. 列表嵌套深度計數:輸入 [ [ ] ],模型需要正確預測列表結束的符號;

圖片圖片

  1. 變量類型追蹤:跟蹤變量 current 是字符串還是集合類型。

圖片圖片

為了評估模型的可解釋性,研究者使用一種新型剪枝(Pruning)方法,以隔離關鍵電路:對每個任務,刪除模型中非必要的神經元/通道/權重,只保留完成任務所必需的最小子網絡。剪枝方法會通過“均值屏蔽”(mean-ablating)凍結被刪除節點的激活,保證任務行為仍然由剩下的電路完成。

圖片圖片

結果發現,每個任務對應一個最小電路(Minimal Circuit),只包含少量神經元和注意力通道,足以完成任務:

  • 剪掉電路之外的神經元,模型就會失敗;
  • 只保留這些神經元,模型就能正常完成任務。

這意味著,這些電路不僅可用,而且必要且充分——正是模型執行任務的核心“機制”。

舉個例子,閉合引號任務的電路只用到兩個MLP神經元和一個注意力頭,就能判斷字符串是單引號還是雙引號,然后正確閉合。

此外,研究者還發現電路越小、越獨立,模型行為就越可解釋。

他們比較了一個稀疏模型和一個在預訓練損失相同的稠密模型。通過調節目標損失,測量每個模型在完成該損失時所需的最小電路規模,并對任務進行平均。結果顯示,在任意給定損失下,稀疏模型的電路大約比稠密模型小16倍。

圖片圖片

三、能力與可解釋性的權衡

稀疏訓練還有一個亮點:可調控性。

  • 增加稀疏度:權重越少,電路越小,模型越可解釋,但能力略有下降。
  • 擴大模型規模:在保持稀疏度的情況下,增加神經元數量,可以同時提升能力和可解釋性。

研究者將這個關系繪制成“帕累托前沿”,顯示能力與可解釋性的權衡。在總參數量固定的情況下,提高模型稀疏度(即減小權重的L0 范數)會在能力和可解釋性之間產生權衡:能力下降,但可解釋性提升。

圖片圖片

四、橋接方法:擴展到已有大模型

稀疏模型雖然易解釋,但訓練成本高,難以直接替代像GPT-3這樣的前沿大模型。為了解決這個問題,研究者又提出了橋接方法(Bridges)。通過橋接,把稀疏模型與已有密集模型關聯,實現對已有模型行為的可解釋性分析。

圖片圖片

“橋接”就是一系列線性映射,用于在稀疏模型和稠密模型的表示之間轉換——從而確保通過稀疏層與稠密層混合的所有路徑在預訓練任務上仍能保持良好性能。

五、未來將訓練出一個完全可解釋的 GPT-3

在論文最后,研究者提到,稀疏訓練非常有前景,但仍有不少挑戰:

  1. 效率低:稀疏模型訓練和推理開銷是同等能力稠密模型的100–1000倍;
  2. 多語義特征:一些神經元仍同時參與多個任務,完全單語義化還需要改進;
  3. 規模挑戰:解釋復雜任務或更大模型時,電路會非常龐大,需要自動化可解釋性方法輔助。

論文第一作者Leo Gao也表示:

“我們還沒有完全解決可解釋性問題,仍有很大的改進空間,許多電路仍然比較復雜。但我們仍然能學到很多——例如,在檢查閉合嵌套列表的電路時,我們發現了一種對模型的對抗攻擊,這是我們原本不會想到的。”

ImageImage

對于未來的研究方向,研究團隊表示,他們對擴展這一技術感到非常興奮。

“雖然不太可能將其擴展到最前沿的規模,但一個令人激動的目標是訓練出一個完全可解釋的 GPT-3。這樣的‘模型生物體’將教會我們關于 AI 工作原理的重要經驗,這些經驗可能會遷移到最前沿的模型上。”

可以預見,可解釋性將是未來大模型發展的關鍵方向。在不遠的將來,我們有望真正理解“AI是怎么思考的”,而不是僅僅看它的輸出。

參考鏈接:

https://openai.com/index/understanding-neural-networks-through-sparse-circuits/

https://cdn.openai.com/pdf/41df8f28-d4ef-43e9-aed2-823f9393e470/circuit-sparsity-paper.pdf

責任編輯:武曉燕 來源: 51CTO技術棧
相關推薦

2022-06-06 07:52:41

反欺詐技術AI

2024-05-28 08:00:00

人工智能機器學習

2023-02-14 08:10:14

Python人工智能XAI

2023-08-11 13:54:31

AI因果

2019-03-28 09:26:26

數據科學模型機器學習

2019-08-29 18:07:51

機器學習人工智能

2023-09-20 11:42:44

人工智能AI

2022-07-29 15:28:45

人工智能Python框架

2024-11-04 14:33:04

機器學習SHAP黑盒模型

2025-07-15 10:29:17

2025-01-23 08:23:12

2022-01-06 10:21:56

自動駕駛數據人工智能

2022-10-20 15:58:51

人工智能研究

2020-08-19 09:20:00

機器學習人工智能Python

2024-11-05 14:10:00

神經網絡AI

2020-08-25 10:30:59

TensorFlow數據機器學習

2021-01-08 10:47:07

機器學習模型算法

2025-01-13 08:13:18

2024-09-18 05:25:00

可解釋性人工智能AI

2022-04-13 15:10:22

AI決策
點贊
收藏

51CTO技術棧公眾號

播放一区二区| 天堂a√中文在线| 女生裸体视频一区二区三区| 精品国产伦一区二区三区免费| 国内精品在线观看视频| 欧洲成人av| 国产在线播放一区二区三区| 97国产精品人人爽人人做| 欧美做受高潮6| 日韩精品一区二区三区免费视频| 五月天欧美精品| 一本久久a久久精品vr综合| 性猛交xxxx乱大交孕妇印度| 日韩制服丝袜av| 欧美日韩999| 欧美人妻一区二区三区| youjizz亚洲| 欧美日韩中文字幕一区二区| 国产69精品久久久久久久| 日本在线天堂| 91小视频免费看| 91亚洲精品久久久| 国产一级片av| 激情欧美日韩| 久久精品99无色码中文字幕 | 丝袜诱惑一区二区| 亚洲日本va在线观看| 欧美不卡福利| 欧美熟女一区二区| 韩国精品一区二区| 国产精品视频色| 久久久国产精品成人免费| 中文字幕午夜精品一区二区三区 | 亚洲精品成人无码熟妇在线| 九九九九九九精品任你躁 | 99国产精品99| 美女脱光内衣内裤视频久久网站 | 精品91一区二区三区| 国产资源在线观看| 99精品视频在线播放观看| 亚洲一区精品电影| 国产精品久久久久毛片| 日韩一区精品视频| 欧美制服第一页| 日韩av无码中文字幕| 欧美一区高清| 久久99精品久久久久久噜噜| 天天操天天操天天操天天操天天操| av中文字幕一区二区| 亚洲精品视频二区| 亚洲成人日韩在线| 伊人久久大香线蕉综合网蜜芽| 亚洲激情在线视频| 人妻激情偷乱频一区二区三区| 午夜视频在线观看精品中文| 日韩亚洲欧美一区二区三区| 天天操夜夜操很很操| 日韩免费在线电影| 在线播放91灌醉迷j高跟美女 | 日本欧美黄色片| 岛国av免费在线观看| 亚洲午夜视频在线| 国产96在线 | 亚洲| 久久男人av资源站| 欧美日韩美女在线观看| av免费中文字幕| 日韩av一级| 欧美猛男超大videosgay| 中文字幕亚洲影院| 国产日韩在线观看视频| 亚洲第一区在线观看| 91丝袜在线观看| 深爱激情久久| 最近2019中文字幕在线高清| 精品无码久久久久成人漫画| 欧美福利一区| 97精品国产97久久久久久| 毛片视频网站在线观看| 日韩高清不卡一区二区三区| 成人免费网站在线观看| 超碰在线观看av| 91美女片黄在线| 天天爽天天狠久久久| av香蕉成人| 天涯成人国产亚洲精品一区av| 色综合av综合无码综合网站| а√天堂资源国产精品| 欧美一区二区黄| 菠萝菠萝蜜网站| 欧美色图在线播放| 欧美成在线观看| av大片免费在线观看| 日韩国产在线观看| 91视频婷婷| 免费在线高清av| 亚洲精品国产a| 国产成人无码一二三区视频| 成人在线视频国产| 日韩成人网免费视频| 99成人在线观看| 国产手机视频一区二区| 成人精品在线观看| 色猫av在线| 伊人夜夜躁av伊人久久| 六月丁香婷婷在线| 一区二区三区视频免费视频观看网站 | 手机av在线免费| 久久精品国产亚洲5555| 久久久极品av| 无码人妻一区二区三区线| 国产精品一区二区三区网站| 欧洲亚洲一区二区三区四区五区| 女囚岛在线观看| 欧美性猛交xxxx乱大交退制版 | 综合自拍亚洲综合图不卡区| 777久久久精品一区二区三区| **欧美日韩在线| 亚洲天堂av在线播放| 精品无码m3u8在线观看| 精品一区二区三区影院在线午夜| 免费一区二区三区| 青春草在线视频| 欧美日韩电影一区| 蜜桃av免费看| 一区二区国产在线观看| 5g国产欧美日韩视频| 999国产在线视频| 在线看国产一区| 无码人妻aⅴ一区二区三区 | 国产精品全国免费观看高清 | 影音先锋欧美资源| 欧美舌奴丨vk视频| 亚洲精品视频播放| 日本免费观看视| 大美女一区二区三区| 天堂v在线视频| 日韩一级特黄| 日韩一级裸体免费视频| 一区二区三区麻豆| 久久精品人人做人人综合| 国产视频九色蝌蚪| 国产精品17p| 久久久久久久久久久成人| 国产ts人妖调教重口男| 亚洲视频一区二区在线| 亚洲小视频网站| 久久国产精品亚洲人一区二区三区| 国产精品久久久久91| 国产精品一区二区三区四区色| 欧美特黄级在线| 欧美 日本 国产| 免费一区视频| 免费在线观看一区二区| 456亚洲精品成人影院| 国产午夜精品麻豆| 国产精品熟女视频| 国产精品欧美精品| 第一区免费在线观看| 91精品一区二区三区综合| 亚洲一区二区自拍| 黄色的视频在线观看| 亚洲国产精品久久久久| 日韩欧美激情视频| 久久这里都是精品| www.色偷偷.com| 羞羞色午夜精品一区二区三区| 成人有码在线视频| 天堂av中文在线| 精品无人区乱码1区2区3区在线| 四虎成人在线观看| 中文字幕精品三区| 国产又粗又猛又爽又黄| 亚洲精品孕妇| 亚洲精品不卡| 亚洲一区二区三区免费| 91精品国产99久久久久久| 国产三级视频在线| 91精品国产综合久久小美女| 精品处破女学生| 91麻豆国产精品久久| 北条麻妃视频在线| 99久久99视频只有精品| 风间由美一区二区三区| 欧美性理论片在线观看片免费| 精品国产一区二区三区久久久| 成人激情四射网| 日韩欧美亚洲成人| 午夜国产小视频| 97久久久精品综合88久久| 久久午夜夜伦鲁鲁一区二区| 亚洲香蕉av| 蜜桃狠狠色伊人亚洲综合网站| 亚洲网站免费| 2018中文字幕一区二区三区| 日本美女在线中文版| 日韩av最新在线观看| 一本久道久久综合无码中文| 亚洲一级二级三级| 91社区视频在线观看| www.欧美日韩国产在线| 国产色视频在线播放| 黄色另类av| 伊人情人网综合| 午夜先锋成人动漫在线| 亚洲综合色激情五月| 桃花岛tv亚洲品质| 久久免费少妇高潮久久精品99| 幼a在线观看| 亚洲欧美激情一区| 亚洲精品一区二区三区不卡| 欧美日韩免费视频| 国产精品777777| 亚洲国产视频直播| 992在线观看| 久久久久久久久一| 天天躁日日躁狠狠躁av麻豆男男| 韩国成人精品a∨在线观看| 免费日韩中文字幕| 亚洲精品影视| 特级西西人体www高清大胆| 日韩免费在线| 欧美国产二区| 欧美丝袜足交| 动漫一区二区在线| 国产精品一区二区三区av| 国产精品视频久久久久| 国精产品一区二区三区有限公司| 91精品国产99| 黄色激情在线播放| 国内精品视频一区| 巨大荫蒂视频欧美大片| 日韩在线免费视频| 欧美激情二区| 中文字幕久久久av一区| 国产精品一区在线看| 亚洲欧美国产精品专区久久| 视频国产在线观看| 亚洲精品电影网在线观看| 亚洲精品中文字幕成人片 | 色吊丝在线永久观看最新版本| 日韩精品一区国产麻豆| 99精品国产99久久久久久97| 欧美色图第一页| 伊人网站在线观看| 精品视频在线视频| 国产又大又黑又粗| 欧美一区二区女人| 午夜久久久久久久久久| 精品处破学生在线二十三| 高h调教冰块play男男双性文| 日韩精品自拍偷拍| 亚洲国产精品成人久久蜜臀| 精品久久久久久久久久久久久久久| 国产福利资源在线| 欧美大胆人体bbbb| 少妇精品视频一区二区| 日韩毛片在线看| 你懂的在线播放| 尤物九九久久国产精品的分类| yw在线观看| 久久视频在线视频| 日本动漫同人动漫在线观看| 欧美精品激情视频| 蜜桃视频在线网站| 国产精品 欧美在线| 婷婷激情成人| a级国产乱理论片在线观看99| ccyy激情综合| 蜜桃麻豆91| 青青草国产成人a∨下载安卓| 自拍偷拍视频在线| 亚洲网站视频| 超碰网在线观看| 国内精品久久久久影院一蜜桃| 日本中文字幕有码| 2020国产精品自拍| 三级影片在线观看| 亚洲va在线va天堂| 久久久999久久久| 日韩亚洲欧美一区二区三区| 五月婷婷免费视频| 色婷婷av一区二区三区久久| av网站大全在线| 2019日本中文字幕| 999色成人| 蜜桃传媒视频第一区入口在线看| 999国产精品| 成年人网站免费视频| 蜜桃视频在线一区| 中文字幕一区二区三区乱码不卡| 国产亚洲精品中文字幕| 久久精品www人人爽人人| 日本黄色一区二区| av无码精品一区二区三区宅噜噜| 日韩精品免费在线视频| dy888亚洲精品一区二区三区| 91av在线精品| www.久久久.com| 免费av在线一区二区| 中文精品久久| 久久久久久香蕉| 国产sm精品调教视频网站| av黄色免费网站| 一区二区三区在线高清| av首页在线观看| 欧美大黄免费观看| 欧美天天影院| 欧美在线一区二区视频| 日韩一区二区三区精品| 亚洲午夜久久久影院伊人| 国产欧美成人| 美女又黄又免费的视频| 国产精品美女一区二区| 日日噜噜噜噜人人爽亚洲精品| 日韩一区二区视频在线观看| 91精品国产91久久久久游泳池| 欧美一区视频在线| 精品国内亚洲2022精品成人| 中文字幕一区二区三区乱码 | 日韩免费在线视频| 动漫3d精品一区二区三区乱码| 最新欧美日韩亚洲| 日本中文一区二区三区| 中国美女乱淫免费看视频| 亚洲午夜精品在线| 精品毛片在线观看| 久久精品成人欧美大片古装| 日韩中文视频| 色就是色欧美| 日日欢夜夜爽一区| 国产交换配乱淫视频免费| 午夜成人免费电影| 成人午夜免费在线观看| 久久成人亚洲精品| av在线成人| 熟女视频一区二区三区| 久久 天天综合| 日韩av手机在线免费观看| 欧美日本韩国一区| 欧美尤物美女在线| 国产欧美精品在线| 国产高清一区| 伊人五月天婷婷| 一区二区三区在线观看欧美| 国产后入清纯学生妹| 久久中文精品视频| 欧美影院精品| 精品人妻大屁股白浆无码| 国产成+人+日韩+欧美+亚洲| 欧美日韩国产精品一区二区三区| 日韩视频永久免费| 欧美人与禽性xxxxx杂性| 粉嫩av一区二区三区免费观看| 韩日欧美一区| 性色av蜜臀av色欲av| 91久久精品午夜一区二区| 搞黄视频免费在线观看| 国产在线观看精品一区二区三区| 99久久视频| 免费观看一区二区三区| 亚洲成人自拍一区| 青青草av免费在线观看| 国产精品日韩欧美大师| 99久久综合狠狠综合久久aⅴ| 亚洲国产欧美91| 婷婷激情综合网| 好男人免费精品视频| 国产精品吴梦梦| 亚洲国产不卡| 国产又粗又长又爽| 欧美性xxxxxxxx| 羞羞电影在线观看www| 国产一级二级三级精品| 久久久人人人| 一级性生活免费视频| 精品免费视频一区二区| 亚洲小少妇裸体bbw| 午夜精品一区二区在线观看| 国内久久精品视频| 天堂网一区二区三区| 国产一区二区三区在线观看视频| 国语自产精品视频在线看抢先版结局| 艳母动漫在线观看| 99国产精品视频免费观看| 这里只有精品国产| 欧美激情视频在线| 深夜福利久久| 国产精品19p| 91久久精品日日躁夜夜躁欧美| 97影院秋霞午夜在线观看| 裸模一区二区三区免费| 久久精品国产在热久久| 国产精品30p| 在线观看视频99| 韩国精品福利一区二区三区| 超碰超碰在线观看| 亚洲va欧美va人人爽午夜| aaa在线观看| 国内精品**久久毛片app| 精品亚洲欧美一区|