精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

OpenAI最強競品訓練AI拆解LLM黑箱,意外窺見大模型「靈魂」

人工智能
Anthropic的模型可解釋性團隊,從大模型中看到了它的「靈魂」——一個可解釋的更高級的模型。

為了拆開大模型的「黑箱」,Anthropic可解釋性團隊發表了一篇論文,講述了他們通過訓練一個新的模型去理解一個簡單的模型的方法。

Anthropic發表的一項研究聲稱能夠看到了人工智能的靈魂。它看起來像這樣:

圖片圖片

圖片圖片

論文地址:https://transformer-circuits.pub/2023/monosemantic-features/index.html#phenomenology-fsa

在研究者看來,這個新的模型能準確地預測和理解原本模型中神經元的工作原理和組成機制。

Anthropic的可解釋性團隊最近宣布他們成功分解了一個模擬AI系統中的抽象高維特征空間。

創建一個可解釋的AI去理解「AI黑盒」

研究人員首先訓練了一個非常簡單的512神經元AI來預測文本,然后訓練了另一個名為「自動編碼器」的AI來預測第一個AI的激活模式。

自動編碼器被要求構建一組特征(對應更高維度AI中的神經元數量),并預測這些特征如何映射到真實AI中的神經元。

結果發現,盡管原始AI中的神經元本身不易理解,但是新的AI中的這些模擬神經元(也就是「特征」)是單義的,每特征都表示一個指定的概念或功能。

例如,特征#2663代表「God」這個概念。

圖片圖片

激活它的訓練語句中最強的一條來自「Josephus」的記錄中「當God降下暴雪時,他前往Sepphoris」。

可以看到頂端的激活都是關于「God」的不同用法。

這個模擬神經元似乎是由一組真實神經元(包括407,182和259)組成的。

這些真實神經元本身與「God」沒有太大關系,例如神經元407主要對非英語(尤其是重音拉丁字母)和非標準文本(如HTML標簽)有響應。

但是在特征層面,一切都是井井有條的,當特征2663被激活時,它會增加文本中出現「bless」、「forbid」、「damn」或「-zilla」的概率。

這個AI并沒有將「God」這個概念與怪獸名字中的「God」區分開來。這可能是因為這個簡易AI沒有足夠的神經元資源來專門處理這個事。

但隨著AI具備的特征數量增加,這種情況會發生改變:

圖片圖片

在這棵樹的底部,你可以看到當這個AI具有越來越多的特征時,它在數學術語中對「the」的理解是如何變化的。

首先,為什么會有一個數學術語中「the」的特定特征?這很可能是由于AI的預測需求——知道某些特定的「the」之后應該會跟隨一些數學詞匯,比如「numerator」或者「cosine」。

在研究人員訓練的最小的那個只有512個特征的AI中,只有一個表示「the」的特征,而在具有16384個特征的最大AI中,這個特征已經分支出了一個表示機器學習中「the」的特征,一個表示復分析中「the」的特征,以及一個表示拓撲學和抽象代數中「the」的特征。

因此,如果能將系統升級到一個具有更多模擬神經元的AI,那表示「God」的特征很可能會分裂成兩個——一個表示宗教中「God」的含義,另一個表示怪獸名字中「God」的含義。

后來,可能會有基督教中的God、猶太教中的God、哲學中的God等等。

研究小組對412組真實神經元和相應的模擬神經元進行了主觀可解釋性評估,發現模擬神經元的可解釋性整體上比較好:

圖片圖片

一些特征,比如表示「God」的特征,是用于特定概念的。

許多其他高度可解釋的特征,包括一些最可解釋的,是用于表示文本的「格式」,比如大寫或小寫字母、英語或其他字母表等。

圖片圖片

這些特征有多常見呢?也就是說,如果你在相同的文本數據上訓練兩個不同的4096個特征的AI,它們會有大部分相同的4096個特征嗎? 它們會都有某些代表「God」的特征嗎?

或者第一個AI會將「God」和「哥斯拉」放在一起,而第二個AI會將它們分開?第二個AI是否就完全不會有表示「God」的特征,而是用那個空間存儲一些第一個AI不可能理解的其他概念?

研究小組進行了測試,發現他們的兩個AI模型是非常相似的!

平均而言,如果第一個模型中有一個特征,第二個模型中最相似的特征會有0.72的中值相關性。

圖片圖片

看到了AI的靈魂

后續的工作將是什么呢?

今年五月,OpenAI試圖讓GPT-4(非常大)理解GPT-2(非常小)。他們讓GPT-4檢查了GPT-2的個307200個神經元,并報告它發現的內容。

GPT-4找到了一系列有趣的結果和一堆隨機廢話,因為他們還沒有掌握將真實神經元投射到模擬神經元并分析模擬神經元的技巧。

盡管結果效果不明顯,但這確實是非常雄心勃勃的嘗試。

與Anthropic可解釋性文章中的這個AI不同,GPT-2是一個真實的(盡管非常小)AI,曾經也給大眾留下了深刻印象。

但是研究的最終目的是要能夠解釋主流的AI系統。

Anthropic的可解釋性團隊承認他們還沒有做到這一點,主要基于以下幾個原因:

首先,擴大自動編碼器的規模是一個很困難的事情。為了解釋GPT-4(或Anthropic的等效系統Claude)這樣的系統,你需要一個差不多同樣大小的解釋器AI。

但是訓練這樣規模的AI需要巨大的算力和資金支持。

其次,解釋的可擴展性也是一個問題。

即使我們找到了所有關于God、哥斯拉以及其他一切的模擬神經元,并畫出它們之間如何相連的巨大關系圖。

研究人員任然需要回答一些更復雜的問題,解決這些問題需要涉及成百上千萬的特征和連接的復雜交互。

所以需要一些自動化的流程,也就是某種更大規模的「讓GPT-4告訴我們GPT-2在做什么」。

最后,所有這些對理解人類大腦有什么啟發?

人類也使用神經網絡進行推理和處理概念。

人類大腦中有很多神經元,這一點和GPT-4是一樣的。

人類獲得的數據也非常稀疏——有很多概念(如烏賊)在日常生活中很少出現。

我們是否也在模擬一個更大的大腦?

目前這還是一個非常新的研究領域,但已經有一些初步的發現,表明人類視覺皮層中的神經元確實以某種超定位的方式編碼特征,與AI模型中觀察到的模式相似。

參考資料:https://transformer-circuits.pub/2023/monosemantic-features/index.html#phenomenology-fsa

責任編輯:武曉燕 來源: 新智元
相關推薦

2025-08-24 09:24:07

2023-05-22 09:19:19

2023-09-09 06:56:55

螞蟻集團開源AI

2024-03-12 13:33:40

2024-02-04 13:56:03

2023-08-08 13:43:57

人工智能智能體GPU

2023-04-21 10:14:22

開源AI

2025-04-01 09:54:09

AI算法大模型AI

2024-04-03 12:48:00

2024-07-12 14:53:42

2025-02-21 13:45:00

2025-01-09 08:01:10

2020-08-26 11:50:25

谷歌開源工具

2020-05-06 11:04:52

Elasticsear架構運維

2024-03-05 09:16:32

AI模型GPT-4

2023-10-06 20:30:33

大模型LLMtoken

2025-08-01 09:41:52

2025-09-12 16:13:12

2023-10-16 12:51:32

點贊
收藏

51CTO技術棧公眾號

bl动漫在线观看| 欧美a级免费视频| 中文字幕乱码视频| 亚洲深深色噜噜狠狠爱网站| 精品国产一区二区三区忘忧草| 成人黄色av片| 日本美女高清在线观看免费| 大尺度一区二区| 国产精品99免视看9| 欧美交换国产一区内射| 美女福利一区| 91精品国产全国免费观看 | 精品美女视频在线观看免费软件| 奇米在线7777在线精品| 久久99精品久久久久久青青91| 内射中出日韩无国产剧情| 日韩成人综合网| 欧美性猛交xxxx乱大交| 国产性生活免费视频| 精品av中文字幕在线毛片| 国产成人综合在线播放| 国产精品入口尤物| 麻豆精品久久久久久久99蜜桃| 亚洲草久电影| 在线成人免费网站| 精品中文字幕在线播放| 欧洲精品99毛片免费高清观看| 欧美在线观看你懂的| 日本丰满少妇xxxx| av免费在线观| 成人免费视频在线观看| 欧美专区一二三 | 亚洲欧洲视频在线| 中文字幕 日本| 91成人精品在线| 欧美日韩国产小视频| 奇米精品一区二区三区| a黄色片在线观看| 国产精品理论在线观看| 欧美色图亚洲自拍| 污视频网站在线播放| 粉嫩av一区二区三区| 亚洲字幕在线观看| 国产美女主播在线观看| 日韩国产在线观看一区| 欧美一区二区三区精品电影| 久草视频在线资源| 国内精品福利| 欧美激情精品久久久久久久变态 | 古装做爰无遮挡三级聊斋艳谭| 日韩中文在线播放| 在线免费一区三区| 99久久国产宗和精品1上映 | 成人亚洲激情网| 在线观看国产精品入口男同| 日韩黄色小视频| 国产福利视频一区二区| 日本黄色中文字幕| 美国十次了思思久久精品导航 | 欧美a v在线播放| 老色鬼在线视频| 精品国产福利视频| 37pao成人国产永久免费视频| 成人小电影网站| 日本电影亚洲天堂一区| 在线观看亚洲色图| 亚洲影视资源| 欧美精品一区二区三区四区| 漂亮人妻被黑人久久精品| 欧美a一欧美| 亚洲新中文字幕| 国产欧美小视频| 亚洲乱码在线| 久久免费福利视频| 国产一级一级国产| 九九在线精品视频| 官网99热精品| 国产日产精品久久久久久婷婷| 亚洲国产精品av| 国产一区一区三区| 丁香花在线高清完整版视频| 黑人巨大精品欧美一区二区三区 | 精品影视av免费| 3d动漫精品啪啪一区二区三区免费| 亚洲免费黄色片| 久久先锋影音av鲁色资源| 在线成人性视频| a级片在线免费| 在线观看成人小视频| 成人高清在线观看视频| 亚洲国产欧美日韩在线观看第一区 | 午夜电影网一区| wwwwxxxx日韩| 亚洲精品一区二区三区在线| 亚洲精品久久久一区二区三区| 第一次破处视频| 欧美片第1页综合| 全球成人中文在线| 国产哺乳奶水91在线播放| 97精品久久久午夜一区二区三区| 午夜欧美一区二区三区免费观看| 色噜噜狠狠狠综合欧洲色8| 欧美日韩国产综合新一区 | 91精品啪在线观看国产手机| 亚洲人成五月天| 欧美精品一区二区成人| 日韩国产欧美一区二区三区| 99久久伊人精品影院| 国产在线资源| 一区二区三区在线高清| 人人爽人人av| 日韩精选在线| 欧美日韩国产成人高清视频| 亚洲免费视频二区| 成人avav影音| 久久久天堂国产精品| 日韩一区二区三区免费视频| 日韩av在线不卡| 免费看一级大片| 视频在线观看一区二区三区| 国产高清精品一区二区| 欧洲不卡av| 色乱码一区二区三区88| 在线精品一区二区三区| 亚洲xxx拳头交| 国产精品色视频| 青青国产在线| 性做久久久久久免费观看欧美| 五月婷婷六月丁香激情| 精品产国自在拍| 欧美在线一区二区视频| 刘亦菲久久免费一区二区| 亚洲色欲色欲www| 中文字幕永久视频| 怕怕欧美视频免费大全| 欧美一区三区三区高中清蜜桃| 99精品国产99久久久久久97| 国产欧美日韩麻豆91| 99精品视频在线看| 一区二区三区视频免费观看| 97色伦亚洲国产| 免费av网站在线播放| 亚洲一二三专区| 国产一精品一aⅴ一免费| 欧美日韩mv| 波多野结衣精品久久| 51xtv成人影院| 91精品国产91热久久久做人人 | 一二三区精品视频| 在线免费黄色网| 午夜国产欧美理论在线播放| 亚洲一区二区久久久久久久| 影院在线观看全集免费观看| 日韩视频免费观看高清完整版在线观看| 五月天免费网站| 国产在线播精品第三| 看全色黄大色大片| 成人h动漫精品一区二区器材| 欧美丰满少妇xxxxx| 亚洲av无码一区二区三区性色| 亚洲一二三四区| 99久久免费看精品国产一区| 亚洲激情中文| 91夜夜未满十八勿入爽爽影院| 麻豆影院在线| 日韩精品一区二区三区四区视频| 精品一区在线视频| 久久亚洲免费视频| 欧美伦理片在线观看| 中国精品18videos性欧美| 豆国产97在线| 第84页国产精品| 三级精品视频久久久久| 北条麻妃一二三区| 偷拍亚洲欧洲综合| 天堂久久久久久| 日韩制服丝袜先锋影音| 中文字幕中文字幕一区三区| av在线亚洲色图| 国产99在线|中文| av在线影院| 亚洲国产99精品国自产| 亚洲天堂视频在线播放| 亚洲精品一二三区| 91精品小视频| 日本成人中文字幕在线视频| 成人短视频在线看| 私拍精品福利视频在线一区| 国产日本欧美在线观看| 黑人另类精品××××性爽| 亚洲天堂成人在线| www.日本在线观看| 91高清视频在线| 久久久久久久黄色| 国产日韩欧美在线一区| 免费黄色a级片| 日韩图片一区| 日韩资源av在线| 天堂久久av| 国产精品999999| 成av人片在线观看www| 色一情一乱一区二区| 欧美一级视频免费| 欧美巨大另类极品videosbest| 国产一级二级毛片| 亚洲欧洲精品一区二区三区不卡| 精品无码人妻少妇久久久久久| 久久先锋影音| 被灌满精子的波多野结衣| 日本一区二区免费高清| 国产伦精品一区二区三区高清| 日本免费一区二区三区等视频| 91精品国产91久久久久久最新| 欧美另类极品| 永久555www成人免费| 日本黄色大片视频| 日韩一区二区三区在线| 亚洲精品无码久久久久| 欧美午夜精品在线| 久久免费播放视频| 国产精品国产三级国产三级人妇| 极品人妻一区二区三区| 成人免费毛片a| 91香蕉视频免费看| 久久爱www久久做| 人人爽人人av| 日韩av一二三| 亚洲乱码国产一区三区| 亚洲综合三区| 无码播放一区二区三区| 亚洲成人中文| www插插插无码免费视频网站| 香蕉国产精品| 宅男噜噜99国产精品观看免费| 欧美日韩在线观看视频小说| 久久99九九| 亚洲黄色录像| 欧美自拍资源在线| 色综合综合网| 日韩亚洲不卡在线| 国产精品午夜一区二区三区| 久久精品国产99精品国产亚洲性色| 日韩中文在线| 草莓视频一区| av毛片精品| 精品一区二区不卡| 亚洲国产国产| 日韩精品国内| 久久高清免费| 中文字幕黄色大片| 亚洲精品a级片| www.99riav| 国产精品99一区二区| av在线观看地址| 亚洲东热激情| 国产91在线免费| 久久久国产精品一区二区中文| 免费日韩视频在线观看| 日韩激情一二三区| 亚洲免费av一区| 国产福利91精品| 国产二级一片内射视频播放 | 日本特黄久久久高潮| av在线网址导航| 国产成人高清在线| 一区二区免费在线观看视频| 久久夜色精品国产欧美乱极品| 一区二区黄色片| 亚洲三级在线免费| 国产一级大片在线观看| 一本大道综合伊人精品热热| 久久这里只有精品9| 6080国产精品一区二区| 性一交一乱一透一a级| 亚洲精品久久久一区二区三区 | 欧美成人精品一区二区| 国产丝袜在线播放| 日产日韩在线亚洲欧美| 婷婷激情成人| 国产精品免费看一区二区三区| 美女久久久久| 小说区视频区图片区| 亚洲高清网站| 久久这里只精品| 成人在线视频首页| 91精品久久久久久久久久久久| 亚洲视频一区二区在线| 国产精品黄色大片| 欧美日韩一级大片网址| 亚洲欧美另类视频| 国产亚洲人成网站在线观看| 亚洲综合图区| 国产v综合v亚洲欧美久久| 欧洲大片精品免费永久看nba| 牛人盗摄一区二区三区视频| 中文字幕亚洲综合久久五月天色无吗'' | av毛片在线看| 国产成人97精品免费看片| 激情视频亚洲| 五月天亚洲综合小说网| 国内精品福利| 三年中文在线观看免费大全中国| 92精品国产成人观看免费 | 欧美日韩亚洲网| av av片在线看| 一区二区三区无码高清视频| 国产福利在线播放麻豆| 国产成人精品a视频一区www| 国产精品久av福利在线观看| 亚洲欧美一区二区原创| 香蕉久久夜色精品| 9191在线视频| 国产精品福利一区| 草莓视频18免费观看| 亚洲成人精品在线| 菠萝菠萝蜜在线观看| 国产精品久久久久久久久男 | 亚洲色图15p| av资源在线| 91入口在线观看| 午夜精品视频一区二区三区在线看| www黄色av| 99久久国产综合精品色伊| 欧美成人三级在线观看| 欧美日韩一区 二区 三区 久久精品| 少妇性bbb搡bbb爽爽爽欧美| 九九视频直播综合网| 日本免费在线一区| 少妇精品久久久久久久久久| 亚洲综合国产| 在线免费观看a级片| 亚洲综合久久久| 精品人妻一区二区三区含羞草| 色999日韩欧美国产| 在线国产成人影院| 日韩精品最新在线观看| 日韩av中文在线观看| 日韩精品无码一区二区三区久久久| 亚洲一区二区三区视频在线播放| 国产精品无码专区av免费播放| 日韩中文av在线| 亚洲欧洲日韩精品在线| 亚洲精品一品区二品区三品区 | 日本性生活一级片| 一区二区三区在线播| 亚洲av无码国产综合专区| 久热爱精品视频线路一| 国产精品一区二区美女视频免费看 | 国产一二三四五区| 一本久道久久综合中文字幕 | 国产视频一区二区三| 超碰日本道色综合久久综合| 国产乱码精品一区二区三区亚洲人| 尤物国产精品| 国产成人av影院| 日本三级网站在线观看| 亚洲精品久久久久中文字幕欢迎你 | 91地址最新发布| 中文有码一区| 中国黄色片免费看| 亚洲精品高清视频在线观看| 黄频在线免费观看| 2023亚洲男人天堂| 国产亚洲电影| 中文av字幕在线观看| 一区二区在线观看免费 | 亚洲三级av| 欧美一区二区三区爽大粗免费| 久久久久久亚洲综合影院红桃| 看黄色一级大片| 久久天堂电影网| 国产区精品视频在线观看豆花| 日本免费黄视频| 18欧美乱大交hd1984| 蜜桃91麻豆精品一二三区| 777777777亚洲妇女| 日韩国产一区| 极品白嫩少妇无套内谢| 日韩欧美国产成人| 毛片免费不卡| 麻豆亚洲一区| 久久福利资源站| 亚洲视频免费播放| 一区二区三区视频免费| 亚洲va欧美va人人爽成人影院| 波多野结衣家庭教师在线| 国产精品伦理在线| 婷婷av一区二区三区| 国产精品久久97| 1024日韩| 啪啪一区二区三区| 亚洲国产精品电影| 99综合久久| 日本成年人网址| 亚洲卡通动漫在线| 91激情在线| 精品国产乱码久久久久久108| 久久91精品久久久久久秒播| 久久久久久久久影院| 欧美成人亚洲成人|