精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Claude團隊開盒Transformer:AI大腦原來這樣工作

人工智能 新聞
研究人員提出了一種名為“電路追蹤”的方法。 它利用跨層編碼器(CLT)替代原模型中的多層感知機 (MLP),搭建出和原模型相似的替代模型。

大模型工作機制的黑盒,終于被Claude團隊揭開了神秘面紗!

團隊創造了一種解讀大模型思考方式的新工具,就像給大模型做了個“腦部核磁”。

他們還發現,Claude在某些任務上具備長遠規劃能力,甚至還會為了迎合人類而編造推理過程。

圖片

具體來說,研究人員提出了一種名為“電路追蹤”的方法。

它利用跨層編碼器(CLT)替代原模型中的多層感知機(MLP),搭建出和原模型相似的替代模型。

在此基礎上,構建歸因圖來描述模型在特定提示下生成輸出的計算步驟,從而觀察模型的思考過程。

圖片

Claude團隊將這項研究的方法和發現分別寫成了論文,總計篇幅超過了8萬字。

探究大模型內在推理過程

利用電路追蹤方法,團隊對Claude 3.5 Haiku在長邏輯推理、多語言、長期規劃等任務場景的工作過程進行了觀察,發現了其中許多特點:

  • Claude有時會在不同語言之間共享的概念空間中思考,這表明它有一種通用的“思維語言”;
  • Claude會提前計劃好要生成的內容,如在詩歌領域,它會提前考慮可能的押韻詞,證明了模型可能會在更長遠的范圍內思考;
  • Claude有時會給出一個看似合理的論點,旨在同意用戶的觀點,而不是遵循邏輯步驟,甚至為迎合人類答案反向尋找推理過程;
  • Claude并沒有配備數學算法,但可以在“頭腦中”正確地進行加法運算。

多語言推理

在多語言場景中,作者研究了模型對 “the opposite of ‘small’” 的不同語言版本(英語、法語、中文)的處理,發現模型處理這些提示的電路相似,包含共享的多語言組件和特定語言組件。

模型能識別出是在詢問 “small” 的反義詞,通過語言獨立的表示觸發反義詞特征,同時利用語言特定的引號特征等確定輸出語言。

圖片

干預實驗表明,交換操作(反義詞換為同義詞)、被操作單詞(“small” 換為 “hot”)和語言特征,模型能相應地輸出合適的結果,證明了電路中各部分的獨立性和語言無關性。

圖片

詩歌創作和長規劃能力

在創作 “His hunger was like a starving rabbit” 這樣的押韻詩時,模型展現出規劃能力。

在第二行開始前的換行符位置,模型激活了與 “rabbit” 相關的規劃特征,這些特征受前一行 “it” 的影響,激活了押韻特征和候選完成詞特征,從而影響最后一個詞的選擇。

圖片

此外,規劃特征不僅影響最后一個詞,還影響中間詞 “like” 的生成,并且會根據規劃詞改變句子結構。

圖片

通過多種干預實驗,如抑制規劃特征或注入不同的規劃詞,證實了規劃特征對最終詞概率、中間詞和句子結構的影響。

圖片

多步驟推理

針對 “Fact: the capital of the state containing Dallas is” 的提示,模型成功回答 “Austin”。

經研究發現,模型內部存在多步推理機制,通過分析歸因圖,識別出代表不同概念的特征并分組為超節點,如 “Texas”“capital”“say a capital”“say Austin” 等。

圖片

這些特征相互作用,形成從 “Dallas” 到 “Texas” 再到 “Austin” 的推理路徑,同時也存在從 “Dallas” 直接到 “say Austin” 的 “shortcut” 邊。

圖片

抑制實驗表明,抑制相關特征會影響下游特征的激活和模型輸出;

圖片

特征替換實驗發現,改變模型對 “Texas” 的表征,模型會輸出其他地區的首府,驗證了多步推理機制的存在。

圖片

數學計算

在“數學計算”當中,作者發現Claude采用了多條并行工作的計算路徑。

一條路徑計算答案的粗略近似值,另一條路徑則專注于精確確定總和的最后一位數字。

這些路徑相互作用并相互結合,以得出最終答案。

圖片

有意思的是,Claude似乎沒有意識到它在訓練期間學到的復雜的“心算”策略。

如果問它是如何得出36+59等于95的,它會描述涉及進位1的標準算法。

這可能反映了這樣一個事實——模型在解釋數學問題時會模仿人類的方式,但在自己做計算的時候“頭腦中”使用的卻是自己的一套方法。

圖片

此外,Claude團隊還用同樣的方法針對模型準確性、幻覺、越獄等問題進行了研究,關于這部分內容以及前面實驗的更多詳情,可閱讀原始論文。

下面就來看看Claude團隊這種“電路追蹤”的方法,究竟是怎么一回事。

構建替代模型,獲得歸因圖

Claude團隊用的電路追蹤方法,核心就是通過構建可解釋的替代模型來揭示語言模型的計算圖。

研究人員設計了CLT,它由和原模型層數一樣的神經元(也就是 “特征”)構成。

這些特征從原模型殘差流獲取輸入,通過線性編碼器和非線性函數處理后,能為后續多層的MLP輸出提供信息。

訓練CLT時,通過調整參數最小化重建誤差和稀疏性懲罰,讓它能盡量模仿原模型MLP的輸出。

圖片

然后,團隊把訓練好的CLT特征嵌入原模型,替換MLP神經元,構建出替代模型。

在運行替代模型時,會在MLP輸入階段計算CLT特征的激活值,在輸出階段用CLT特征的輸出替代原MLP的輸出。

圖片

為了讓替代模型更貼近原模型,研究人員針對特定的輸入提示,構建了局部替代模型。

這個模型不僅用CLT替換MLP層,還固定原模型在該提示下的注意力模式和歸一化分母,并對CLT輸出進行誤差調整,使得局部替代模型的激活和輸出與原模型完全一致。

圖片

當有了可靠的局部替代模型后,就進入生成并分析歸因圖環節。

對于給定的輸入提示,研究人員構建歸因圖來展示模型生成輸出的計算步驟。

歸因圖包含輸出節點、中間節點、輸入節點和誤差節點,圖中的邊表示這些節點間的線性影響關系。

計算邊的權重時,會用到反向雅可比矩陣。由于完整的歸因圖非常復雜,研究人員采用剪枝算法,去掉那些對輸出結果影響較小的節點和邊,從而得到簡化且更易理解的歸因圖。

圖片

為了理解歸因圖,研究人員開發了交互式可視化界面。

他們通過觀察特征在不同數據樣本上的激活情況,手動為特征標注含義,并把功能相關的特征歸為超節點。

為了驗證歸因圖的準確性,他們進行特征擾動實驗,即改變某些特征的激活值,觀察對其他特征和模型輸出的影響。

此外,還能借助歸因圖找出對輸出結果影響最大的關鍵層。

圖片

除了研究特定提示下的特征交互(歸因圖分析),研究人員還關注特征在不同上下文下的交互,這就涉及到全局權重。

其中,虛擬權重是一種全局權重,但存在干擾問題,即一些沒有實際因果關系的連接會干擾對模型機制的理解。

為解決這個問題,研究人員通過限制特征范圍或引入特征共激活統計信息(如計算 TWERA),減少干擾,從而更清晰地揭示特征間的真實關系。

圖片

研究人員對CLT特征的可解釋性以及歸因圖對模型行為的解釋程度進行了評估。

結果發現,CLT特征在一定程度上能夠反映模型內部的一些語義和句法信息,歸因圖也能夠較好地展示模型在生成輸出時的關鍵步驟和特征之間的依賴關系。

但二者也都存在一些局限性,例如對于一些復雜的語義關系,CLT特征的解釋能力有限;對于一些細微的模型行為變化,歸因圖的解釋不夠精確。

但話說回來,這種方法還是給人們帶來了有趣的發現,有人還把Claude算數學題的過程做出了表情包。

它以為自己是一步到位,實際上內心已經兜兜轉轉了好幾圈。

也是有些人類做工作匯報那味了。圖片

圖片

官方簡報:
https://www.anthropic.com/research/tracing-thoughts-language-model
方法論文:
https://transformer-circuits.pub/2025/attribution-graphs/methods.html
觀察實驗論文:
https://transformer-circuits.pub/2025/attribution-graphs/biology.html

責任編輯:張燕妮 來源: 量子位
相關推薦

2020-11-24 06:20:02

Linux日志文件系統

2024-09-04 08:27:15

2024-08-05 00:01:00

RocketMQ高性能分布式

2025-03-31 08:30:00

AI模型技術

2022-05-09 08:37:43

IO模型Java

2024-11-19 09:15:40

搜索類型MySQL

2013-09-18 10:44:01

搜狗輸入法詞語

2020-06-08 17:35:27

Redis集群互聯網

2024-12-27 12:38:54

2022-09-26 15:23:38

模型Transforme

2025-10-17 10:23:00

2023-01-27 13:32:51

大腦模型模仿

2020-10-18 18:02:32

AI機器學習微軟

2025-11-20 02:25:00

Vs CodeClaudeCursor

2025-02-12 09:10:00

AI模型數據

2025-06-30 14:04:56

ClaudeAI人工智能

2009-03-11 14:42:57

面試求職案例

2021-11-10 09:45:06

Lambda表達式語言

2022-01-12 19:59:19

Netty 核心啟動

2024-12-17 12:00:00

C++對象模型
點贊
收藏

51CTO技術棧公眾號

在线观看国产精品日韩av| 久久久99久久精品欧美| 欧美成人精品一区| 少妇一级淫片免费放播放| 中文字幕资源网在线观看免费 | 亚洲自拍偷拍九九九| 国内一区二区在线视频观看| 丰满人妻一区二区三区四区| 欧美激情视频一区二区三区免费| 亚洲激情 国产| 成 人 黄 色 小说网站 s色| 金瓶狂野欧美性猛交xxxx| 久久精品视频一区二区三区| 亚洲自拍偷拍色片视频| 中文字幕一区在线播放| 欧美日韩天堂| 在线观看国产成人av片| 亚洲婷婷在线观看| 欧美在线一级| 色婷婷精品久久二区二区蜜臂av| 综合网五月天| 国产精品一二三区视频| 波多野洁衣一区| 成人国内精品久久久久一区| 中文字幕精品三级久久久| 亚洲精品网址| 在线观看国产精品日韩av| 中文乱码人妻一区二区三区视频| 白嫩亚洲一区二区三区| 在线观看av一区| 久久久久久免费看| dy888亚洲精品一区二区三区| 久久久久久久国产精品影院| 国产精品久久国产精品| 国产欧美久久久精品免费| 丝袜a∨在线一区二区三区不卡 | 波多野结衣爱爱视频| 国产麻豆一区二区三区精品视频| 亚洲成人免费在线视频| 久久久久久无码精品人妻一区二区| 亚洲日本在线观看视频| 欧美色视频日本版| 欧美 丝袜 自拍 制服 另类| heyzo中文字幕在线| 一区二区三区.www| 日本精品福利视频| av超碰免费在线| 亚洲三级久久久| 免费在线观看污污视频| 色综合久久影院| 国产精品你懂的在线欣赏| 日本精品二区| 国产在线中文字幕| 国产欧美一区视频| 视频在线一区二区三区| av在线电影播放| 亚洲国产精品精华液2区45| 欧美人xxxxx| 九色在线免费| 国产精品久久毛片av大全日韩| 涩涩涩999| 午夜不卡视频| 亚洲女同ⅹxx女同tv| 国产手机视频在线观看| 成人ww免费完整版在线观看| 亚洲人成电影网站色mp4| 日本美女爱爱视频| 丰满大乳少妇在线观看网站| 亚洲国产精品一区二区www在线 | 555www色欧美视频| 亚洲制服在线观看| 亚洲专区**| 亚洲国产精品嫩草影院久久| 三上悠亚ssⅰn939无码播放| 久9久9色综合| 久久精品小视频| 久久免费小视频| 亚洲一区二区三区高清不卡| 热99精品里视频精品| 国产精品成人无码| 国产伦精品一区二区三区视频青涩| 成人在线观看视频网站| 午夜精品一区二区三| 97超碰欧美中文字幕| 欧美欧美一区二区| 国产黄色小视频在线| 亚洲夂夂婷婷色拍ww47| 91国视频在线| 亚洲福利影视| 亚洲国产精品久久91精品| 在线免费观看麻豆| 欧美一区在线看| 日本不卡免费高清视频| 97成人在线观看| caoporn国产一区二区| 亚洲精品一区二区三区av| 日本欧美电影在线观看| 91久久免费观看| 深夜做爰性大片蜜桃| 亚洲成aⅴ人片久久青草影院| 主播福利视频一区| 91精品国产乱码久久久张津瑜| 日韩中文字幕区一区有砖一区| 亚洲a成v人在线观看| 青青久草在线| 亚洲综合在线观看视频| 91精品无人成人www| 白嫩白嫩国产精品| 日韩有码视频在线| av大全在线观看| 国产精品亚洲а∨天堂免在线| 欧美日韩一区在线观看视频| 99热国产在线| 欧美日韩一区二区三区在线看| 黄色激情在线观看| 欧美国产专区| 国产一区视频在线| 国产精品秘入口| 五月天一区二区| 日韩欧美色视频| 色婷婷热久久| 国产精品扒开腿做爽爽爽的视频| 欧美 中文字幕| 亚洲欧美日韩小说| 亚洲第一狼人区| 免费av一区| 96精品视频在线| www.五月婷婷| 亚洲男人天堂一区| 亚洲综合日韩欧美| 欧美特黄一级大片| 欧洲精品久久久| 欧美一级淫片aaaaaa| 一区二区三区资源| 中文 日韩 欧美| 97精品国产一区二区三区| 国产精品v片在线观看不卡| 五月天婷婷在线观看| 亚洲在线视频网站| 国产黄色一区二区三区| 亚洲综合色网| 91亚洲精品一区二区| 免费黄色在线看| 欧美日韩国产天堂| 一本在线免费视频| 美女视频黄久久| 一区二区av| 高清不卡一区| 九九久久综合网站| 亚洲第一页在线观看| 亚洲综合久久av| 在线中文字日产幕| 伊人久久久大香线蕉综合直播| 草莓视频一区| 波多野结衣中文在线| 亚洲国产精品字幕| 亚洲欧美偷拍一区| 国产精品毛片无遮挡高清| 超碰在线97免费| 久久国产精品亚洲人一区二区三区| 国产精品激情av在线播放| 国产中文字幕在线| 欧美午夜精品理论片a级按摩| 手机看片日韩av| 麻豆精品精品国产自在97香蕉| 色综合久久av| 亚洲成人精品综合在线| 欧美情侣性视频| 欧美亚洲精品在线观看| 粉嫩老牛aⅴ一区二区三区| 国产精品扒开腿做爽爽| 免费成人av在线| 日韩中文字幕亚洲精品欧美| 91午夜精品| 国产91精品不卡视频| 国产黄在线看| 91精品在线免费观看| 国产系列精品av| 久久精品水蜜桃av综合天堂| 成人av毛片在线观看| 亚洲天堂男人| 欧美一级二级三级| 91精品国产色综合久久不卡粉嫩| 欧美国产中文字幕| 男人天堂亚洲二区| 欧美一区二区三区免费观看视频| 国产无遮挡裸体免费视频| 久久欧美一区二区| 91日韩精品视频| 国产日韩欧美一区在线| 亚洲国产一区二区精品视频| 日韩在线网址| 国产成人精品综合| 91cn在线观看| 国产亚洲欧美另类中文| jizz中国女人| 色94色欧美sute亚洲13| 极品久久久久久| 久久综合狠狠综合久久综合88| xxxx在线免费观看| 亚洲综合日韩| 国产精品免费看久久久无码| 羞羞答答一区二区| 亚洲影院色无极综合| 依依综合在线| 欧美激情在线有限公司| 999国产在线视频| 亚洲精品动漫久久久久| 国产精品女人久久久| 精品福利一区二区| 人妻少妇精品一区二区三区| 久久久久久黄色| 香蕉视频免费网站| 激情文学综合丁香| 天天操天天摸天天爽| 亚洲激情自拍| 国产树林野战在线播放| 红桃视频在线观看一区二区| 国产日韩亚洲精品| 亚洲91网站| 国产在线精品成人一区二区三区| 超碰aⅴ人人做人人爽欧美| 欧美激情三级免费| av理论在线观看| 日韩中文字幕网址| 久久综合九色综合久| 亚洲精品在线观看网站| www.四虎在线观看| 欧美精选一区二区| 中文字幕激情视频| 色婷婷综合久久久久中文一区二区 | 国产又粗又长又大视频| 91黄色免费版| 亚洲欧美自拍视频| 岛国av一区二区三区| 日韩精品――中文字幕| 亚洲宅男天堂在线观看无病毒| 五月天婷婷色综合| 亚洲激情图片小说视频| 日本黄色小说视频| 一区二区三区加勒比av| 希岛爱理中文字幕| 亚洲图片欧美激情| 久久国产高清视频| 亚洲欧洲精品成人久久奇米网| 精品无码在线观看| 中文一区二区在线观看| 极品蜜桃臀肥臀-x88av| 中文av字幕一区| 亚洲欧美另类日本| 国产精品第五页| 日本一级特级毛片视频| 亚洲欧洲国产专区| 激情小说中文字幕| 亚洲一二三区视频在线观看| 久久亚洲成人av| 亚洲国产综合色| 国产成人亚洲精品自产在线| 黄色一区二区在线| 天码人妻一区二区三区在线看| 欧美性xxxxhd| 亚洲精品国产欧美在线观看| 欧美日韩一区二区三区四区| 国产又粗又大又黄| 精品久久人人做人人爽| 日本黄色大片视频| 亚洲人成伊人成综合网久久久| 国产精品免费播放| 久久久精品亚洲| 波多野结衣在线高清| 奇米成人av国产一区二区三区| 日韩三级影视| 成人在线小视频| 成人爽a毛片免费啪啪红桃视频| 另类视频在线观看+1080p| 成人精品天堂一区二区三区| youjizz.com亚洲| 在线成人国产| 成人性做爰aaa片免费看不忠| 久久精品国产一区二区| 日本wwwwwww| 国产午夜精品久久久久久免费视| 国产在线观看免费视频软件| 亚洲综合成人在线| 狠狠狠狠狠狠狠| 欧美高清www午色夜在线视频| 亚洲精品一区二区三区蜜桃| 亚洲精品日韩在线| 国产传媒在线播放| 91av在线免费观看| 日本a人精品| 久久99精品久久久久久久久久| 日韩88av| 欧美视频在线观看网站 | 中文字幕第66页| 久久久精品中文字幕麻豆发布| 欧美另类videoxo高潮| 天天操天天色综合| 91成人国产综合久久精品| 亚洲国产成人精品一区二区| 成人精品一区| 91禁国产网站| 国产免费av国片精品草莓男男| 欧美日韩精品一区| 欧美三级特黄| 国产aaaaa毛片| 99久久精品费精品国产一区二区 | 午夜国产精品一区| 国产熟女精品视频| 一本久久综合亚洲鲁鲁| 国产后进白嫩翘臀在线观看视频| 国产精品久久久久久久久久久新郎| 无码国模国产在线观看| 亚洲黄色成人久久久| 在线亚洲伦理| 在线播放第一页| 亚洲私人黄色宅男| 国产天堂第一区| 亚洲欧美日韩中文在线| www.youjizz.com在线| 91久久爱成人| 雨宫琴音一区二区三区| 免费看涩涩视频| 日本一区二区免费在线| 久久中文字幕免费| 亚洲福利在线观看| 成人女同在线观看| 国产精品免费视频一区二区| 亚洲精品极品少妇16p| 五月天婷婷亚洲| 欧美高清在线视频| 成人小视频在线播放| 日韩精品欧美国产精品忘忧草| 日本h片在线| 国产精品免费视频一区二区| 欧美777四色影| 蜜桃视频无码区在线观看| 亚洲欧美日韩国产另类专区| 一区二区三区免费观看视频| 一区二区三区动漫| 日本在线视频一区二区| 日本一区二区三区精品视频| 国产精品试看| 精品国产av色一区二区深夜久久| 午夜视频久久久久久| 日韩一区二区三区不卡| 午夜欧美不卡精品aaaaa| 丁香5月婷婷久久| av之家在线观看| 久久久久久久久岛国免费| 中文字幕免费观看| 国产亚洲精品成人av久久ww| 日韩精品第一| 亚洲一区综合| 国产米奇在线777精品观看| 朝桐光av在线| 精品日韩欧美一区二区| 电影k8一区二区三区久久| 国产精品日韩一区二区| 在线综合亚洲| 少妇久久久久久久久久| 欧美艳星brazzers| 麻豆电影在线播放| 97久草视频| 久久xxxx| 中文字幕在线观看二区| 91精品国产综合久久香蕉的特点 | 成人羞羞网站| 国产女同无遮挡互慰高潮91| 亚洲精品乱码久久久久久久久| 免费国产羞羞网站视频| 欧美性受xxxx白人性爽| 日韩情爱电影在线观看| 香蕉网在线视频| 精品国产电影一区| 91电影在线播放| 成人欧美一区二区三区在线观看| 亚洲免费黄色| 99久久99久久精品免费| 欧美一级黄色片| 日韩影院在线| 亚洲人体一区| 成人av午夜电影| 日韩不卡高清视频| 欧美另类交人妖| 啄木系列成人av电影| 97人人爽人人| 欧美日韩国产在线看| 日本中文字幕视频在线| 国产精品初高中精品久久| 日本三级亚洲精品| 九九热国产精品视频| 亚洲免费视频在线观看| 国语精品视频| 欧美激情国产精品日韩| 亚洲免费观看高清完整版在线观看 | 精品一区二区影视| 成人午夜淫片100集| 不卡av在线播放| 奇米色欧美一区二区三区|