精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Claude 的腦海里在發(fā)生什么?

人工智能
Anthropic 公布了關(guān)于“追蹤語言模型思維過程”(tracing the thoughts of language models)的研究:嘗試解釋一個 LLM 是怎樣得出答案的、在生成答案時內(nèi)部發(fā)生了什么。 本篇就圍繞這一思路展開。

為什么大語言模型(LLM)能夠“樣樣精通”?

從形式上看,LLM 只是一個函數(shù):給定輸入,產(chǎn)出輸出——如此而已。然而,它們卻能勝任翻譯、診斷、推理、計算等多種任務(wù),這又是如何做到的?

圖片圖片

LLM 本質(zhì)上是一個數(shù)學(xué)函數(shù):輸入 → 輸出。

LLM 們能做的事包括:疾病初步診斷、多語互譯、算術(shù)與代數(shù)運算,乃至更復(fù)雜的推斷。為什么?

最近,Anthropic 公布了關(guān)于“追蹤語言模型思維過程”(tracing the thoughts of language models)的研究:嘗試解釋一個 LLM 是怎樣得出答案的、在生成答案時內(nèi)部發(fā)生了什么。 本篇就圍繞這一思路展開。

目標(biāo):什么叫“追蹤 LLM 的思維”?

設(shè)想你問 Claude:“36 + 59 等于多少?”

圖片圖片

我們希望知道:它是背過了這道題(比如曾在某測驗里見過),還是在推理/計算?換言之,機制不同,可信度與泛化也會不同。

圖片圖片

兩種可能的路徑:記憶 vs. 計算。

研究顯示:Claude 的策略并非“人類式的列豎式”,而是并行走兩條路——一條用粗略方式近似總和,另一條計算個位數(shù)的進(jìn)位與末位;兩條路徑的組合給出最終答案。

圖片圖片

機制:如何“追蹤”一條思維路徑?

第一步是構(gòu)造一個替代模型(replacement model)。

替代模型(Replacement model)

Anthropic 做了什么?

常見的 LLM 由多層 Attention 與 MLP(前饋網(wǎng)絡(luò))構(gòu)成,每層包含成組的“神經(jīng)元”。

圖片圖片

為了便于解釋,他們將每一層的 MLP替換為跨層轉(zhuǎn)碼器(Cross-Layer Transcoder,CLT):形似 MLP,但神經(jīng)元更多,以更細(xì)顆粒表示“特征”。

圖片圖片

訓(xùn)練目標(biāo)是讓每個轉(zhuǎn)碼器的輸出 ? 盡量逼近原 MLP 的輸出 y,即逐層對齊。

圖片圖片

此外,訓(xùn)練還引入稀疏正則——讓每個提示詞僅激活少量神經(jīng)元(特征),從而有利于“一個概念 → 少數(shù)特征”的可解釋映射。

圖片圖片

于是得到的替代模型具備三點重要性質(zhì):

  1. 近似等價:層級輸出與原模型近似一致,因此可以在不大幅改變功能的情況下做解釋;
  2. 容量更大:每層神經(jīng)元更多,代價是更低效,但更可能把“概念”單獨映射到可分離的特征上;
  3. 激活更稀疏:一次輸入只點亮少數(shù)特征,有助于“特征 ? 概念”的一對一或一對少映射。

從神經(jīng)元到“概念”:給特征貼標(biāo)簽

在替代模型里,研究者把神經(jīng)元稱為特征(features)。 若模型有 L 層、每層轉(zhuǎn)碼器維度為 m,那么總特征數(shù)約為 m×L。

圖片圖片

在 Anthropic 的實驗中,特征總量高達(dá) 3000 萬。接下來要做的,是把這些特征與可讀的概念對應(yīng)起來。

怎么做?

  • 他們先收集一批文本段落,送入模型,記錄逐 token 的激活。由于稀疏化,大多數(shù)特征為 0;少數(shù)非零者即為被激活,說明這些特征與當(dāng)前 token 的語義/形態(tài)相關(guān)。

圖片圖片

  • 然后反過來:挑一個特征,看它在什么文本模式下頻繁被點亮。若它總在“Texas/texas”之前激活,我們就可稱其為“Texas 特征”。

圖片圖片

通過這種方式,他們給大量特征貼上了可解釋的“標(biāo)簽”。進(jìn)一步地,特征大致可分為三類節(jié)點(nodes):

  1. 輸入節(jié)點(Input nodes):與輸入 token 的嵌入相關(guān);

圖片圖片

  1. 輸出節(jié)點(Output nodes):與輸出 token 的嵌入相關(guān);

圖片圖片

  1. 中間節(jié)點(Intermediate nodes):把輸入變?yōu)檩敵鏊璧闹虚g操作/概念;

圖片圖片

追蹤路徑:把“思維鏈”畫成圖

現(xiàn)在我們有了“節(jié)點”(概念化的特征),問題變成:如何復(fù)原它們之間的影響路徑,也就是模型“思考”的線路? 研究者將其稱為歸因圖(Attribution Graph)。

舉例,繼續(xù)用 “36 + 59 = ?”。

我們已知:

  • 輸入節(jié)點:由輸入 token 決定;
  • 目標(biāo)輸出節(jié)點:由模型最終輸出決定;
  • 任務(wù):找出介于兩者之間、真正推動輸出生成的那些中間節(jié)點及其有向邊(影響關(guān)系)。

圖片圖片

在實踐中,會先構(gòu)建一個大圖:節(jié)點是特征,邊代表“此特征對彼特征/對輸出 logits 的影響”。這張圖規(guī)模可達(dá)百萬級邊。 接著,對其進(jìn)行剪枝:僅保留對輸出影響顯著的節(jié)點與邊,從而獲得一個可視化、可解釋的精簡路徑。

最終的路徑圖大致如下:它解釋了 Claude 在“診斷任務(wù)”中如何分階段整合輸入線索、觸發(fā)中間概念、再導(dǎo)向輸出。

圖片圖片

小結(jié)與思考

本文聚焦于 Anthropic 近期關(guān)于電路追蹤(Circuit Tracing)的一系列工作,擇要說明了:

  • 替代模型如何在功能近似前提下提升可解釋性;
  • 稀疏激活如何幫助把“神經(jīng)元”貼上可讀標(biāo)簽;
  • 歸因圖如何把“輸入 → 中間概念 → 輸出”的邏輯鏈條具體化。

當(dāng)然,也存在局限:

  1. 替代模型畢竟是近似,與原模型的“機械同構(gòu)性”未必完美,對機制的類比可能仍有推測成分;因此,需要謹(jǐn)慎解讀。
  2. 論文中的若干示例是手工篩選與核驗過的,方法能否穩(wěn)定泛化到所有任務(wù)與模型,尚需更多證據(jù);盡管如此,在大量場景下它確實奏效。 換言之,它也許不是“徹底自底向上”理解 LLM 的終點,但無疑向前邁了一大步。
責(zé)任編輯:武曉燕 來源: 大遷世界
相關(guān)推薦

2012-12-31 14:19:18

程序應(yīng)屆畢業(yè)生

2025-04-27 08:11:26

2015-09-25 10:41:48

r語言

2013-09-27 09:42:37

工程師邏輯

2018-07-23 14:43:56

數(shù)據(jù)庫DBAMySQL

2021-04-23 23:19:26

加密貨幣穩(wěn)定幣比特幣

2013-10-09 13:12:39

App開發(fā)者

2023-04-12 08:04:09

MapReduce大數(shù)據(jù)框架

2025-07-28 06:32:12

Gogo func()

2021-08-19 17:27:41

IT數(shù)據(jù)中心災(zāi)難

2021-12-27 08:24:08

漏洞網(wǎng)絡(luò)安全

2019-11-12 14:41:41

Redis程序員Linux

2024-07-25 14:44:18

2021-11-15 14:02:27

RPCSpringBootRabbitMQ

2022-01-21 10:22:07

智能家居物聯(lián)網(wǎng)IOT

2018-01-19 12:56:19

Linux進(jìn)程

2023-08-26 07:44:13

系統(tǒng)內(nèi)存虛擬

2020-07-14 08:48:07

數(shù)據(jù)分析技術(shù)IT

2022-07-06 07:27:52

32Core樹莓派集群

2023-08-29 16:26:20

Linux命令行
點贊
收藏

51CTO技術(shù)棧公眾號

中文在线免费观看| 黄色大片在线免费看| 国产精品爽爽久久久久久| 亚洲国产不卡| 日韩av影视在线| 午夜精品中文字幕| 三级中文字幕在线观看| 国产精品久久久一本精品| 成人3d动漫一区二区三区91| 欧美丰满少妇xxxxx高潮对白| 久久99精品国产一区二区三区| 瑟瑟视频在线免费观看| 欧美日韩国产一区中文午夜| 精品久久久久久乱码天堂| 日韩国产亚洲欧美| 亚洲午夜一级| 在线成人一区二区| 大尺度在线观看| 国产亚洲欧美日韩精品一区二区三区 | 国产精品免费aⅴ片在线观看| 国产chinese精品一区二区| 精品国产乱子伦| 欧美三级乱码| 日韩一级裸体免费视频| www.av欧美| 精品欠久久久中文字幕加勒比| 欧美另类高清zo欧美| 国产在线观看福利| 国产精品69xx| 手机在线免费看av| 福利一区福利二区| 国产免费久久av| 日日摸天天添天天添破| 亚洲一级特黄| 日本免费在线播放| 国产精品成人**免费视频| 午夜成人免费视频| 在线观看成人免费| 欧美特级aaa| 成人免费高清| 中文字幕一区二区三区不卡| 日韩性感在线| www.好吊操| 极品白嫩的小少妇| 国产成人久久精品麻豆二区| 欧美日韩中文字幕日韩欧美| 欧美在线一区视频| 中日韩高清电影网| 国产精品的网站| 午夜精品区一区二区三| 日漫免费在线观看网站| heyzo一本久久综合| 97中文在线| 亚洲av永久无码国产精品久久 | 亚洲色图制服诱惑| 亚洲午夜精品一区二区| 日本久久一区二区三区| 国产精品久久九九| a网站在线观看| 精品一区二区三区香蕉蜜桃| 国产精品久久一| 波多野结衣在线电影| 久久国产高清| 国产99视频在线观看| 日本熟女毛茸茸| 日产欧产美韩系列久久99| 国产成人鲁鲁免费视频a| 久久久久久在线观看| 视频一区欧美日韩| 国产精品免费网站| 国产理论视频在线观看| 国产精品一区二区三区乱码| 鬼打鬼之黄金道士1992林正英| 亚洲精品视频网| 99久久99久久精品国产片果冻 | 国产一区二区观看| 日韩欧美亚洲国产另类| 美女搡bbb又爽又猛又黄www| 亚洲综合影院| 日韩色视频在线观看| youjizz.com国产| 欧美日韩看看2015永久免费| 亚洲欧美制服综合另类| 亚洲色图100p| 国产精品草草| 日本激情在线观看| 另类中文字幕国产精品| 黑人欧美xxxx| 成人午夜激情av| 免费成人高清在线视频| 欧美一区三区二区| 激情综合激情五月| 国产精品欧美三级在线观看| 在线精品一区二区| 欧美日本高清视频| 欧美日本亚洲| 色就是色亚洲色图| 视频午夜在线| 日韩在线影院| 在线视频中文字幕一区二区| 亚洲女人天堂色在线7777| 免费亚洲一区二区| 午夜视频在线看| 亚洲自拍偷拍图区| www日韩在线观看| 成人污版视频| 亚洲毛片在线看| 欧美性x x x| 亚洲在线国产日韩欧美| 久久精品中文字幕电影| 久久久久亚洲av无码专区 | 视频一区视频二区视频三区高| 拍真实国产伦偷精品| 欧美日韩在线免费观看| 深夜福利网站在线观看| 国产午夜一区| 国模私拍视频一区| 国产精品一区二区人人爽| 91久色porny| 男人添女人下部视频免费| 韩国成人在线| 精品一区二区三区三区| 久久中文字幕在线观看| 激情综合网av| 日韩影片在线播放| 女厕盗摄一区二区三区| 精品久久久久香蕉网| 中文字幕在线观看二区| 欧美日韩国产精品一区二区三区四区 | 国产精品久久久久久久一区二区| 91丨porny丨户外露出| 日韩国产精品毛片| 日本一区二区电影| 亚洲最新av| 欧美精品免费在线| 久久精品国产亚洲av麻豆蜜芽| 成年人在线观看网站| 国产一区中文字幕| 日韩欧美在线观看强乱免费| 新版的欧美在线视频| 欧美精品一区二区蜜臀亚洲| 中文字幕另类日韩欧美亚洲嫩草| 蜜桃精品视频在线| 五月天国产一区| 欧美aaa视频| 亚洲人成在线电影| 精产国品一区二区| 久久免费午夜影院| 国产xxxxx在线观看| 伊人成综合网伊人222| 欧美一区二区三区…… | 精久久久久久久久久久| 这里只有精品66| 日韩在线激情| 久久久精品网站| 精品国产无码一区二区| 一区二区三区四区激情| 国产乱叫456| 欧美激情一级片一区二区| 3d动漫精品啪啪一区二区三区免费 | 成人福利视频在线看| 波多野结衣av一区二区全免费观看| 视频一区日韩精品| 欧美日韩网站| 91色精品视频在线| 在线中文字幕第一页| 高清av在线| 一区二区三区.www| 中文字幕在线永久| 亚洲欧美高清| 亚洲国产日韩综合一区| 4438五月综合| 久久久久久伊人| 麻豆导航在线观看| 欧美日韩国产一区| 久久久久久久极品内射| 91在线观看下载| 日本美女高潮视频| 欧美在线三区| 欧美黄色直播| avtt久久| 欧洲成人免费aa| 色综合久久影院| 精品粉嫩aⅴ一区二区三区四区| 亚洲男人的天堂在线视频| 中文字幕成人在线观看| 日本不卡免费新一二三区| 国产一级大片在线观看| 波多野结衣一区| 91社区国产高清| 欧美aa在线| 俺去啦;欧美日韩| 天堂国产一区二区三区| 欧美日韩精品一区视频| 久久精品女人毛片国产| 国产亚洲精品7777| 日韩成人av影院| 免费看精品久久片| 国内精品视频一区二区三区| 久久亚洲影视| 久久国产精品亚洲va麻豆| 色8久久久久| 2019中文字幕在线| 哥也色在线视频| 亚洲香蕉成人av网站在线观看| 精品人妻一区二区三区麻豆91| 日韩欧美综合在线视频| 亚洲天堂2024| 九九**精品视频免费播放| 国产黄页在线观看| 中文字幕免费精品| 亚洲国产精品综合| 欧美日韩一区二区三区在线电影 | 在线亚洲欧美视频| 熟妇人妻一区二区三区四区| 91麻豆精品国产自产在线观看一区 | 成人黄动漫网站免费| 国产精品第一| 欧美最猛性xxxx| 国产经典三级在线| 久久影视免费观看 | 欧美激情xxxx| 国产美女视频一区二区三区| 精品视频一区在线视频| 亚洲第一精品网站| 欧美一区二区三区思思人| 中文人妻熟女乱又乱精品| 欧美日韩在线视频一区| 天堂资源在线播放| 亚洲一区二区三区爽爽爽爽爽| 三级在线观看免费大全| 中文字幕一区二区三区色视频| 国产精品高清无码在线观看| 99久久精品国产毛片| 女性生殖扒开酷刑vk| 高清久久久久久| 又黄又爽又色的视频| 国内精品免费在线观看| 国产aⅴ爽av久久久久| 九九热在线视频观看这里只有精品| 色多多视频在线播放| 丝袜国产日韩另类美女| 久久久久狠狠高潮亚洲精品| 六月天综合网| 免费大片在线观看| 日日欢夜夜爽一区| 中文字幕第36页| 人人狠狠综合久久亚洲| 亚洲欧美自偷自拍另类| 狠狠色狠狠色合久久伊人| 亚洲av无日韩毛片久久| 国产成人aaa| 亚洲欧美日韩色| 99久久精品国产一区二区三区| 国产精品无码一区二区三区免费 | 日韩精品专区在线影院观看| 性少妇videosexfreexxx片| 欧美大片在线观看| 熟妇人妻一区二区三区四区| 亚洲精品在线视频| 国产尤物视频在线| 色噜噜久久综合伊人一本| 国产婷婷视频在线| 色综合五月天导航| 极品美鲍一区| 国产精品免费网站| 久久在线观看| 欧美1o一11sex性hdhd| 成人激情诱惑| 精品无码av无码免费专区| 国产 日韩 欧美 综合 一区| 好吊色欧美一区二区三区| 国产精品午夜一区二区三区| 一区二区三区四区五区精品| 欧美激情1区2区| 大陆极品少妇内射aaaaa| 蜜臀久久99精品久久久画质超高清 | 九九久久国产| 99热99热| 国产成人精品一区二区免费看京| 日本特级黄色大片| 亚洲激情另类| 乱子伦一区二区| 激情文学一区| 91香蕉视频污版| 懂色av中文一区二区三区| 国产伦理片在线观看| 一区二区三区四区不卡在线| 6080午夜伦理| 欧美一二三在线| 久久精品a一级国产免视看成人| 色视频www在线播放国产成人| 国产又色又爽又黄刺激在线视频| 日韩av免费网站| 亚洲精品在线播放| 婷婷久久五月天| 亚洲国内欧美| 三区视频在线观看| 国产色一区二区| 日韩aaaaaa| 91麻豆精品国产91久久久使用方法 | 亚洲欧美另类在线观看| h片在线免费| 国产精品美女在线观看| 另类在线视频| 男插女免费视频| 日韩成人av影视| 朝桐光av一区二区三区| 亚洲欧美精品午睡沙发| 一级片视频在线观看| 精品国产一区a| 国内精品久久久久久野外| 国产精品777| 亚洲丁香日韩| 免费看日本毛片| 不卡av在线免费观看| 日本在线一级片| 欧美色老头old∨ideo| 青青草观看免费视频在线| 欧美寡妇偷汉性猛交| www久久久| 亚洲巨乳在线观看| 三级欧美在线一区| 午夜欧美性电影| 中文字幕人妻互换av久久| 欧美制服丝袜第一页| 天堂av电影在线观看| 久久久噜噜噜久久| 精品亚洲二区| 久久99国产精品一区| 国内外成人在线视频| 久草福利资源在线| 欧美日韩亚洲综合在线 | 成人在线观看a| 91啪亚洲精品| 欧美另类一区二区| 亚洲国产精品一区二区三区| 久久99亚洲网美利坚合众国| 92国产精品视频| 亚洲九九在线| xxxx国产视频| 亚洲午夜免费电影| 亚洲毛片在线播放| 欧美激情小视频| 在线精品国产亚洲| 无码人妻少妇伦在线电影| youjizz久久| 欧美国产成人精品一区二区三区| 日韩精品免费一线在线观看| 亚洲三级欧美| 欧美一级二级三级| 日韩avvvv在线播放| 啪啪一区二区三区| 在线播放/欧美激情| 哥也色在线视频| 国产精品免费在线| aa亚洲婷婷| 成人国产精品久久久网站| 欧美性视频一区二区三区| 91女主播在线观看| 国产日韩欧美日韩| 欧美成人一区二免费视频软件| 成年人看片网站| 精品日韩美女的视频高清| 国产粉嫩一区二区三区在线观看| 国产精品人成电影| 欧美淫片网站| 国产精品探花一区二区在线观看| 色欧美乱欧美15图片| 香蕉视频免费在线播放| 高清国语自产拍免费一区二区三区| 国产精品日韩久久久| 999久久久国产| 亚洲先锋影音| 国产99在线免费| 激情综合在线| 欧美18—19性高清hd4k| 91精品国产aⅴ一区二区| 美女网站视频在线| 欧美日韩在线精品一区二区三区| 麻豆精品国产91久久久久久| 久久久国产精华液| 亚洲欧洲在线视频| 精品视频在线播放一区二区三区 | 亚洲成人精品视频在线观看| 成人福利av| 国产内射老熟女aaaa| 2017欧美狠狠色| 国产免费不卡av| 欧美一区二区三区免费视| 先锋资源久久| 中文字幕国产综合| 日韩欧美激情四射| 电影亚洲一区| av免费观看国产| 亚洲欧洲国产日韩| 青青国产在线| 国产精品有限公司| 美女视频网站黄色亚洲| 国产精品23p|