精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

經(jīng)逆向工程,Transformer「翻譯」成數(shù)學(xué)框架 | 25位學(xué)者撰文

新聞 人工智能
在本文中,由 25 位研究者參與撰寫的論文,嘗試采用最原始的步驟逆向 transformer。

 Transformer 是 Google 團隊在 2017 年 6 月提出的 NLP 經(jīng)典之作,由 Ashish Vaswani 等人在論文《 Attention Is All You Need 》中提出。自 Transformer 出現(xiàn)以來,便在 NLP、CV、語音、生物、化學(xué)等領(lǐng)域引起了諸多進展。

Transformer 在現(xiàn)實世界中的應(yīng)用越來越廣泛,例如 GPT-3 、LaMDA 、Codex 等都是基于 Transformer 架構(gòu)構(gòu)建的。然而,隨著基于 Transformer 模型的擴展,其開放性和高容量為意想不到的甚至有害的行為創(chuàng)造了越來越大的空間。即使在大型模型訓(xùn)練完成數(shù)年后,創(chuàng)建者和用戶也會經(jīng)常發(fā)現(xiàn)以前從來沒見過的模型問題。

解決這些問題的一個途徑是機械的可解釋性(mechanistic interpretability),即對 transformers 計算過程進行逆向工程,這有點類似于程序員如何嘗試將復(fù)雜的二進制文件逆向工程為人類可讀的源代碼。

如果逆向工程可行,那么我們就會有更系統(tǒng)的方法來解釋當(dāng)前模型的安全問題、識別問題,甚至可能預(yù)見未來尚未構(gòu)建的模型安全問題。這有點類似于將 Transformer 的黑箱操作進行逆向,讓這一過程變得清晰可見。之前有研究者開發(fā)了 Distill Circuits thread 項目,曾嘗試對視覺模型進行逆向工程,但到目前為止還沒有可比的 transformer 或語言模型進行逆向工程研究。

在本文中,由 25 位研究者參與撰寫的論文,嘗試采用最原始的步驟逆向 transformer。該論文由 Chris Olah 起草,Chris Olah 任職于 Anthropic 人工智能安全和研究公司,主要從事逆向工程神經(jīng)網(wǎng)絡(luò)研究。之后 Neel Nanda 對論文初稿進行了重大修改,Nanda 目前是 DeepMind 的一名研究工程實習(xí)生。Nelson Elhage 對論文進行了詳細(xì)的編輯以提高論文章節(jié)清晰度,Nelson Elhage 曾任職于 Stripe 科技公司。

[[442646]]

左:Neel Nanda;右:Christopher Olah

考慮到語言模型的復(fù)雜性高和規(guī)模大等特點,該研究發(fā)現(xiàn),從最簡單的模型開始逆向 transformer 最有效果。該研究旨在發(fā)現(xiàn)簡單算法模式、主題(motifs)或是框架,然后將其應(yīng)用于更復(fù)雜、更大的模型。具體來說,他們的研究范圍僅包括只有注意力塊的兩層或更少層的 transformer 模型。這與 GPT-3 這樣的 transformer 模型形成鮮明的對比,GPT-3 層數(shù)多達(dá) 96 層。

經(jīng)逆向工程,Transformer「翻譯」成數(shù)學(xué)框架 | 25位學(xué)者撰文

論文地址:https://transformer-circuits.pub/2021/framework/index.html#acknowledgments

該研究發(fā)現(xiàn),通過以一種新的但數(shù)學(xué)上等效的方式概念化 transformer 操作,我們能夠理解這些小模型并深入了解它們的內(nèi)部運作方式。值得注意的是,研究發(fā)現(xiàn)特定的注意頭,本文稱之為歸納頭(induction heads),可以在這些小模型中解釋上下文學(xué)習(xí),而且這些注意力頭只在至少有兩個注意層的模型中發(fā)展。此外,該研究還介紹了這些注意力頭對特定數(shù)據(jù)進行操作的一些示例。

各章節(jié)內(nèi)容概覽

為了探索逆向工程 transformers 面臨哪些挑戰(zhàn),研究者對幾個 attention-only 的 toy 模型進行了逆向功能。

首先是零層 transformers 模型的二元統(tǒng)計。研究者發(fā)現(xiàn),二元表可以直接通過權(quán)重訪問。

經(jīng)逆向工程,Transformer「翻譯」成數(shù)學(xué)框架 | 25位學(xué)者撰文

在討論更復(fù)雜的模型之前,考慮零層(zero layer)transformer 很有用。這類模型接受一個 token,嵌入,再取消嵌入,以生成預(yù)測下一個 token 的 logits

由于這類模型無法從其他 tokens 傳輸信息,因此只能從當(dāng)前 token 預(yù)測下一個 token。這意味著,W_UW_E 的最優(yōu)行為是近似二元對數(shù)似然。

經(jīng)逆向工程,Transformer「翻譯」成數(shù)學(xué)框架 | 25位學(xué)者撰文

零層 attention-only transformers 模型。

其次,單層 attention-only transformers 是二元和 skip 三元模型的集合。同零層 transformers 一樣,二元和 skip 三元表可以直接通過權(quán)重訪問,無需運行模型。這些 skip 三元模型的表達(dá)能力驚人,包括實現(xiàn)一種非常簡單的上下文內(nèi)學(xué)習(xí)。

對于單層 attention-only transformers 模型,有哪些路徑擴展(path expansion)技巧呢?研究者提供了一些。

如下圖所示,單層 attention-only transformers 由一個 token 嵌入組成,后接一個注意力層(單獨應(yīng)用注意力頭),最后是解除嵌入:

經(jīng)逆向工程,Transformer「翻譯」成數(shù)學(xué)框架 | 25位學(xué)者撰文

使用之前得到的張量標(biāo)記(tensor notation)和注意力頭的替代表征,研究者可以將 transformer 表征為三個項的乘積,具體如下圖所示:

經(jīng)逆向工程,Transformer「翻譯」成數(shù)學(xué)框架 | 25位學(xué)者撰文

研究者采用的核心技巧是簡單地擴展乘積,即將乘積(每個項對應(yīng)一個層)轉(zhuǎn)換為一個和,其中每個項對應(yīng)一個端到端路徑。他們表示,每個端到端路徑項都易于理解,可以獨立地進行推理,并能夠疊加組合創(chuàng)建模型行為。

經(jīng)逆向工程,Transformer「翻譯」成數(shù)學(xué)框架 | 25位學(xué)者撰文

最后,兩層 attention-only transformers 模型可以使用注意力頭組合實現(xiàn)復(fù)雜得多的算法。這些組合算法也可以直接通過權(quán)重檢測出來。需要注意的是,兩層模型適應(yīng)注意力頭組合創(chuàng)建「歸納頭」(induction heads),這是一種非常通用的上下文內(nèi)學(xué)習(xí)算法。

具體地,當(dāng)注意力頭有以下三種組合選擇:

  • Q - 組合:W_Q 在一個受前面頭影響的子空間中讀取;
  • K - 組合:W_K 在一個受前面頭影響的子空間中讀??;
  • V - 組合:W_V 在一個受前面頭影響的子空間中讀取。

研究者表示,Q - 和 K - 組合與 V - 組合截然不同。前兩者都對注意力模式產(chǎn)生影響,允許注意力頭表達(dá)復(fù)雜得多的模式。而 V - 組合對一個注意力頭專注于某個給定位置時所要傳輸?shù)男畔a(chǎn)生影響。結(jié)果是,V - 組合頭變現(xiàn)得更像一個單一單元,并可以考慮用來創(chuàng)建額外的「虛擬注意力頭」。

對于 transformer 有一個最基礎(chǔ)的問題,即「如何計算 logits」?與單層模型使用的方法一樣,研究者寫出了一個乘積,其中每個項在模型中都是一個層,并擴展以創(chuàng)建一個和,其中每個項在模型中都是一個端到端路徑。

經(jīng)逆向工程,Transformer「翻譯」成數(shù)學(xué)框架 | 25位學(xué)者撰文

其中,直接路徑項和單個頭項與單層模型中的相同。最后的「虛擬注意力頭」項對應(yīng)于 V - 組合。虛擬注意力頭在概念上非常有趣,但在實踐中,研究者發(fā)現(xiàn)它們往往無法在小規(guī)模的兩層模型中發(fā)揮重大作用。

此外,這些項中的每一個都對應(yīng)于模型可以實現(xiàn)更復(fù)雜注意力模式的一種方式。在理論上,很難對它們進行推理。但當(dāng)討論到歸納頭時,會很快在具體實例中用到它們。

 

責(zé)任編輯:張燕妮 來源: 機器之心Pro
相關(guān)推薦

2022-02-10 15:15:41

人工智能強化學(xué)習(xí)谷歌

2023-01-09 13:06:21

AI

2016-01-05 15:20:02

Reverse逆向工具逆向工程

2022-04-19 09:24:18

QtC++框架

2020-09-28 10:47:41

Shellcode技術(shù)

2021-06-25 15:36:37

框架AI開發(fā)

2011-08-29 15:45:59

Lua函數(shù)

2011-03-24 09:57:28

PowerDesign逆向工程

2022-09-26 00:00:01

java代碼開發(fā)

2023-08-07 18:55:19

2023-05-23 14:05:09

智能AI

2022-03-26 10:18:26

GoogleRust獲獎?wù)?/a>

2022-11-01 13:52:44

AI數(shù)學(xué)

2021-04-02 06:18:27

Docker鏡像

2023-07-17 07:25:48

2017-07-11 09:46:00

防火墻翻譯安全

2023-10-11 12:32:53

AI模型

2019-04-11 18:31:29

面試開發(fā)架構(gòu)

2010-03-31 22:20:51

2025-06-03 09:08:49

點贊
收藏

51CTO技術(shù)棧公眾號

91视频88av| 91精品国产高清一区二区三区蜜臀 | 欧美日韩一区二区三区在线 | 免费av网站在线看| 国产一区二区精品在线观看| 欧美精品久久一区二区| 国产高清自拍视频| 极品美女一区| 亚洲女人****多毛耸耸8| 国产精品加勒比| 在线免费观看一级片| 欧美全黄视频| 亚洲一级免费视频| 任你躁av一区二区三区| 伊人久久在线观看| 污污网站在线免费观看| 麻豆精品国产91久久久久久| 久久久久久国产精品久久| 亚洲精品91在线| 凹凸成人在线| 4438x亚洲最大成人网| 国产超级av在线| 污污片在线免费视频| 中文av一区特黄| 免费成人看片网址| 精品久久久无码中文字幕| 免费观看久久久4p| 青青a在线精品免费观看| 久久伊人成人网| 五月激情久久久| 中文字幕欧美精品在线| 亚洲第一黄色网址| 国产精品美女在线观看直播| 欧美一区二区三区视频在线| 黄色手机在线视频| 成人软件在线观看| 色综合天天综合网天天狠天天| www.日本在线视频| 亚洲色图美国十次| 亚洲人成在线观看一区二区| 亚洲三级一区| 91大神在线网站| 日本一区二区三区久久久久久久久不| 国语精品中文字幕| 亚洲国产精品二区| 国产福利一区二区三区在线视频| 成人免费视频网| 一级片视频播放| 擼擼色在线看观看免费| 亚洲三级在线免费| 国产欧美自拍视频| 91蜜桃在线视频| ...av二区三区久久精品| 一本一本a久久| 亚乱亚乱亚洲乱妇| 中文字幕一区二区三区在线播放 | 精品美女视频在线观看免费软件| 91女人视频在线观看| 久久精品久久精品国产大片| 水莓100国产免费av在线播放| 不卡一区中文字幕| 久久久人人爽| 成年午夜在线| 中文字幕一区二区三| 国产精品久久久久婷婷| 欧美中文在线观看| 中文字字幕在线中文| 性色一区二区三区| 日本精品久久久久影院| 精品一区二三区| 精品一区二区三区av| 91在线看www| 亚洲欧美另类综合| 久久嫩草精品久久久久| 亚洲国产一区在线| av网站大全在线| 亚洲国产精品久久艾草纯爱| 国模吧无码一区二区三区| 成人日韩精品| 日韩一级二级三级| 激情综合丁香五月| 大色综合视频网站在线播放| 久久久久北条麻妃免费看| 久久这里只有精品国产| 性欧美xxxx大乳国产app| 国产精品老牛影院在线观看| 国产精品久久久国产盗摄| 成人妖精视频yjsp地址| 欧美午夜视频在线| av网址在线看| 日韩欧美在线视频免费观看| 女人高潮一级片| 精品国产一区二区三区成人影院 | 国产欧美日韩一区| 国产片在线观看| 黄视频免费在线看| 99re热这里只有精品视频| 日本一区高清不卡| 肉肉视频在线观看| 在线日韩国产精品| 国产污在线观看| 精品一区二区三| 国产最新精品视频| 在线观看国产黄| 99久久久无码国产精品| 中文字幕一区二区三区最新| 免费v片在线观看| 在线91免费看| 欧美成人国产精品一区二区| 韩国欧美一区| 国产一区二区在线播放| 五月婷婷开心中文字幕| 亚洲男同性恋视频| 在线免费观看视频黄| 精品视频在线你懂得| 久久五月情影视| 亚洲精品国产精品国自产网站按摩| 国产91在线|亚洲| 中文字幕中文字幕在线中一区高清| 密臀av在线播放| 欧美精品一区男女天堂| a在线视频播放观看免费观看| 老司机精品福利视频| 精品国产一区二区三区久久久久久| 成人毛片av在线| 欧美视频一区二区在线观看| 国产在线观看无码免费视频| 黄色成人av网站| 91免费精品国偷自产在线| av在线免费观看网站| 日韩三级在线| 久久中文字幕在线视频| 中文字幕一区二区三区人妻四季| 91在线国内视频| 你真棒插曲来救救我在线观看| 日韩欧美在线视频播放| 97一区二区国产好的精华液| 久久久精品久久久| 中文在线字幕免费观| 91在线精品一区二区三区| 天堂…中文在线最新版在线| 91夜夜蜜桃臀一区二区三区| 久久久精品久久久久| 国产乱淫片视频| 亚洲欧洲国产日本综合| 在线观看亚洲色图| 人人狠狠综合久久亚洲婷| 国产精品成人久久久久| 成年在线电影| 欧美色综合网站| 在线免费看视频| 久久爱www久久做| 亚洲一区二区在线看| 福利视频亚洲| 日韩中文字幕网站| 国产日产亚洲系列最新| 亚洲激情中文1区| 国产调教打屁股xxxx网站| 亚洲婷婷在线| 国产视频一区二区三区四区| 麻豆蜜桃在线观看| 亚洲社区在线观看| 中文字幕一区二区久久人妻| 国产精品国产三级国产普通话99| 久国产精品视频| 欧美成人精品| 久久久久久久久久久一区| 午夜精品久久久久久久久久蜜桃| 国产午夜精品一区二区三区| 中文字幕在线观看视频一区| 专区另类欧美日韩| av不卡中文字幕| 蜜桃久久av| 夜夜爽99久久国产综合精品女不卡 | 欧美亚洲一级| 亚洲 日韩 国产第一区| 高清精品久久| 午夜精品在线观看| 国产区视频在线播放| 制服视频三区第一页精品| 劲爆欧美第一页| 久久色在线观看| 午夜视频在线网站| 亚洲国内自拍| 天堂一区二区三区| 午夜视频在线观看精品中文| 欧美亚洲在线观看| 欧美69xxx| 亚洲精品wwwww| 中文字幕在线播放av| 一区二区三区日韩| 国产一二三四五区| 国产精品一区二区在线观看网站| koreanbj精品视频一区| 欧美激情电影| 久久精品日韩精品| 精品国产欧美| 欧美在线激情网| 成人免费视屏| 亚洲欧洲午夜一线一品| 99在线精品视频免费观看软件 | 欧美人与性动交| 成人在线播放视频| 亚洲福利在线视频| 国产精品自偷自拍| 日本韩国欧美国产| 久久亚洲AV无码| 最新国产在线观看| 色国产精品一区在线观看| 丰满少妇被猛烈进入一区二区| 久久蜜桃av一区精品变态类天堂 | 一级全黄少妇性色生活片| 午夜久久久久久久久久一区二区| a级黄色免费视频| 99r国产精品| 人妻 丝袜美腿 中文字幕| 免费在线视频一区| 日韩 欧美 高清| 亚洲人成免费| www.男人天堂网| 图片区亚洲欧美小说区| 亚洲乱码一区二区三区| 免费视频一区三区| 九色91在线视频| 风间由美中文字幕在线看视频国产欧美| 成人福利视频网| 成人四虎影院| 国产成人一区二区在线| 黑人巨大精品| 2019中文在线观看| 岛国av在线网站| 欧美激情欧美狂野欧美精品| 国产丝袜在线| 久久激情视频久久| 黄色片网站在线| 日韩在线免费高清视频| 国产视频网址在线| 亚洲午夜精品视频| 可以直接在线观看的av| 亚洲乱码国产乱码精品精| 午夜激情小视频| 日韩成人av网| 色在线免费视频| 精品一区精品二区| 神马久久精品| 亚洲人免费视频| 国产精品毛片一区二区三区四区| 亚洲欧美中文日韩在线v日本| 欧美大片aaa| 亚洲人午夜色婷婷| 9191在线观看| 欧美成年人视频网站| free性欧美hd另类精品| 欧美激情第三页| 美女网站视频在线| 午夜免费日韩视频| 天堂中文最新版在线中文| 热久久这里只有精品| 最新欧美电影| 国产视频福利一区| 538任你躁精品视频网免费| 国产精品裸体一区二区三区| 青青草这里只有精品| 欧美1o一11sex性hdhd| 在线亚洲欧美日韩| 久久久噜噜噜| 精品久久久久久中文字幕2017| 久久综合中文| 欧美视频国产视频| 国产不卡在线一区| 在线观看av中文字幕| 中文字幕av不卡| 欧洲第一无人区观看| 亚洲国产一二三| 探花视频在线观看| 欧美日韩高清在线播放| 国产极品999| 亚洲欧美日本另类| 毛片在线看网站| 欧美精品999| 欧美成人app| http;//www.99re视频| 思热99re视热频这里只精品| 亚洲日本精品一区| 极品尤物久久久av免费看| 欧美日韩亚洲一二三| 国产美女在线观看一区| 日本少妇色视频| ...av二区三区久久精品| 日韩精品在线观看免费| 欧美日本国产视频| 人成免费电影一二三区在线观看| 精品国产一区二区三区四区在线观看 | 亚洲高清不卡在线| 精人妻无码一区二区三区| 日韩手机在线导航| 国产小视频在线| 欧美成人性生活| 高清电影一区| 国产精品毛片va一区二区三区| 成人激情电影在线| 欧美激情视频免费看| 久久99精品视频| 美女100%无挡| 亚洲动漫第一页| 一区二区三区免费在线| 日韩精品免费在线| 亚洲综合伊人久久大杳蕉| 国产精品久久久久久久久久新婚| jizz性欧美23| eeuss中文| 日韩激情视频网站| 人体私拍套图hdxxxx| 亚洲精品国产成人久久av盗摄| 久久久久久久久久成人| 欧美精品一区在线观看| av大片在线| 成人免费高清完整版在线观看| 神马电影久久| 欧美 日韩 激情| 成人精品视频一区二区三区| 日本高清不卡免费| 欧美三级在线视频| 国产大片在线免费观看| 57pao精品| 欧美理伦片在线播放| 欧美中日韩在线| 国产精品自拍在线| 四虎884aa成人精品| 欧美日本精品一区二区三区| 91在线网址| 国产精品久久久久影院日本| 一区二区三区四区在线看| 日韩av三级在线| 99精品视频在线观看免费| 久久久久99精品| 精品国产成人系列| 秋霞在线视频| 国产麻豆视频精品| 免费不卡的av| 亚洲一级片在线观看| www.狠狠干| 欧美国产欧美亚洲国产日韩mv天天看完整| www.成人在线.com| 在线观看欧美激情| 国内精品免费在线观看| 国产一二三四区| 日韩午夜精品视频| 美足av综合网| 极品尤物一区二区三区| 中文精品在线| 9.1成人看片免费版| 91精品1区2区| 生活片a∨在线观看| 国产日韩亚洲欧美| 综合久久综合| 折磨小男生性器羞耻的故事| 午夜精品久久久久久久99水蜜桃 | www一区二区| 日韩在线播放中文字幕| 在线观看欧美www| 亚洲三级在线| 免费特级黄色片| ww亚洲ww在线观看国产| 欧美在线视频精品| 久久精品国产2020观看福利| 亚洲精品在线a| 少妇av一区二区三区无码| 91麻豆成人久久精品二区三区| 日韩国产成人在线| www.亚洲免费视频| 哺乳一区二区三区中文视频 | 新片速递亚洲合集欧美合集| 神马影院一区二区| 国产一区在线视频| 日韩网红少妇无码视频香港| 亚洲人成电影网站色www| 色婷婷成人网| 青青草国产精品视频| 国产女人aaa级久久久级| 国产不卡av在线播放| 91国产中文字幕| 99国产精品一区二区| 国产极品一区二区| 欧美三级午夜理伦三级中视频| 午夜在线激情影院| 青青影院一区二区三区四区| 国产一本一道久久香蕉| 无码视频一区二区三区| 久久中国妇女中文字幕| 免费av一区| 亚洲综合中文网| 日韩欧美国产高清91| av在线app| 婷婷久久青草热一区二区| 福利视频网站一区二区三区| 怡春院在线视频| 91成人在线播放| 欧美黄污视频| 欧美日韩国产黄色|