精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

OpenAI震撼研究:用GPT-4解釋30萬神經(jīng)元,原來AI的黑盒要AI自己去打開

人工智能
目前推進(jìn)AI可解釋性研究的一個(gè)簡(jiǎn)單辦法,就是逐個(gè)分析大模型中的神經(jīng)元,手動(dòng)檢查以確定它們各自所代表的數(shù)據(jù)特征。

沒想到,打開AI黑盒這件事,可能還要靠AI自己來實(shí)現(xiàn)了。

OpenAI的最新研究來了一波大膽嘗試:

讓GPT-4去解釋GPT-2的行為模式。

結(jié)果顯示,超過1000個(gè)神經(jīng)元的解釋得分在0.8以上——也就是說GPT-4能理解這些神經(jīng)元。

圖片

要知道,“AI黑箱難題”長(zhǎng)期以來是一個(gè)熱議話題,尤其是大語言模型領(lǐng)域,人類對(duì)其內(nèi)部工作原理的理解還非常有限,這種“不透明化”也進(jìn)一步引發(fā)了人類對(duì)AI的諸多擔(dān)憂。

目前推進(jìn)AI可解釋性研究的一個(gè)簡(jiǎn)單辦法,就是逐個(gè)分析大模型中的神經(jīng)元,手動(dòng)檢查以確定它們各自所代表的數(shù)據(jù)特征。

但對(duì)于規(guī)模已經(jīng)達(dá)到百億、千億級(jí)別的大規(guī)模神經(jīng)網(wǎng)絡(luò)來說,工作量和工作難度就都漲了億點(diǎn)點(diǎn)吧。

由此,OpenAI的研究人員想到,干嘛不讓AI去自動(dòng)化搞定這個(gè)大工程?

圖片

在這項(xiàng)最新的研究中,他們將GPT-4打造成了一個(gè)理解AI行為模式的工具,把GPT-2超過30萬個(gè)神經(jīng)單元都解釋了一遍,并和實(shí)際情況比對(duì)進(jìn)行評(píng)分。

最終生成的解釋數(shù)據(jù)集和工具代碼,已對(duì)外開源。

研究人員表示:未來,這種AI工具可能在改善LLM性能上發(fā)揮巨大作用,比如減少AI偏見和有害輸出。

解釋接近人類水平

具體來看,整個(gè)研究的步驟可以分為三步。

第一步,先給GPT-4一段文本,并展示GPT-2在理解這段文本時(shí)激活的神經(jīng)元情況。

然后讓GPT-4來解釋,這段文本中神經(jīng)元的激活情況。

圖片

比如示例中給出了一段漫威復(fù)聯(lián)的文本,GPT-4分析的激活神經(jīng)元為:

電影、角色和娛樂

第二步,讓GPT-4開始模擬,這些被解釋的神經(jīng)元接下來會(huì)做什么。

GPT-4給出了一段內(nèi)容。

圖片

第三步,讓GPT-2真實(shí)的神經(jīng)元激活來生成結(jié)果,然后和GPT-4模擬的結(jié)果進(jìn)行比對(duì),研究人員會(huì)對(duì)此打分。

圖片

在博客給出的示例中,GPT-4的得分為0.34.

使用這個(gè)辦法,研究人員讓GPT-4解釋了GPT-2一共307200個(gè)神經(jīng)元。

OpenAI表示,使用這一基準(zhǔn),AI解釋的分?jǐn)?shù)能接近人類水平。

從總體結(jié)果來看,GPT-4在少數(shù)情況下的解釋得分很高,在0.8分以上。

圖片

他們還發(fā)現(xiàn),不同層神經(jīng)元被激活的情況,更高層的會(huì)更抽象。

圖片

此外,團(tuán)隊(duì)還總結(jié)了如下幾點(diǎn)結(jié)論:

  • 如果讓GPT-4重復(fù)解釋,它的得分能更高
  • 如果使用更強(qiáng)大的模型來解釋,得分也會(huì)上升
  • 用不同的激活函數(shù)訓(xùn)練模型,能提高解釋分?jǐn)?shù)

總結(jié)來看就是,雖然GPT-4目前的表現(xiàn)一般,但是這個(gè)方法和思路的提升空間還有很大。

團(tuán)隊(duì)也強(qiáng)調(diào),現(xiàn)在在GPT-2上的表現(xiàn)都不太好,如果換成更大、更復(fù)雜的模型,表現(xiàn)也會(huì)比較堪憂。

同時(shí)這種模式也能適用于聯(lián)網(wǎng)的LLM,研究人員認(rèn)為可以通過簡(jiǎn)單調(diào)整,來弄清楚神經(jīng)元如何決策搜索內(nèi)容和訪問的網(wǎng)站。

此外他們還表示,在創(chuàng)建這個(gè)解釋系統(tǒng)時(shí)并沒有考慮商業(yè)化問題,理論上除了GPT-4,其他LLM也能實(shí)現(xiàn)類似效果。

接下來,他們打算解決研究中的這幾個(gè)問題:

  • AI神經(jīng)元行為十分復(fù)雜,但GPT-4給的解釋非常簡(jiǎn)單,所以有些復(fù)雜行為還無法解釋;
  • 希望最終自動(dòng)找到并解釋復(fù)雜的整個(gè)神經(jīng)回路,神經(jīng)元和注意力頭一起工作;
  • 目前只解釋了神經(jīng)元的行為,但沒解釋行為背后的機(jī)制;
  • 整個(gè)過程算力消耗巨大。

網(wǎng)友:快進(jìn)到AI創(chuàng)造AI

意料之中,這項(xiàng)研究馬上在網(wǎng)絡(luò)上引發(fā)熱議。

大家的腦洞畫風(fēng)be like:“AI教人類理解AI。”

圖片

“AI教人類關(guān)掉AI中存在風(fēng)險(xiǎn)的神經(jīng)元。”

圖片

還有人開始暢想,AI理解AI會(huì)快速發(fā)展為AI訓(xùn)練AI(已經(jīng)開始了),然后再過不久就是AI創(chuàng)造新的AI了。

圖片

當(dāng)然這也引發(fā)了不少擔(dān)憂,畢竟GPT-4本身不還是個(gè)黑盒嘛。

人類拿著自己不理解的東西,讓它解釋另一個(gè)自己不理解的東西,這個(gè)風(fēng)險(xiǎn)emm……

圖片

這項(xiàng)研究由OpenAI負(fù)責(zé)對(duì)齊的團(tuán)隊(duì)提出。

他們表示,這部分工作是他們對(duì)齊研究的第三大支柱的一部分:

我們想要實(shí)現(xiàn)自動(dòng)化對(duì)齊。這種想法一個(gè)值得思考的方面是,它可能隨著AI的發(fā)展而擴(kuò)展更多。隨著未來AI模型變得越來越智能,我們也能找到對(duì)AI更好的解釋。

論文地址:
https://openaipublic.blob.core.windows.net/neuron-explainer/paper/index.html

參考鏈接:
[1]https://openai.com/research/language-models-can-explain-neurons-in-language-models
[2]https://www.globalvillagespace.com/tech/openais-tool-explains-language-model-behavior/

責(zé)任編輯:武曉燕 來源: 量子位
相關(guān)推薦

2023-05-10 14:54:23

AI

2023-05-10 17:33:56

2023-10-08 13:44:00

數(shù)據(jù)研究

2024-12-09 09:30:00

AI模型

2023-10-07 13:16:40

ChatGPT神經(jīng)元模型

2023-08-02 10:45:43

2021-10-20 10:51:57

AI 數(shù)據(jù)人工智能

2024-04-19 10:32:08

2023-08-02 15:20:45

2023-12-16 09:45:56

論文GPT-4AI

2023-12-15 12:52:17

AI模型

2023-03-31 15:11:26

OpenAIAI

2020-10-13 09:33:28

AI神經(jīng)元人類

2024-01-01 22:28:52

2024-12-25 20:01:13

2023-04-09 16:17:05

ChatGPT人工智能

2023-08-15 15:03:00

AI工具

2023-06-16 13:02:22

GPT-5GPT-4AI

2023-08-31 13:25:09

AI模型

2025-09-17 09:14:03

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

亚洲性av网站| 亚洲高清免费观看高清完整版在线观看| 人人爽久久涩噜噜噜网站| 91亚洲精品乱码久久久久久蜜桃| 亚洲色图第一页| 婷婷激情5月天| av在线最新| 国产亲近乱来精品视频| 147欧美人体大胆444| 在线观看国产亚洲| 久久综合av| 精品国产精品一区二区夜夜嗨| www.中文字幕在线| 成人黄视频在线观看| 2欧美一区二区三区在线观看视频| 国产精品免费一区豆花| 久久精品这里有| 日韩欧美网址| 亚洲黄一区二区| 国产精品久久久久久久av福利| 国产精品蜜芽在线观看| 国产精品私人影院| 久久精品日产第一区二区三区| 91丨九色丨丰满| 首页综合国产亚洲丝袜| 色综合男人天堂| аⅴ天堂中文在线网| 女人抽搐喷水高潮国产精品| 欧美片在线播放| 黄色片一级视频| 51av在线| 亚洲美女屁股眼交3| 午夜欧美一区二区三区免费观看| 天堂在线观看免费视频| 国产一区二区女| 国产精品一二区| 91久久国产综合久久91| 一区二区三区成人精品| 欧美日韩国产成人在线| 国产尤物在线播放| 久久大综合网| 在线精品国产欧美| 69视频在线观看免费| 一本色道久久综合狠狠躁的番外| 精品嫩草影院久久| 91精产国品一二三| 视频二区欧美| 日韩欧美一二区| 手机看片国产精品| 秋霞午夜一区二区三区视频| 欧美高清性hdvideosex| 亚洲一区二区福利视频| 亚洲天堂网站| 精品视频一区三区九区| 我要看一级黄色大片| 精品三区视频| 欧美日韩精品免费观看视频| 一道本在线免费视频| 欧美成a人片免费观看久久五月天| 91久久久免费一区二区| 久久午夜夜伦鲁鲁一区二区| 日韩毛片在线| 欧美亚男人的天堂| 国产亚洲视频一区| 精品一区二区三区在线观看视频| 欧美一区二区三区色| 成年人看片网站| 国产丝袜一区| 国产丝袜一区二区| 影音先锋男人在线| 亚洲国产一区二区三区在线播放| 米奇精品一区二区三区在线观看| 欧美色图亚洲视频| 亚洲激情另类| 国产精品高潮呻吟视频| 中文字幕日产av| 国产精品自在欧美一区| 成人免费在线看片| 色资源在线观看| 中文字幕免费不卡| www.亚洲成人网| 亚洲深夜视频| 欧美色男人天堂| 亚洲国产综合av| 日韩成人午夜| 色999日韩欧美国产| 久久艹精品视频| 久久狠狠一本精品综合网| 国产精品视频免费在线| 亚洲第一天堂网| 久久人人97超碰com| 一区二区视频在线免费| 久久香蕉一区| 欧美色区777第一页| 蜜桃色一区二区三区| 精品视频高潮| 日韩视频免费中文字幕| 亚洲精品国产精品乱码| 日韩va欧美va亚洲va久久| www日韩av| av中文在线| 一区二区高清免费观看影视大全| 欧美激情精品久久久久久小说| 免费观看在线一区二区三区| 亚洲欧美另类在线观看| 99精品久久久久| 久久一区二区三区四区五区 | 日韩亚洲欧美在线| 3d动漫精品啪啪一区二区下载| 欧美成人精品一区二区三区在线看| 欧美激情国产精品| 一级黄色短视频| 久久久不卡影院| 国产一二三区在线播放| 久久精品超碰| 亚洲天堂视频在线观看| 日韩黄色a级片| 国产精品一区二区在线播放| 日本一区视频在线观看| 黄在线观看免费网站ktv| 欧美精品在线一区二区三区| 免费在线观看污| 在线综合视频| 国产伦精品一区二区三区高清| 免费黄色网址在线观看| 欧美专区日韩专区| 国产精品一区二区入口九绯色| 欧美影院一区| 91精品视频专区| 97在线观看免费观看高清 | 欧美在线视频精品| 91污在线观看| 777精品久无码人妻蜜桃| 日韩视频在线直播| 久久这里只有精品99| 亚洲天天综合网| 国产精品私房写真福利视频| 亚洲精品中文字幕无码蜜桃| 欧美日韩破处| 91av国产在线| 五月婷婷六月色| 婷婷激情综合网| 一区二区免费在线观看视频| 国内精品嫩模av私拍在线观看| 91在线观看免费网站| 浪潮av一区| 在线成人午夜影院| 国产精品精品软件男同| 极品少妇xxxx精品少妇偷拍| 亚洲精品成人自拍| 亚洲成人毛片| 久久精品美女视频网站| 国产视频一二三四区| 亚洲欧美日韩国产综合| 国产一级片自拍| 91精品国产调教在线观看| 91夜夜揉人人捏人人添红杏| 国产午夜精品久久久久免费视| 91超碰这里只有精品国产| 手机av在线看| 丁香激情综合国产| 精品无码一区二区三区在线| 亚欧洲精品视频在线观看| 欧日韩不卡在线视频| 国产三级视频在线看| 欧美日韩国产三级| 欧美成人精品欧美一| 成人精品国产一区二区4080| a级黄色一级片| 久久99国产成人小视频| 国产精品欧美一区二区三区奶水| 黄色在线论坛| 精品国产3级a| 在线永久看片免费的视频| 中文字幕成人av| 欧美体内she精高潮| 伊人狠狠色j香婷婷综合| 精品视频导航| jizzyou欧美16| 欧美成人一二三| 亚洲欧洲综合在线| 精品视频在线视频| 日韩免费一二三区| 国产女人18毛片水真多成人如厕| 黄色小视频免费网站| 黄色精品网站| 日韩少妇中文字幕| 香蕉成人app| 欧美综合一区第一页| 毛片在线看网站| 亚洲国产精品系列| 亚洲一区二区色| 天天色综合天天| 性爱在线免费视频| av电影一区二区| 最新免费av网址| 久久av一区二区三区| 99re8这里只有精品| 秋霞影视一区二区三区| 91精品视频在线播放| 日韩成人av电影| 欧美激情一区二区三区久久久| 黄色美女网站在线观看| 日韩一级精品视频在线观看| 好吊色在线视频| 亚洲午夜激情av| 中文字幕乱码av| 91老师片黄在线观看| 久久久久中文字幕亚洲精品 | 91成人看片| 蜜桃导航-精品导航| 视频亚洲一区二区| 国产精品网站入口| 欧美性xxx| 68精品国产免费久久久久久婷婷| caoporm免费视频在线| 亚洲午夜久久久影院| 五月婷婷开心中文字幕| 日韩精品在线看片z| 中文字字幕在线观看| 欧美日韩国产影院| 久久午夜鲁丝片午夜精品| 国产精品久久久久一区二区三区| 一本色道久久综合亚洲精品图片| 国产成人啪午夜精品网站男同| 爱豆国产剧免费观看大全剧苏畅| 老司机午夜精品视频| 蜜桃传媒一区二区三区| 欧美日韩日本国产亚洲在线| www.亚洲一区二区| 97精品国产一区二区三区| 小说区图片区图片区另类灬| 国产亚洲电影| 日本不卡一区| 久久97视频| 日本一区二区在线| 亚洲免费观看高清完整版在线观| 古典武侠综合av第一页| 亚洲91网站| 成人9ⅰ免费影视网站| 精品午夜av| 高清免费日韩| 欧美男男freegayvideosroom| 国产一区二区久久久| 国产精品欧美大片| 国产日韩欧美二区| 国产精品99久久免费观看| 成人3d动漫一区二区三区91| 成人高潮视频| 精品蜜桃传媒| 色婷婷精品视频| 欧美精品尤物在线| 国产一区网站| 亚洲视频sss| 91精品综合| 黄色片免费在线观看视频| 欧美日韩久久| 97成人在线观看视频| 日韩综合小视频| 欧美特黄aaa| 国产成人精品免费视频网站| 日韩精品视频一区二区| 91免费观看在线| 91麻豆精品国产91久久综合| 国产精品久久久久久久久免费樱桃| 国产高清视频免费在线观看| 伊人开心综合网| 天天综合网入口| 色狠狠一区二区| 国产巨乳在线观看| 日韩精品中文字幕一区| 日韩大胆人体| www.日韩系列| www欧美xxxx| 国产精品劲爆视频| 久久综合给合| 欧美高清性xxxxhdvideosex| 欧美高清视频手机在在线| 日韩一二区视频| 久久久久久久高潮| 欧美视频国产视频| 99re66热这里只有精品3直播| 日本黄色小视频在线观看| 亚洲人成网站色在线观看| 日本系列第一页| 欧美日韩中文字幕一区二区| 精品人妻午夜一区二区三区四区| 日韩av在线影院| 麻豆tv在线| 91精品国产自产91精品| 香蕉久久一区| 欧美第一黄网| 欧美日韩一区自拍| 亚洲一二三区av| 成人性生交大片| 成人免费视频入口| 五月天精品一区二区三区| 91精品国产乱码久久久久| 精品国产三级电影在线观看| av色图一区| 91国内在线视频| 久久伊人影院| 亚洲精品高清国产一线久久| 亚洲啪啪91| 91香蕉视频在线观看视频| 久久色在线观看| 日本在线免费观看| 欧美一区二区视频在线观看2020| 免费在线稳定资源站| 久久全球大尺度高清视频| 日韩国产大片| 日韩高清av| 国产婷婷精品| 性活交片大全免费看| 中文字幕人成不卡一区| 丰满人妻老熟妇伦人精品| 精品国产一区二区三区久久久蜜月| av在线天堂| 日本久久久久久久久| 精品久久对白| 999久久欧美人妻一区二区| 麻豆精品蜜桃视频网站| 永久免费看mv网站入口78| 午夜av电影一区| 亚洲第一天堂在线观看| 久久成人这里只有精品| 91精品亚洲一区在线观看| 亚洲精品二区| 麻豆91精品视频| 一级在线观看视频| 欧美在线不卡视频| 国产免费av高清在线| 欧美综合激情网| 久久不卡国产精品一区二区 | 亚洲一区高清| 日本视频一区二区| av电影网站在线观看| 色八戒一区二区三区| 香蕉视频911| 欧美亚洲国产日本| 西瓜成人精品人成网站| 国产精品丝袜久久久久久消防器材| 不卡免费追剧大全电视剧网站| 免费在线观看亚洲| 精品国产伦一区二区三区免费| 视频在线这里都是精品| 91精品国产一区二区| 殴美一级黄色片| 欧美在线看片a免费观看| 毛片免费在线播放| 国产精品一二三视频| 亚洲澳门在线| 绯色av蜜臀vs少妇| 亚洲午夜精品网| 天堂а√在线8种子蜜桃视频 | 好吊色在线视频| 中文字幕精品在线| 2019中文亚洲字幕| 日韩精品一区二区在线视频 | 欧美一区二区精品| 色婷婷在线播放| 久久国产精品久久| 日韩黄色一级片| 紧身裙女教师波多野结衣| 日韩精品一区二区三区中文精品| a'aaa级片在线观看| 久久婷婷开心| 麻豆国产欧美一区二区三区| 国产精品白丝喷水在线观看| 精品三级在线看| 伊伊综合在线| 麻豆中文字幕在线观看| 丁香六月综合激情| 波多野结衣不卡| 久久亚洲国产精品| 女仆av观看一区| 亚洲综合欧美在线| 亚洲永久精品大片| 加勒比一区二区三区在线| 成人xvideos免费视频| 狠狠色综合网| 免费黄色片网站| 精品国产乱码久久| 日韩精品免费观看视频| 嫩草影院中文字幕| 国产日韩精品一区二区三区在线| 国产喷水吹潮视频www| 欧美在线激情网| 一区二区三区午夜探花| 日韩 中文字幕| 欧美精品亚洲一区二区在线播放| 电影k8一区二区三区久久| 亚洲电影网站| av电影天堂一区二区在线观看| 中文无码精品一区二区三区| 国内精品一区二区三区| 久久国产综合| 爱爱的免费视频| 欧美大胆一级视频| 日日夜夜亚洲|