精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

OpenAI炸裂新作:GPT-4破解GPT-2大腦!30萬神經元全被看透

人工智能
OpenAI又雙叒叕有新整活了!難懂的GPT-2神經元,讓GPT-4來解釋。人類看不懂的AI黑箱,就交給AI吧!

剛剛,OpenAI發布了震驚的新發現:GPT-4,已經可以解釋GPT-2的行為!

大語言模型的黑箱問題,是一直困擾著人類研究者的難題。

模型內部究竟是怎樣的原理?模型為什么會做出這樣那樣的反應?LLM的哪些部分,究竟負責哪些行為?這些都讓他們百思不得其解。

萬萬沒想到,AI的「可解釋性」,竟然被AI自己破解了?

圖片

網友驚呼,現在AI能理解AI,用不了多久,AI就能創造出新的AI了。

圖片

就是說,搞快點,趕緊快進到天網吧。

GPT-4破解GPT-2黑箱之謎

剛剛,OpenAI在官網發布了的博文《語言模型可以解釋語言模型中的神經元》(Language models can explain neurons in language models),震驚了全網。

圖片

論文地址:https://openaipublic.blob.core.windows.net/neuron-explainer/paper/index.html#sec-intro

只要調用GPT-4,就能計算出其他架構更簡單的語言模型上神經元的行為。

GPT-2,就這樣被明明白白地解釋了。

要想研究大模型的「可解釋性」,一個方法是了解單個神經元的具體含義。這就需要人類手動檢測神經元,但是,神經網絡中有數百億或數千億個神經元。

OpenAI的思路是,對這個過程進行自動化改造,讓GPT-4對神經元的行為進行自然語言解釋,然后把這個過程應用到GPT-2中。

這何以成為可能?首先,我們需要「解剖」一下LLM。

像大腦一樣,它們由「神經元」組成,它們會觀察文本中的某些特定模式,這就會決定整個模型接下來要說什么。

比如,如果給出這么一個prompt,「哪些漫威超級英雄擁有最有用的超能力?」 「漫威超級英雄神經元」可能就會增加模型命名漫威電影中特定超級英雄的概率。

OpenAI的工具就是利用這種設定,把模型分解為單獨的部分。

第一步:使用GPT-4生成解釋

首先,找一個GPT-2的神經元,并向GPT-4展示相關的文本序列和激活。

然后,讓GPT-4根據這些行為,生成一個可能的解釋。

比如,在下面的例子中GPT-4就認為,這個神經元與電影、人物和娛樂有關。

圖片

第二步:使用GPT-4進行模擬

接著,讓GPT-4根據自己生成的解釋,模擬以此激活的神經元會做什么。

圖片

第三步:對比打分

最后,將模擬神經元(GPT-4)的行為與實際神經元(GPT-2)的行為進行比較,看看GPT-4究竟猜得有多準。

圖片

還有局限

通過評分,OpenAI的研究者衡量了這項技術在神經網絡的不同部分都是怎樣的效果。對于較大的模型,這項技術的解釋效果就不佳,可能是因為后面的層更難解釋。

圖片

目前,絕大多數解釋評分都很低,但研究者也發現,可以通過迭代解釋、使用更大的模型、更改所解釋模型的體系結構等方法,來提高分數。

現在,OpenAI正在開源「用GPT-4來解釋GPT-2中全部307,200個神經元」結果的數據集和可視化工具,也通過OpenAI API公開了市面上現有模型的解釋和評分的代碼,并且呼吁學界開發出更好的技術,產生得分更高的解釋。

此外,團隊還發現,越大的模型,解釋的一致率也越高。其中,GPT-4最接近人類,但依然有不小的差距。

圖片

以下是不同層神經元被激活的例子,可以看到,層數越高,就越抽象。

圖片

圖片

圖片

圖片

把AI的對齊問題,交給AI

這項研究,對于OpenAI的「對齊」大業,意義重大。

在2022年夏天,OpenAI就曾發布博文「Our approach to alignment research」,在那篇文章中,OpenAI就曾做出預測:對齊將由三大支柱支撐。

1、利用人工反饋訓練 AI

2、訓練AI系統協助人類評估

3、訓練AI系統進行對齊研究

在前不久,萬名大佬聯名簽署公開信,要求在六個月內暫停訓練比GPT-4更強大的AI。

Sam Altman在一天之后,做出的回應是:構建更好的通用人工智能,就需要有對齊超級智能的技術能力。

圖片

究竟怎樣讓AI「與設計者的意圖對齊」,讓AGI惠及全人類?

今天的這項研究,無疑讓OpenAI離目標更邁進了一步。

圖片

Sam Altman轉發:GPT-4對GPT-2做了一些可解釋性工作

OpenAI的對齊團隊負責人也表示,這是一個新的方向,可以讓我們同時獲得:

  1. 詳細理解模型到單個神經元的層
  2. 運行整個模型,這樣我們就不會錯過任何重要的東西

圖片

令人興奮的是,這給了我們一種衡量神經元解釋好壞的方法:我們模擬人類如何預測未來的模式,并將此與實際的模式進行比較。

目前這種衡量方式并不準確,但隨著LLM的改進,它會變得更好。

雖然現在還處于初期階段,但已經展現了一些有趣的趨勢:

  1. 后期的層比早期的更難解釋
  2. 簡單的預訓練干預可以提高神經元的可解釋性
  3. 簡單的技巧,如迭代細化,可以改進解釋

圖片

OpenAI可解釋性團隊負責人William Saunders也表示,團隊希望開發出一種方法,來預測AI系統會出現什么問題。「我們希望能真正讓這些模型的行為和生產的回答可以被信任。」

有趣的神經元

在這個項目中,研究者還發現了許多有趣的神經元。

GPT-4為一些神經元做出了解釋,比如「比喻」神經元、與確定性和信心有關的短語的神經元,以及做對事情的神經元。

圖片

這些有趣的神經元是怎么發現的?策略就是,找到那些token空間解釋很差的神經元。

就這樣,背景神經元被發現了,也就是在某些語境中密集激活的神經元,和許多在文檔開頭的特定單詞上激活的神經元。

另外,通過尋找在上下文被截斷時以不同方式激活的上下文敏感神經元,研究者發現了一個模式破壞神經元,它會對正在進行的列表中打破既定模式的token進行激活(如下圖所示)。

圖片

研究者還發現了一個后typo神經元,它經常在奇怪或截斷的詞之后激活。

還有某些神經元,似乎會在與特定的下一個token匹配時被激活。

比如,當下一個標記可能是「from」時,一個神經元會被激活。

這是怎么回事?起初研究者猜測,這些神經元可能是根據其他信號對下一個token進行預測。然而,其中一些神經元并不符合這種說法。

目前,研究者還沒有進行足夠的調查,但有可能許多神經元編碼了以特定輸入為條件的輸出分布的特定微妙變化,而不是執行其激活所提示的明顯功能。

總的來說,這些神經元給人的主觀感覺是,更有能力的模型的神經元往往更有趣。

圖片

網友:OpenAI,搞慢點吧

毫不意外地,網友們又炸了。

咱就是說,OpenAI,你搞慢點行不?

圖片

在評論區,有人祭出這樣一張梗圖。

圖片

這就是傳說中的「存在主義風險神經元」吧,只要把它關掉,你就安全了(Doge)。

圖片

ChatGPT從互聯網中學習,現在它正在創造更多的互聯網。很快,它就會自我反哺,真正的天網就要來臨。

圖片

聽說GPT-5已經達到奇點,并且它正在與地外生命談判和平條約。

圖片

有網友惡搞了一個關于「Yudkowsky」的解釋,他一直是「AI將殺死所有人」陣營的主要聲音之一。

之前「暫停AI訓練」公開信在網上炒得沸沸揚揚時,他就曾表示:「暫停AI開發是不夠的,我們需要把AI全部關閉!如果繼續下去,我們每個人都會死。」

圖片

他知道我們在計劃什么

我們必須不惜一切代價讓他喪失信譽

一旦他走了,就沒有人能夠反對我們了

「Eliezer Yudkowsky看到這一幕,一定又笑又哭——讓我們使用自己不能信任的技術來告訴我們,它是如何工作的,并且它是對齊的。」

圖片

現在,人類反饋強化學習(RLHF)是主場,當AI懂了AI,將會在微調模型上開辟一個新紀元:

人工智能反饋的神經元過濾器(NFAIF)

圖片

參考資料:

https://openai.com/research/language-models-can-explain-neurons-in-language-models

https://openaipublic.blob.core.windows.net/neuron-explainer/paper/index.html

https://techcrunch.com/2023/05/09/openais-new-tool-attempts-to-explain-language-models-behaviors/

責任編輯:武曉燕 來源: 新智元
相關推薦

2024-06-07 18:14:53

2023-05-10 14:54:23

AI

2023-05-10 15:45:08

GPT-4AI模型

2023-08-17 08:00:00

2023-12-16 09:45:56

論文GPT-4AI

2023-04-11 14:13:23

阿里AI

2023-11-08 08:15:29

2023-12-15 12:52:17

AI模型

2023-06-19 08:19:50

2024-05-20 08:40:00

2024-06-28 13:40:03

2025-04-16 09:35:03

2023-07-07 09:32:57

GPT-4OpenAI

2024-06-07 16:40:53

2023-08-06 08:06:30

OpenAIChatGPTGPT-4

2025-08-19 08:40:00

AI技術模型

2023-04-09 16:17:05

ChatGPT人工智能

2023-12-09 13:24:40

OpenAIChatGPT人工智能

2023-03-16 17:28:59

技術AI

2023-12-17 22:04:04

微軟GPT-4
點贊
收藏

51CTO技術棧公眾號

欧美日韩精品免费看 | 国内av一区二区| 在线免费看黄网站| 国产很黄免费观看久久| 91sa在线看| 五月天免费网站| av日韩精品| 日本久久精品电影| 警花观音坐莲激情销魂小说| 内射后入在线观看一区| 丝瓜av网站精品一区二区 | 4438成人网| 自慰无码一区二区三区| 免费在线视频欧美| 99精品视频在线播放观看| 国产精品视频公开费视频| 久久国产免费观看| 欧美艳星介绍134位艳星| 精品国产免费人成在线观看| www.xxx亚洲| 日本资源在线| 中文久久乱码一区二区| 国产伦精品一区二区三区在线 | 久久久久久久毛片| 999久久久精品一区二区| 欧美在线啊v一区| 黄页网站在线观看视频| 精品麻豆一区二区三区| 久久精品一区二区三区av| 91精品黄色| 在线观看毛片网站| 欧美资源在线| 国模极品一区二区三区| 日本精品在线免费观看| 国产精品自拍区| 亚洲国产福利在线| 亚洲午夜精品在线观看| 日本午夜精品久久久久| 日本高清不卡视频| www.中文字幕在线| www欧美xxxx| 洋洋av久久久久久久一区| 一级日韩一区在线观看| 大胆av不用播放器在线播放| 91视频免费观看| 成人三级在线| av网站免费播放| 激情五月激情综合网| 国产精品久久久久久久久粉嫩av | 欧美日本不卡| 日韩中文字幕第一页| 欧美三级视频网站| 极品美女一区二区三区| 亚洲欧美激情四射在线日| 五十路六十路七十路熟婆| 国产丝袜一区| 亚洲精品福利在线观看| 亚洲成av人片在线观看无| 国产精品极品| 亚洲精品福利视频| 最近中文字幕免费| 精品日韩免费| 日韩在线观看你懂的| 国产精品视频在| 欧美电影免费观看高清| 日韩在线观看网址| 黄色一级片中国| 国产精品99免费看| 97国产在线视频| 国产美女激情视频| 日韩高清在线电影| 国产精品亚洲片夜色在线| 91麻豆成人精品国产免费网站| 激情久久五月天| 91久久偷偷做嫩草影院| 日本毛片在线观看| 久久精品无码一区二区三区 | 亚洲电影在线一区二区三区| 欧美成人免费小视频| 精品少妇一二三区| 久久aⅴ国产紧身牛仔裤| 国产精品视频久久久久| 国产情侣av在线| 成人激情校园春色| 欧美日韩最好看的视频| 91激情在线| 亚洲高清视频中文字幕| 能在线观看的av网站| 婷婷丁香久久| 亚洲国产精品网站| 国产一区二区三区精品在线| 亚洲一区二区| 欧美专区福利在线| 伊人久久亚洲综合| 成人丝袜18视频在线观看| 女女同性女同一区二区三区91| 国产一二三区在线| 亚洲精品国产无天堂网2021| 欧美爱爱视频免费看| 欧美v亚洲v综合v国产v仙踪林| 日韩一区二区三区视频| 无码h肉动漫在线观看| 亚欧美无遮挡hd高清在线视频 | 性欧美xxx69hd高清| 欧美日韩aaaaa| 黄色免费视频网站| 91一区二区三区四区| 国精产品一区一区三区有限在线| 青娱乐在线免费视频| 成人性生交大片免费看中文网站| 日本视频一区在线观看| 国产网红女主播精品视频| 欧美三级日韩在线| 国产ts丝袜人妖系列视频| 亚洲一区二区三区无吗| 国产mv久久久| 国精品人妻无码一区二区三区喝尿| 中文在线免费一区三区高中清不卡| 波多野结衣av一区二区全免费观看| 主播大秀视频在线观看一区二区| 亚洲精品一区二区三区精华液| 羞羞在线观看视频| 羞羞答答国产精品www一本| 999视频在线观看| jizzjizz在线观看| 欧美视频裸体精品| chinese麻豆新拍video| 欧美国产专区| 成人精品视频久久久久| 成人免费一区二区三区视频网站| 婷婷综合另类小说色区| 99热这里只有精品2| 羞羞色午夜精品一区二区三区| 国产精品久久久久久久久久久久久久 | 综合久久99| 国产一区视频在线播放| 番号在线播放| 色天使久久综合网天天| 黄色a一级视频| 最新亚洲视频| 国产一区二区不卡视频| 欧洲黄色一区| 日韩精品资源二区在线| 99视频只有精品| 国产在线精品一区二区夜色| 亚洲精品国产精品国自产| 秋霞国产精品| 亚洲一级黄色片| 久久久精品视频网站| 97久久精品人人爽人人爽蜜臀| 国产欧美日韩小视频| 视频精品国内| 欧美国产精品日韩| 六月婷婷中文字幕| 亚洲午夜私人影院| 亚洲天堂成人av| 亚洲一区图片| 日本精品一区二区| 精品三级在线| 久久综合九色九九| 国产av无码专区亚洲av| 一区二区三区欧美在线观看| 三大队在线观看| 影音先锋亚洲电影| 久久精品女人的天堂av| 肉色欧美久久久久久久免费看| 亚洲区在线播放| 国产黄色免费视频| 中文字幕亚洲不卡| 北条麻妃亚洲一区| 亚洲高清不卡| 欧美二级三级| 欧美成人黄色| 欧美高清视频在线播放| 少妇高潮久久久| 五月婷婷综合激情| 欧美日韩高清丝袜| 韩国视频一区二区| 真实国产乱子伦对白视频| 噜噜噜天天躁狠狠躁夜夜精品 | 啦啦啦免费高清视频在线观看| 久久日一线二线三线suv| 国产免费999| 亚洲久久久久| 久久综合九色综合久99| 久久亚洲国产精品尤物| 欧美美女18p| 肉丝一区二区| 制服丝袜在线91| 国产对白videos麻豆高潮| 久久精品一级爱片| 国产精久久久久| 99精品久久久| 亚洲欧美国产一区二区| 久久中文字幕导航| 国产精品揄拍一区二区| 欧美1234区| 一区二区三区无码高清视频| 精品免费久久久| 日本精品视频一区二区三区| 激情视频在线播放| 国产欧美日韩麻豆91| 在线播放av网址| 美女免费视频一区| 成人毛片一区二区| 亚洲欧洲中文字幕| 日本高清一区| 国产精品对白久久久久粗| 国产欧美精品xxxx另类| 丝袜诱惑一区二区| 欧美成人亚洲成人| 国产毛片av在线| 日韩在线观看免费网站 | 69久成人做爰电影| 日韩中文字幕在线视频| 五月婷婷激情在线| 欧美一区二区精品在线| 国产精品熟女视频| 亚洲成av人片| 国产精品白丝喷水在线观看| 国产日本欧洲亚洲| 亚洲av成人无码一二三在线观看| 美女网站在线免费欧美精品| 一本大道熟女人妻中文字幕在线 | 久久久综合九色合综国产精品| 国产又粗又猛大又黄又爽| 热久久久久久久| 69堂免费视频| 亚洲欧洲综合| 日本人妻伦在线中文字幕| 午夜激情久久| 亚洲欧美日韩精品在线| 国产一区二区电影在线观看| 精品乱色一区二区中文字幕| 综合伊人久久| 97伦理在线四区| 国产亚洲高清一区| 成人夜晚看av| 午夜不卡一区| 国产日韩专区在线| 国产精品第一| 国产精品亚洲аv天堂网| 日韩精品三区| 国产精品9999| 亚洲精品.com| 国产精品99久久久久久久久 | 欧美日韩精品在线视频| 日产电影一区二区三区| 亚洲超碰97人人做人人爱| 亚洲国产精品午夜在线观看| 亚洲成a天堂v人片| 日产欧产va高清| 黄色成人在线播放| 久久国产精品免费看| 欧美日韩亚洲高清| 欧美精品韩国精品| 欧美日韩一区二区精品| 色av性av丰满av| 一本色道久久加勒比精品| 亚洲欧美一区二区三区在线观看| 欧美性高跟鞋xxxxhd| 亚洲图片在线视频| 欧美性生活大片视频| 国产亚洲久一区二区| 欧美日韩一级视频| 国产乱码一区二区| 日韩精品一区二区三区蜜臀| 狠狠综合久久av一区二区| 亚洲国产精品成人av| 欧美日韩在线中文字幕| 在线视频精品一| 婷婷视频在线| 欧美高清电影在线看| 亚洲少妇视频| 国产精品视频精品视频| 国产亚洲高清一区| 国产一区二区不卡视频| 精品久久精品| 在线观看18视频网站| 国产精品日韩欧美一区| 男女啪啪网站视频| 国产专区综合网| 精品人妻伦一二三区久| 久久久久久久久久久久久久久99 | 国产一区二区三区四区二区| 亚洲国产日韩综合一区| 久久精品亚洲人成影院| 2018国产在线| 免费高清在线一区| 亚洲欧美日韩中文字幕在线观看| 91在线视频免费91| 青青操在线视频观看| 午夜精品久久久久久久久| 国产在线观看第一页| 精品少妇一区二区三区免费观看 | 视频一区日韩精品| 蜜桃av噜噜一区二区三| 1024精品久久久久久久久| 极品美女扒开粉嫩小泬| 美女在线观看视频一区二区| 蜜桃色一区二区三区| 国产日产欧产精品推荐色| 69av视频在线| 91福利在线播放| 亚洲精品97久久中文字幕无码| 亚洲天堂免费在线| 国产精品69xx| 国产精品夜间视频香蕉| 黄色美女久久久| 91免费网站视频| 久久天天综合| 一区二区免费在线观看视频| 最新中文字幕一区二区三区 | 在线免费观看麻豆| 一区二区三区高清不卡| 亚洲最大成人av| 亚洲欧洲高清在线| 99在线视频影院| 亚洲一区二区中文字幕| 日韩电影一区| 日韩毛片在线免费看| 成人高清免费观看| 五月天婷婷色综合| 欧美三级乱人伦电影| 日韩欧美在线番号| 97久久精品国产| 91麻豆精品激情在线观看最新| youjizz.com亚洲| 蜜臀精品久久久久久蜜臀| 一卡二卡三卡四卡| 亚洲va国产天堂va久久en| 精品美女www爽爽爽视频| 久久精品色欧美aⅴ一区二区| abab456成人免费网址| 女同一区二区| 美女久久一区| 中文字幕一区二区三区人妻| 午夜日韩在线电影| 可以免费看毛片的网站| 欧美日本啪啪无遮挡网站| 经典三级久久| 日本福利视频导航| 狠狠狠色丁香婷婷综合激情 | 国产精品27p| 亚洲自拍都市欧美小说| 日本三级免费网站| www国产精品av| 国产日产精品一区二区三区| 国产视频精品自拍| 中文在线8资源库| 免费精品视频一区二区三区| 午夜宅男久久久| 日韩人妻无码一区二区三区| 色综合久久66| melody高清在线观看| 91精品国产综合久久男男| 999久久久国产精品| 亚洲第一区第二区第三区| 亚洲视频狠狠干| 99久久久无码国产精品免费| 麻豆国产精品va在线观看不卡| 日韩亚洲精品在线观看| 久久久久久久久久伊人| 本田岬高潮一区二区三区| 日韩黄色精品视频| 亚洲欧洲日本专区| 巨大黑人极品videos精品| ijzzijzzij亚洲大全| 国产成人啪午夜精品网站男同| 日韩av男人天堂| 亚洲人成五月天| 日韩色性视频| 日本黄色片一级片| 91女人视频在线观看| 小泽玛利亚一区二区三区视频| 日韩中文字幕在线视频| 综合伊人久久| 免费黄色特级片| 中文字幕在线免费不卡| 亚洲精品97久久中文字幕| 日本不卡高字幕在线2019| 久久中文视频| 香蕉在线观看视频| 狠狠干狠狠久久| 午夜国产福利在线| 精品久久久久久一区| 麻豆久久久久久久| 久久久精品一区二区涩爱| 亚洲精品资源在线| 97久久精品一区二区三区的观看方式| 老司机激情视频| 国产亚洲一二三区| www.麻豆av| 国产99久久精品一区二区| 在线国产一区二区| 日韩人妻无码一区二区三区| 日韩亚洲欧美中文三级| 少妇淫片在线影院| 三级在线免费观看| 久久久国产综合精品女国产盗摄|