精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

OpenAI開源GPT-4 SAE,提供1600萬個解釋模式

發(fā)布于 2024-6-7 11:00
瀏覽
0收藏

6月7日凌晨,OpenAI在官網(wǎng)開源了GPT-4的稀疏自動編碼器(Sparse AutoEncoder,簡稱“SAE”)。


雖然現(xiàn)在大模型的功能越來越強,能生成文本、圖片、視頻、音頻等內(nèi)容,但是你無法控制神經(jīng)網(wǎng)絡(luò)生成的內(nèi)容,例如,你問ChatGPT多個相同的問題,可能每一次回答的內(nèi)容都不相同。


就像我們睡覺做夢一樣,無論你怎么集中注意力還是很難精準(zhǔn)控制腦神經(jīng)形成的夢境。這就會出現(xiàn)很多無法控制的情況,例如,大模型生成的內(nèi)容帶有歧視性、錯誤、幻覺等。


SAE的主要作用是在訓(xùn)練過程中引入稀疏性約束,幫助大模型學(xué)習(xí)到數(shù)據(jù)的更有意義、更具解釋性的特征表示,使其輸出的內(nèi)容更精準(zhǔn)、安全。所以,SAE對于開發(fā)前沿、超強功能的大模型非常重要

OpenAI開源GPT-4 SAE,提供1600萬個解釋模式-AI.x社區(qū)

早在2023年10月,著名大模型平臺Anthropic發(fā)布了一篇《朝向單義性:通過詞典學(xué)習(xí)分解語言模型》的論文,深度解釋了神經(jīng)網(wǎng)絡(luò)行為的方法。


Anthropic在一個小型的Transformer架構(gòu)模型進(jìn)行了實驗,將512個神經(jīng)單元分解成4000多個特征,分別代表 DNA 序列、法律語言、HTTP 請求、營養(yǎng)說明等。


研究發(fā)現(xiàn),單個特征的行為比神經(jīng)元行為更容易解釋、可控,同時每個特征在不同的AI模型中基本上都是通用的。

OpenAI開源GPT-4 SAE,提供1600萬個解釋模式-AI.x社區(qū)

而本次OpenAI不僅公布了論文還開源了代碼,同時提供了一個在線體驗地址,與全球開發(fā)者分享他們的研究成果,同時讓用戶深度了解神經(jīng)網(wǎng)絡(luò)生成的內(nèi)容流程,以便更精準(zhǔn)、安全地控制大模型輸出。


開源地址:https://github.com/openai/sparse_autoencoder

論文地址:https://cdn.openai.com/papers/sparse-autoencoders.pdf

在線demo:https://openaipublic.blob.core.windows.net/sparse-autoencoder/sae-viewer/index.html

?

什么控制神經(jīng)網(wǎng)絡(luò)行為很難

?

無論你用多么精準(zhǔn)的提示詞,都無法讓DALL·E 3、Stable Difusion生成100%相吻合的圖片。這是因為,神經(jīng)網(wǎng)絡(luò)的輸出很大程度上依賴于它們所接受的訓(xùn)練數(shù)據(jù)。


神經(jīng)網(wǎng)絡(luò)通過大量的樣本數(shù)據(jù)學(xué)習(xí)到復(fù)雜的模式和特征。但是,訓(xùn)練數(shù)據(jù)本身可能包含噪聲、偏差或者數(shù)據(jù)標(biāo)準(zhǔn)不準(zhǔn)確等。這些因素會直接影響神經(jīng)網(wǎng)絡(luò)對輸入數(shù)據(jù)的響應(yīng)。


例如,讓神經(jīng)網(wǎng)絡(luò)生成一張貓的圖片。如果訓(xùn)練數(shù)據(jù)中有一些不清晰或錯誤標(biāo)記的圖片,例如狗或其他動物的照片,模型可能會在生成貓的圖片時出現(xiàn)混亂,生成出一些看起來不像貓的圖像。同理,文本類的ChatGPT等產(chǎn)品也會出現(xiàn)一本正經(jīng)胡說八道的情況。

OpenAI開源GPT-4 SAE,提供1600萬個解釋模式-AI.x社區(qū)

神經(jīng)網(wǎng)絡(luò)的內(nèi)部結(jié)構(gòu)和參數(shù)設(shè)置極其復(fù)雜。隨著技術(shù)的迭代,目前隨便一個神經(jīng)網(wǎng)絡(luò)模型的參數(shù)都在幾十億甚至數(shù)百億,這些參數(shù)共同決定了模型的行為。


在訓(xùn)練過程中,我們通過優(yōu)化算法(如梯度下降法)對這些參數(shù)進(jìn)行調(diào)整,但最終模型的表現(xiàn)是所有參數(shù)綜合作用的結(jié)果,而非單一參數(shù)所能決定的。


這種復(fù)雜性導(dǎo)致我們難以精確預(yù)測或控制任何特定的輸出。例如,如果你調(diào)整一個參數(shù)來讓生成的圖片更有細(xì)節(jié),它可能導(dǎo)致其他部分的圖片出現(xiàn)失真或不自然的效果。

OpenAI開源GPT-4 SAE,提供1600萬個解釋模式-AI.x社區(qū)

此外,神經(jīng)網(wǎng)絡(luò)的設(shè)計和訓(xùn)練目標(biāo)通常是為了優(yōu)化整體性能指標(biāo)(如準(zhǔn)確率、損失函數(shù)等),而不是精確到每一個具體的輸出細(xì)節(jié)。例如,在圖像生成中,模型的目標(biāo)可能是生成總體上看起來真實的圖片,而不是控制每一個像素的具體值。


同樣,在文本生成中,模型的目標(biāo)是生成語法正確、語義連貫的句子,而不是控制每個單詞的具體選擇。例如,一個訓(xùn)練寫詩的模型,目標(biāo)是寫出富有詩意的句子,而不是精確到每一個詞的位置和使用頻率。


這也就是說,大模型的輸出通常是基于概率分布的采樣,輸出不可避免地帶有一定程度的不確定性。


OpenAI的SAE簡單介紹

?

SAE是一種無監(jiān)督學(xué)習(xí)算法,屬于自編碼器家族的一種,主要用來學(xué)習(xí)輸入數(shù)據(jù)的有效且稀疏的低維表示。在傳統(tǒng)的自編碼器中,數(shù)據(jù)被編碼成一個潛在的低維表示,然后再解碼回原始數(shù)據(jù)空間,目的是使重構(gòu)的數(shù)據(jù)盡可能接近原始輸入。


而SAE在此基礎(chǔ)上添加了一個關(guān)鍵特性,即對隱藏層的激活進(jìn)行稀疏性約束,這意味著在隱藏層中只有少量的神經(jīng)元會被激活(通常接近0),而大部分神經(jīng)元則保持在非常低的激活水平或者完全不激活。


從OpenAI公布的論文來看,為了深度理解大模型的單個神經(jīng)元行為,OpenAI使用了一種N2G的方法。


N2G的核心思想是,如果一個潛在單元在給定的輸入模式下被激活,那么這個單元可能對輸入中的某些特定特征或模式特別敏感


通過識別這些特征或模式,我們可以為每個潛在單元構(gòu)建一個圖表示,圖中的節(jié)點對應(yīng)于輸入序列中的特定位置,而邊則表示這些位置之間的依賴關(guān)系。這種圖表示可以揭示潛在單元激活的條件,從而提供對模型行為的直觀理解。

OpenAI開源GPT-4 SAE,提供1600萬個解釋模式-AI.x社區(qū)

N2G的構(gòu)建過程開始于選擇一些能夠激活特定潛在單元的序列。對于每個序列,N2G尋找最短的后綴,這個后綴仍然能夠激活該潛在單元。這個過程是為了確定潛在單元激活的最小必要條件。


接著,N2G會檢查內(nèi)容是否可以被填充標(biāo)記替換,以插入通配符,從而允許在解釋中包含變化的部分。此外,N2G還會檢查解釋是否依賴于絕對位置,即在序列的開始處插入填充標(biāo)記是否會影響潛在單元的激活。

OpenAI開源GPT-4 SAE,提供1600萬個解釋模式-AI.x社區(qū)

N2G還有一個非常大的技術(shù)優(yōu)勢就是對算力需求很低,與需要模擬整個模型行為的解釋方法相比,N2G只需要分析潛在單元的激活模式即可。


目前,OpenAI通過SAE在GPT-4模型中找到了1600萬個可解釋的模式和特征,但這還遠(yuǎn)遠(yuǎn)不夠。如果想通過SAE完整捕捉大模型的行為,大概需要10億或數(shù)萬億個特征才可以。


本文轉(zhuǎn)自 AIGC開放社區(qū) ,作者:AIGC開放社區(qū)


原文鏈接:??https://mp.weixin.qq.com/s/swJDQDsc2M652IYrpTYxog??

標(biāo)簽
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦
亚洲国产精品av| 欧美精品91| 欧美精品xxxxbbbb| 国产成人生活片| 色婷婷综合视频| 日本午夜精品一区二区三区电影| 久久精品99久久久香蕉| 国产一级黄色录像| 亚洲ww精品| 欧美日韩色婷婷| 尤物一区二区三区| 三级视频在线| 狠狠色丁香久久婷婷综合丁香| 高清亚洲成在人网站天堂| 国产调教在线观看| 牛牛精品成人免费视频| 3751色影院一区二区三区| 国产自产在线视频| 成人看片免费| 国产日韩成人精品| 精品高清视频| 性中国xxx极品hd| 美女脱光内衣内裤视频久久网站| 久久久久久久网站| 亚洲色偷偷综合亚洲av伊人| 亚洲区小说区| 精品99999| 欧美一级特黄aaa| 欧美日韩在线精品一区二区三区激情综合| 亚洲综合一区二区三区| 欧美性视频在线播放| 黄色片视频在线观看| 99久久精品免费| av在线不卡一区| 国产又粗又猛又爽又黄91| 久久激情综合| 欧美一级视频一区二区| 久久久久成人精品无码| 天天久久综合| 日韩少妇与小伙激情| 日本少妇xxxxx| 在线观看欧美理论a影院| 亚洲国产精品久久久久秋霞蜜臀 | 在线heyzo| 中文字幕五月欧美| 亚洲一区二区精品在线| 国产精品麻豆一区二区三区 | 亚洲精品中文字幕在线| 精品三级久久久久久久电影聊斋| 91网页版在线| 久久精品一二三区| 五月婷婷六月色| av在线一区二区三区| 国产精品久久久久av福利动漫| 精品人妻无码一区二区色欲产成人 | 最好看的2019年中文视频| 色噜噜日韩精品欧美一区二区| 欧美国产极品| 亚洲美女av电影| 受虐m奴xxx在线观看| 精品久久一区| 中文字幕一区电影| 黄色录像二级片| 午夜精品免费| 午夜精品蜜臀一区二区三区免费 | 国产原创在线观看| 亚洲人成网站在线| 人妻激情另类乱人伦人妻| 手机在线免费av| 亚洲二区视频在线| 凹凸国产熟女精品视频| 国精产品一区一区三区四川| 欧美色精品在线视频| 国产一区二区在线观看免费视频| 91精品在线免费视频| 日韩欧美一级特黄在线播放| 尤物网站在线观看| 国产一区二区三区91| 色婷婷久久av| 国产午夜久久久| 久久久久久9| 91老司机在线| 五月婷婷六月丁香综合| 亚洲国产精品成人久久综合一区 | 新67194成人永久网站| 国产精品久久不能| av 一区二区三区| 99re在线视频这里只有精品| 丝袜美腿玉足3d专区一区| 92国产在线视频| 亚洲一区影音先锋| 国产福利一区视频| 精品视频91| 亚洲三级 欧美三级| 黄色香蕉视频在线观看| 国产视频亚洲| 91久久精品美女| 日韩专区一区二区| 亚洲欧美日韩一区二区三区在线观看| 97超碰在线人人| 欧美xxxx网站| 精品亚洲一区二区三区在线播放| 五月激情四射婷婷| 亚洲美女黄网| 91欧美激情另类亚洲| 欧洲成人av| 亚洲国产一区在线观看| 欧美大尺度做爰床戏| 久草精品视频| 欧美美女18p| 中文 欧美 日韩| av在线不卡观看免费观看| 国产高清精品软男同| 欧美大电影免费观看| 精品日韩欧美一区二区| jizz18女人高潮| 久久久青草婷婷精品综合日韩| 91成人免费在线观看| 91啦中文在线| 色偷偷成人一区二区三区91| 国产精品偷伦视频免费观看了| 成人久久综合| 欧洲亚洲妇女av| 成人毛片视频免费看| 亚洲欧美一区二区三区国产精品| aⅴ在线免费观看| 欧美在线关看| 97精品国产97久久久久久| 亚洲第一大网站| 亚洲精品国产品国语在线app| 午夜在线观看av| 精品视频亚洲| 国产精品大片wwwwww| 色av男人的天堂免费在线| 亚洲国产成人91porn| 亚洲成人激情小说| 欧美91视频| 91久久精品久久国产性色也91| 在线免费看黄| 欧美日高清视频| 国产91在线播放九色| 日产国产高清一区二区三区| 日本一区二区在线视频| 欧美free嫩15| 中文字幕亚洲综合久久筱田步美| 国产免费www| 国产欧美精品在线观看| 9久久婷婷国产综合精品性色 | 久久综合久久鬼色中文字| 日本少妇高潮喷水视频| 青青草这里只有精品| 91国产美女视频| 青青草在线播放| 日本精品一区二区三区四区的功能| 成人乱码一区二区三区av| 久热综合在线亚洲精品| 日本电影一区二区三区| 日本中文字幕一区二区| 波霸ol色综合久久| 国产乱码精品一区二三区蜜臂| 亚洲欧美偷拍另类a∨色屁股| 男男受被啪到高潮自述| 亚洲一级网站| 精品欧美国产| 成人国产精品入口免费视频| 日韩在线欧美在线| 国产不卡av在线播放| 亚洲h动漫在线| 五月婷婷综合在线观看| 免费一级欧美片在线观看| 浴室偷拍美女洗澡456在线| 7m精品国产导航在线| 欧美一级大片在线免费观看| 成在在线免费视频| 欧美一区二区三区免费大片| 久久免费播放视频| 久久久激情视频| 亚洲天堂网站在线| av成人毛片| 亚洲视频在线二区| 中文字幕视频精品一区二区三区| 欧美在线www| 理论片午午伦夜理片在线播放| 日韩欧美国产一区二区在线播放 | 777a∨成人精品桃花网| 国产性一乱一性一伧一色| 久久蜜臀中文字幕| 四虎成人在线播放| 欧美专区在线| 欧美 国产 精品| 国产一区二区三区站长工具| 3d动漫啪啪精品一区二区免费| 国产在线精彩视频| 久久夜色撩人精品| 日本一区高清| 日韩欧美激情四射| 在线观看毛片av| 亚洲国产欧美日韩另类综合| www.99热| 99久久免费国产| 在线视频一二区| 久久裸体视频| 国产真人做爰毛片视频直播| 成人在线电影在线观看视频| 国产视频一区二区三区四区| 四虎国产精品免费久久| 欧洲精品毛片网站| 国产一线二线在线观看| www.亚洲成人| 精品视频一二三| 亚洲激情自拍图| 国产黄色美女视频| 欧美巨大另类极品videosbest| 日韩黄色三级视频| 亚洲综合久久久| 污污的视频在线免费观看| 久久久www免费人成精品| 成人欧美精品一区二区| 国模一区二区三区白浆| 能看的毛片网站| 亚洲专区在线| 伊人成色综合网| 亚洲电影成人| 成年丰满熟妇午夜免费视频| 日韩精品一卡| 日韩精品一区二区三区色偷偷| 老司机在线精品视频| 岛国一区二区三区高清视频| 免费精品一区| 成人福利网站在线观看| 国产69精品久久| 国产精品免费久久久久久| 国模冰冰炮一区二区| 97精品伊人久久久大香线蕉| av在线最新| 久久久之久亚州精品露出| 中文字幕在线观看播放| 欧美成人精品在线观看| av网址在线看| 久久99精品久久久久久噜噜| 在线观看男女av免费网址| 欧美老少做受xxxx高潮| 亚洲区欧洲区| 欧美大片免费看| caoprom在线| 亚洲91精品在线观看| 99re6在线精品视频免费播放| 欧美激情在线有限公司| av中文在线资源库| 欧美亚洲国产日本| 欧美gay视频| 国产精品美女视频网站| 国产精品蜜月aⅴ在线| 91免费视频国产| 超碰精品在线| 免费在线观看91| 成人激情开心网| 日本一二三区视频在线| 亚洲日韩视频| 中文字幕无码不卡免费视频| 日日夜夜免费精品视频| 一起操在线视频| 国产成人亚洲综合a∨婷婷| 丰满岳乱妇一区二区| 93久久精品日日躁夜夜躁欧美| 久久久久久九九九九九| 中文字幕不卡在线| 动漫性做爰视频| 午夜伊人狠狠久久| 国产亚洲欧美在线精品| 欧美日韩国产免费一区二区| 国产免费一区二区三区免费视频| 精品国产一区二区三区av性色| 天堂中文字幕av| 在线观看欧美日韩国产| 成人日批视频| 日本91av在线播放| 91麻豆精品一二三区在线| 国产精品一区二区你懂得| 奇米狠狠一区二区三区| 亚洲一区二区三区精品在线观看 | 欧美精品videosex牲欧美| 综合日韩av| 成人性生交大片免费观看嘿嘿视频| 超碰97久久| 亚洲午夜激情| 99日韩精品| 日韩一级免费片| www.日本不卡| 视频国产一区二区| 色综合久久久久网| 精品欧美在线观看| 国产亚洲a∨片在线观看| 日本性爱视频在线观看| 国产精品久久久久久av下载红粉| 亚洲精品aⅴ| 神马影院我不卡午夜| 在线成人av| 国产成人强伦免费视频网站| 久久久九九九九| 欧美精品久久久久性色| 欧美视频第二页| 免费理论片在线观看播放老| 九色精品免费永久在线| 欧美国产日韩电影| 久久国产一区| 欧美日韩国内| 国产精品嫩草影视| 国产精品视频免费| 黄色在线免费观看| 欧美精品一区二区三区蜜臀| 免费av在线网站| 国产欧美日韩亚洲精品| 亚洲最好看的视频| 青青草视频在线免费播放| 韩国欧美国产一区| 91禁男男在线观看| 欧日韩精品视频| 天天干,夜夜爽| 国精产品一区一区三区有限在线| 91麻豆精品| 影音先锋在线亚洲| 蜜桃免费网站一区二区三区| 精品人妻无码一区二区三区| 亚洲成人精品在线观看| 国内老熟妇对白hdxxxx| 日韩在线视频免费观看高清中文| 性欧美1819sex性高清| 精品在线不卡| 在线午夜精品| 亚洲欧美日本一区| 性做久久久久久免费观看欧美| aaa一区二区| 欧美大学生性色视频| 看亚洲a级一级毛片| ijzzijzzij亚洲大全| 国产在线精品国自产拍免费| 黄色a级片在线观看| 91精选在线观看| av在线网址观看| 成人在线观看av| 国产精品激情电影| 污污污www精品国产网站| 亚洲电影激情视频网站| 国精产品一品二品国精品69xx| 欧美疯狂xxxx大交乱88av| 亚洲精品黑牛一区二区三区| 成人在线免费观看视频网站| 国产成人免费视频网站| 精品无码人妻一区二区三区| 精品99久久久久久| 黄色亚洲网站| 三区精品视频| 久久99精品久久久| 午夜写真片福利电影网| 亚洲国产精品99| 亚洲国产成人二区| 亚洲丰满在线| 国产一区二区三区四区五区美女 | 精品视频一区在线| 香蕉久久夜色精品国产| 无码人妻aⅴ一区二区三区69岛| 欧美系列日韩一区| 国产精品扒开做爽爽爽的视频 | 六月婷婷中文字幕| 91国语精品自产拍在线观看性色 | 国产福利视频在线播放| 国产免费久久精品| 国产精品一区二区av白丝下载| 久久99视频精品| 香蕉久久夜色精品国产使用方法| 激情网站五月天| 亚洲老司机在线| 三级视频网站在线| 成人在线中文字幕| 99精品国产一区二区青青牛奶| 日本少妇高潮喷水xxxxxxx| 欧美日本韩国一区二区三区视频| caopeng在线| 久久精品人人做人人爽电影| 久久99精品国产麻豆婷婷| 国产无遮挡又黄又爽在线观看| 亚洲欧美国产精品久久久久久久 | 激情综合网天天干| 91精品国产高潮对白| 中文字幕精品网| 风间由美一区二区av101| 男操女免费网站| 亚洲国产色一区| 97在线观看免费观看高清 | 亚洲精品日韩激情在线电影| 亚洲青涩在线| 一区二区国产精品精华液| 精品视频在线播放免| 国产高清精品二区| 能在线观看的av| 亚洲精品国产一区二区精华液| 国产三级视频在线播放线观看| 粉嫩av一区二区三区免费观看 | 91官网在线|