精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

用LLaVA解讀數(shù)萬神經元,大模型竟然自己打開了多模態(tài)智能黑盒

人工智能 新聞
LMMs-Lab 團隊使用 LLaVA-OV-72B 對 LLaVA-NeXT-8B 中的神經元進行了自動解讀,獲得了非常多有趣的結果。

本文主要作者來自LMMs-Lab團隊與新加坡南洋理工大學,分別是張愷宸、沈逸飛、李博,指導老師為MMLab@NTU劉子緯教授。LMMs-Lab是一個由學生,研究人員和教師組成的團隊,致力于多模態(tài)模型的研究,主要研究方向包括多模態(tài)模型的訓練以及全面評估,此前的工作包括多模態(tài)測評框架 LMMs-Eval,以及多模態(tài)模型 LLaVA-OneVision,長視頻理解模型LongVA等。

圖片

多模態(tài)大模型(LMMs)給語言模型裝上了 “眼睛”,讓 AI 更接近通用智能。但它們的大腦里每個神經元到底在干啥?南洋理工大學 LMMs-Lab 團隊用 “模型看模型” 的方法,成功解鎖了數(shù)十萬神經元的秘密。

以 GPT4V 為代表的多模態(tài)大模型(LMMs)在大語言模型(LLMs)上增加如同視覺的多感官技能,以實現(xiàn)更強的通用智能。雖然 LMMs 讓人類更加接近創(chuàng)造智慧,但迄今為止,我們并不能理解自然與人工的多模態(tài)智能是如何產生的。

像 LLaVA 一樣的開源模型是理解多模態(tài)智能的一個契機。但這些模型(在未來)可能比人類更加聰明,如何去理解他們的智力呢?來自南洋理工大學的 LMMs-Lab 團隊給出的解決方案是:問問 LLaVA 自己是怎么說的。

LMMs-Lab 團隊使用 LLaVA-OV-72B 對 LLaVA-NeXT-8B 中的神經元進行了自動解讀,獲得了非常多有趣的結果。

傳統(tǒng)的可解釋性的研究是人工去檢查每個神經元并且解讀他們的含義。這樣的操作很難拓展到多模態(tài)大模型上:其一,多模態(tài)大模型的神經元數(shù)量是傳統(tǒng)模型的成百上千倍,人工檢查成本過于高昂;其二,根據(jù)神經科學中的分布式表示原理,一個神經元可能會有多個含義,一個語義可能分布在多個神經元當中。 

在大語言模型中,OpenAI 和 Anthropic 提出了使用稀疏自編碼機來解離特征表示,或者用更大的語言模型來解讀小模型里面的神經元。比如使用 GPT-4 解讀 GPT-2。但這些工作尚未被應用到多模態(tài)模型當中,圖像作為比語言更加自然的信號,解讀圖像與文字的交互能讓人們更加理解智能的產生。LMMs-Lab 基于這些工作對于 LLaVA-NeXT-8B 做出了初步的嘗試:使用稀疏自編碼機(SAEs)來把多語義神經元解離為單語義神經元,并且用 LLaVA-OV-72B 對單語義神經元進行自動解釋,解釋能夠接近人類水平。

圖片

  • 論文地址:arxiv.org/abs/2411.14982
  • 代碼:EvolvingLMMs-Lab/multimodal-sae: Auto Interpretation Pipeline and many other functionalities for Multimodal SAE Analysis.
  • 5k 個神經元解讀樣例:lmms-lab/llava-sae-explanations-5k?Datasets at Hugging Face

這個項目能夠讓自動挖掘多模態(tài)大模型中神經元的語義信息,讓后續(xù)研究工作可以通過修改神經元的激活來改變模型行為,包括減少幻覺和增加安全性。

圖片

(a) 把 SAE 放在 Llava 的某一層并且在 Llava-NEXT 所有數(shù)據(jù)上訓練;(b) 找到一個神經元的最大激活的圖片和區(qū)域,讓 Llava 找出公共點;(c) 刺激神經元可以改變模型行為

具體方法

使用 LMMs 解釋 LMMs 分為以下個步驟:

步驟一:用 SAEs 獲得單語義神經元

SAE 是一個可以追溯到 1996 年的經典解釋性的方法 [1] ,其本質是對特征找到一組互相關性很小的基,把特征分解為這組基的一個稀疏表示。因為基的互相關性很小,所以這些基很可能是單語義的。這篇文章使用了 OpenAI 的兩層 SAE 實現(xiàn):

圖片

其中 z 是稀疏表示也是 SAEs 的神經元,W_2 是一組基。

步驟二:使用 LLaVA 解釋單語義神經元

對于上一步當中 SAE 的每個神經元 z,獲得訓練集里面激活最大的 K 張圖片,以及激活最大的圖像區(qū)域,把這些圖像給 LLaVA-OV-72B 找出共同點。

模型對神經元生成的解釋:炸薯條。

圖片

步驟三:刺激對應的神經元

把 SAE 神經元的激活值調高,看看模型如何表現(xiàn)。

圖片


圖片

可以看到,無論是否包含圖像輸入或者是純文字輸入,LMM 與 LLM 的不同之處在于能夠理解視覺輸入,我們在稀疏編碼器的神經元中也找到了許多與 LLM 不一樣的地方。在進行神經元探測時,我們發(fā)現(xiàn)不同于先前的 LLM 工作,往往激活最強烈的神經元并不是與高層級概念直接相關的,而是許多低層級的感知神經元。這體現(xiàn)了模型的思考步驟,先看懂物體是什么,再去思考更高層級的抽象概念,譬如情感等概念。

LMMs 獨特的神經元

低層級感知神經元:對線條形狀紋理激活的神經元

圖片

物體神經元

圖片

感情與共情神經元

這種方法找到了很多情感神經元,在刺激這些神經元之前,模型是一個冰冷的 AI,刺激這些神經元能夠引發(fā)模型的共情。

圖片

多模態(tài)一致性神經元

對動作場景,以及對應文字圖像都激活的神經元。下圖描繪了對于吃和 hungry 文字都激活的神經元,這樣的神經元在人腦中也存在 [2] 。

圖片

定位模型錯誤原因

圖片

LMM 在實際應用使往往會產生許多幻覺,上面便是 LLaVA-NeXT-8B 在實際場景下產生幻覺的一個例子,圖片中并未標注玻利維亞但模型仍舊回答了 “Yes”。為了研究為何產生這一現(xiàn)象以及如何通過刺激神經元的方式抑制這一現(xiàn)象,我們效仿了 [3,4] 的方法進行探究。

圖片

通過探究發(fā)現(xiàn),造成模型輸出 Yes 的罪魁禍首并不在圖像的理解能力上,模型能夠很好的找到需要關注的點,并準確的找到各個國家的名字。然而,在文字上面,我們發(fā)現(xiàn)模型過分的關注了 Bolivia 這一詞,導致了最后的輸出產生幻覺。通過這一探究,我們思考如何能夠抑制這一幻覺現(xiàn)象并展開了實驗。

圖片

圖片

我們展示了兩個例子用刺激神經元的方式成功抑制了這一現(xiàn)象。我們嘗試激活 OCR 相關的神經元,強行讓模型關注點集中在圖像上,而這成功使得模型 “回心轉意”,不再依賴文字的輸出。

可能的應用以及局限性

因為這超出了文章的范圍,這篇文章只給出了一個應用:找到引起幻覺的神經元并糾正。在未來,這樣的方法可以找出模型有危害、不誠實行為的原因并加以修正,真正達到可控的 AGI。但到達這個目標還有很多問題需要一一攻克:

1. 更高效的自動可解釋流程 —— 由于稀疏編碼器中的神經元數(shù)量眾多且需要緩存大量激活值,解釋所有神經元在目前代價十分高昂。

2. 自動激活神經元的流程 —— 自動且高效地尋找并刺激神經元從而達到控制模型輸出的目的

3. 更準確的自動解釋流程 —— 由于模型的局限性,許多神經元的解釋往往存在錯誤,隨著多模態(tài)大模型的推理能力逐漸增強,我們相信這一問題將會被慢慢攻克

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-10-07 13:16:40

ChatGPT神經元模型

2023-05-10 15:45:08

GPT-4AI模型

2023-10-08 13:44:00

數(shù)據(jù)研究

2025-01-08 08:21:16

2024-10-14 14:10:00

大模型AI開源

2022-10-31 15:17:49

AI系統(tǒng)

2025-09-16 09:35:52

2023-08-21 10:48:25

2023-04-28 15:27:06

微軟模型

2024-12-30 00:01:00

多模態(tài)大模型Python

2024-12-12 00:25:09

2024-12-18 18:57:58

2024-11-13 09:39:13

2025-02-12 13:31:33

2019-10-11 14:48:42

技術研發(fā)指標

2024-12-31 15:18:42

2025-04-25 02:30:00

機械臂大模型多模態(tài)

2024-09-25 14:53:00

2025-08-15 12:38:58

點贊
收藏

51CTO技術棧公眾號

欧美色道久久88综合亚洲精品| 成人avav在线| 日韩亚洲第一页| 美女日批在线观看| 欧美成人ⅴideosxxxxx| 亚洲啪啪综合av一区二区三区| 俄罗斯精品一区二区| 日韩一级在线视频| 欧美激情第二页| 亚洲日韩欧美视频一区| 图片区乱熟图片区亚洲| 成人性生交大片免费网站 | 亚洲成人999| 日韩欧美黄色大片| 羞羞的网站在线观看| 久久蜜桃av一区二区天堂| 成人淫片在线看| 国产嫩bbwbbw高潮| 欧美区亚洲区| 中文字幕日韩在线观看| 亚洲一区二区三区综合| 欧美视频免费看| 懂色av影视一区二区三区| 中文字幕剧情在线观看一区| 男操女在线观看| 成人爱爱电影网址| 成人免费看吃奶视频网站| 日本少妇做爰全过程毛片| 99成人在线视频| 日韩久久免费电影| 中文字幕视频观看| 999精品视频在线观看| 色综合婷婷久久| av免费看网址| 女囚岛在线观看| 亚洲欧美日韩一区二区三区在线观看| 欧美日韩精品不卡| 婷婷国产在线| 99re这里只有精品首页| 成人在线观看网址| 国产黄色高清视频| 国产精品中文字幕日韩精品| 91精品国产自产在线老师啪| 无码人妻黑人中文字幕| 久久不射中文字幕| 欧美一级视频一区二区| 香蕉视频一区二区| 黄色在线一区| 久久久久久亚洲精品中文字幕| 成年人一级黄色片| 欧美91大片| 久久中文字幕视频| 中文字幕av播放| 91不卡在线观看| 久久在线观看视频| xxxx日本少妇| 韩日精品视频| 高清欧美一区二区三区| 国产精品a成v人在线播放| 国产精品多人| 性色av一区二区三区红粉影视| 日本熟妇毛茸茸丰满| 亚洲国产专区| 欧美又大粗又爽又黄大片视频| 中文字幕超碰在线| 日本欧美一区二区三区乱码| 国产免费一区二区三区在线观看| 中文字幕在线播放av| 捆绑紧缚一区二区三区视频| 亚洲精品欧美日韩专区| 性做久久久久久久| 99国产精品视频免费观看| 免费成人深夜夜行视频| 成年在线观看免费人视频| 国产精品久久久久久久久久久免费看| www亚洲国产| 日皮视频在线观看| 欧美午夜丰满在线18影院| 日本三区在线观看| 不卡一区视频| 日韩av在线免费看| 美国黄色特级片| 欧美在线视屏| 欧美最猛性xxxxx免费| 国产一级片一区二区| 国产一区二区91| 精品免费视频123区| www视频在线观看免费| 亚洲欧美日韩电影| 波多野结衣之无限发射| 99只有精品| 日韩天堂在线观看| 97人妻天天摸天天爽天天| 日韩a一区二区| 欧美高清videos高潮hd| 国产一区免费看| 国产一区免费电影| 精品欧美一区二区精品久久| 91在线免费看| 五月综合激情网| 日韩精品你懂的| 国产精品毛片视频| 久久精品国产96久久久香蕉| 国产又黄又爽又色| 国产精品一区二区久久不卡| 女同一区二区| wwwww亚洲| 欧美伦理视频网站| 丰满少妇一区二区| 欧美影院一区| 国产乱人伦真实精品视频| 日本精品一二区| 综合亚洲深深色噜噜狠狠网站| 777777av| 国产精品黄网站| 久久精品国产综合| 国产第一页在线观看| 粉嫩aⅴ一区二区三区四区五区| 欧美日韩成人一区二区三区| 色呦呦在线播放| 欧美日韩亚洲综合在线 欧美亚洲特黄一级| 亚洲av无码一区东京热久久| 天天综合网网欲色| 国产精品视频久久| 天堂av在线7| 亚洲成人精品一区| 欧美xxxx黑人| 中文无码久久精品| 成人免费自拍视频| 91在线导航| 在线观看日韩电影| 精品无码在线视频| 最新亚洲一区| 成人免费观看网站| 26uuu亚洲电影在线观看| 欧美裸体bbwbbwbbw| 免费91在线观看| 蜜臀av性久久久久av蜜臀妖精 | 国产精品久久久久久久久久久久久久 | 国产一区二区精品在线| 日本大胆在线观看| 日韩免费性生活视频播放| 国模无码国产精品视频| 久久99久久精品欧美| 亚洲午夜激情| 欧美久久久网站| 久久夜色精品亚洲噜噜国产mv| 97免费观看视频| 《视频一区视频二区| www.久久av.com| 在线观看日韩| av蓝导航精品导航| 18video性欧美19sex高清| 亚洲成人中文字幕| 91porny在线| 26uuu精品一区二区三区四区在线 26uuu精品一区二区在线观看 | 欧美日韩激情美女| a视频免费观看| 久久裸体视频| 午夜一区二区三区| 24小时成人在线视频| 久久av中文字幕| 亚洲精品成人电影| 黄色成人av在线| 亚洲第一成人网站| 日本午夜精品视频在线观看| 亚洲精品久久区二区三区蜜桃臀 | 欧美日韩三级一区| 最新av电影网站| 国产成人亚洲综合a∨婷婷图片| 成人小视频在线观看免费| 国产欧美三级电影| 日本韩国在线不卡| 日本电影在线观看网站| 欧美一区二区国产| 久久久国产高清| 国产色爱av资源综合区| 污污的网站免费| 韩日成人在线| 日韩av电影免费观看| 国产精品xnxxcom| 久久男人av资源网站| 二区在线观看| 日韩三级av在线播放| 日韩精品在线免费视频| 国产精品久久久久影院亚瑟| 又大又长粗又爽又黄少妇视频| 99视频一区| 亚洲一区二区三区乱码| 草草视频在线一区二区| 国产脚交av在线一区二区| 国产淫片在线观看| 日韩精品极品视频| 国产乱码精品一区二区| 狠狠色噜噜狠狠狠狠97| 成人做爰视频网站| 91麻豆国产在线观看| 九一精品久久久| 亚洲一区免费| 男同互操gay射视频在线看| 日韩电影不卡一区| 91人成网站www| 日韩影片中文字幕| 欧美黄网免费在线观看| av大片在线观看| 亚洲国产免费av| 国产美女免费视频| 色婷婷综合久久久中文一区二区| 欧美黑人一级片| 国产日韩精品一区二区三区在线| 久久久久久久久久久久国产精品| 日韩高清不卡一区| 97视频久久久| 欧美韩国一区| 亚洲一区二区三区欧美| 曰本一区二区三区视频| 96pao国产成视频永久免费| 欧美极品免费| 性金发美女69hd大尺寸| 国产精品实拍| 色阁综合伊人av| 男人天堂资源在线| 亚洲国产女人aaa毛片在线| 18禁裸男晨勃露j毛免费观看| 欧洲成人一区二区三区| 欧美一区二区福利视频| 最近中文字幕在线观看| 精品久久久久久| 免费日韩在线视频| |精品福利一区二区三区| 无码少妇一区二区| 久久精品在线免费观看| 日本丰满少妇裸体自慰| av成人免费在线| 无码国产精品一区二区免费式直播| 九九热在线视频观看这里只有精品| 99视频精品免费| 久久久久免费| 国产综合免费视频| 99热免费精品| 久久黄色片视频| 99xxxx成人网| 国产黄视频在线| 国产亚洲在线| 97国产在线播放| 国产亚洲综合精品| 亚洲成熟丰满熟妇高潮xxxxx| 国产精品普通话对白| 黄色一级片播放| 国产日韩精品视频一区二区三区| 成 年 人 黄 色 大 片大 全| 亚洲激精日韩激精欧美精品| 国产日韩欧美精品在线观看| 亚洲三级视频| 六月丁香婷婷激情| 石原莉奈在线亚洲二区| av网站在线不卡| 激情综合一区二区三区| 久久精品无码一区二区三区毛片| 国产一区久久久| 深夜视频在线观看| www.欧美.com| 老牛影视av老牛影视av| 国产欧美精品一区| 日韩在线观看视频一区二区| 一区二区三区日本| 五月天综合激情| 疯狂做受xxxx高潮欧美日本| 日本一本在线观看| 欧美日本一道本| 亚洲国产一二三区| 日韩福利在线播放| av亚洲在线| 久久福利视频网| 成人ssswww在线播放| 国产精品69av| 国产一区二区三区亚洲综合| 久久av一区二区三区漫画| 精品一区二区三| 7777在线视频| 国产精品乱看| 国产精品嫩草影院8vv8| 成人免费的视频| 91久久免费视频| 亚洲日本成人在线观看| a v视频在线观看| 欧美午夜一区二区三区| 性猛交xxxx乱大交孕妇印度| 亚洲精品日韩在线| 精品黄色免费中文电影在线播放| 久久久在线观看| 国产成人亚洲一区二区三区| 国产乱码精品一区二区三区卡| 精品国产一区二区三区四区| 成年人视频网站免费| 视频在线观看一区二区三区| 日韩av片免费观看| 久久婷婷国产综合国色天香| avtt天堂在线| 色香蕉成人二区免费| 国产熟女一区二区丰满| 亚洲欧美国产精品久久久久久久| 在线中文字幕电影| 国产精品xxx视频| 成人福利一区| 中文字幕一区二区三区在线乱码| 日韩图片一区| 91小视频在线播放| 国产三级精品视频| 国产大片aaa| 欧美一级黄色录像| 国产福利在线视频| 7777kkkk成人观看| 久久av网站| 亚洲图片在线观看| 久久久久久穴| 在线免费看黄色片| 亚洲精品免费电影| 一级黄色片在线观看| 亚洲视频在线观看视频| av资源中文在线天堂| 91在线短视频| 日韩精品首页| 一区二区三区入口| 久久久久综合网| 久草精品视频在线观看| 日韩免费视频线观看| 激情影院在线观看| 国产欧美日韩亚洲精品| 蜜桃成人av| 波多野结衣乳巨码无在线| 国产成a人无v码亚洲福利| 亚洲色图27p| 欧美日韩一二区| 日本亚洲精品| 91精品美女在线| 久久看人人摘| 三上悠亚在线一区| 中文字幕精品—区二区四季| 国产精品久久久久久久久久精爆| 日韩电影第一页| 波多野结依一区| 国产在线一区二区三区欧美 | 人妻熟妇乱又伦精品视频| 国产91综合一区在线观看| 国产三级国产精品国产国在线观看| 欧美男生操女生| 麻豆传媒在线免费看| 成人免费自拍视频| 亚洲色图网站| 91人妻一区二区三区| 亚洲美女免费视频| 国产福利资源在线| 欧美激情一级二级| 国产成人一二| 北条麻妃在线观看| 久久久精品国产免大香伊| а 天堂 在线| 一区三区在线欧| 黄色国产小视频| 国产精品网站在线观看| 亚洲系列在线观看| 久久999免费视频| eeuss鲁片一区二区三区| a级黄色一级片| 国产午夜精品久久久久久免费视 | 91精品xxx在线观看| 亚洲一卡二卡三卡四卡无卡网站在线看 | 国产欧美日韩中文久久| 亚洲视频一区二区三区四区| 久久精品国产成人| 国产精品网站在线看| 超碰97人人射妻| 中文在线一区二区| 99热在线只有精品| 2019中文字幕在线观看| 日韩精品2区| 国产又粗又猛又爽又黄| 精品久久久久久久久久国产| 国产高清在线观看| 91色在线观看| 亚洲欧美春色| 日本激情视频一区二区三区| 精品成人在线观看| 日韩在线影院| 人人妻人人澡人人爽欧美一区双| 久久免费视频色| hs视频在线观看| 欧美在线国产精品| 国产精品久久久久蜜臀| 欧产日产国产精品98| 欧美色综合影院| 2020av在线| 艳母动漫在线观看| 91最新地址在线播放| 91尤物国产福利在线观看| 91精品国产91久久久| 97精品国产| 欧美 日本 国产| 日韩欧美国产小视频|