精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

LLM為何頻頻翻車算術題?研究追蹤單個神經元,「大腦短路」才是根源

人工智能
大模型在數學問題上的表現不佳,原因在于采取啟發式算法進行數學運算的,通過定位到多層感知機(MLP)中的單個神經元,可以對進行數學運算的具體過程進行解釋。

由于缺少對運行邏輯的解釋,大模型一向被人稱為「黑箱」,但近來的不少研究已能夠在單個神經元層面上解釋大模型的運行機制。

例如Claude在2023年發表的一項研究,將大模型中大約500個神經元分解成約4000個可解釋特征。

而10月28日的一項研究,以算術推理作為典型任務,借鑒類似的研究方法,確定了大模型中的一個模型子集,能解釋模型大部分的基本算術邏輯行為。 

圖片圖片

論文地址:https://arxiv.org/abs/2410.21272

該研究首先定位了Llama3-8B/70B, Pythia-6.9B及GPT-J四個模型中負責算術計算的模型子集。

如圖1所示,少數注意力頭對大模型面對算術問題的正確率有顯著影響。第一個 MLP(多層感知機) 明顯影響操作數和操作符位置,而中間層和后期層的 MLP 將token信息投影到最后位置,提升正確答案的出現概率。

圖1:Llama3-8B中發現算術相關的模型子集圖1:Llama3-8B中發現算術相關的模型子集

該研究聚焦于單個神經元層面,發現了一組重要的神經元,它們實現了簡單的啟發式算法。只需要關注特定的極少量神經元,就能正確預測大模型進行算術運算的結果(圖2)。

圖2:大模型中每層神經元中只需要關注1.5%的少數子集,就能預測大模型進行四則運算的結果圖2:大模型中每層神經元中只需要關注1.5%的少數子集,就能預測大模型進行四則運算的結果

舉個例子:當輸入的提示詞為“ 226?68= ”時,神經元24|12439在結果介于150和180的減法提示下顯示出高激活值,可被視為一個啟發式算法。而每個啟發式算法識別一個數值輸入模式,并輸出相應的答案。

具體可分為兩種不同的激活模式:第一種直接啟發式指的是在某些神經元中,激活模式取決于兩個操作數,值向量編碼了算術計算的預期結果(圖 3b,c)。

第二種間接激活模式取決于單個操作數對應的神經元中,值向量通常編碼下游處理的特征,而不是直接的計算結果(圖3a)。

圖3:啟發式方法的可視化圖3:啟發式方法的可視化

神經元和運算的因果聯系

該如何確認特定神經元和相關數學運算之間存在因果關系?一種常見的方法是消融分析,即將大模型大模型中特定的神經元敲除,看看模型的效果會有何改變,結果如圖4所示。

圖4:四則運算中敲除對應的算術神經元后模型的性能對比圖4:四則運算中敲除對應的算術神經元后模型的性能對比

去掉了對應神經元后,模型的運算準確性無論加減乘除都顯著下降。

不僅如此,相比去除特定算術神經元時造成的性能下降,可以發現,去除隨機神經元的影響相對較小,而且這種效應在模型8B和70B不同參數量中普遍存在。

圖5:敲除與算術相關的啟發式算法的神經元(實線)相比與算術無關的相同數量的隨機神經元(虛線)圖5:敲除與算術相關的啟發式算法的神經元(實線)相比與算術無關的相同數量的隨機神經元(虛線)

上述結果表明,可僅根據其相關啟發式算法來識別對特定對大模型進行算術重要的神經元,也證明了屬于幾個啟發式算法的神經元與提示正確完成之間的因果關系。

此外,該結果還支持了啟發式算法集合的主張:即每個啟發式算法僅略微提高正確答案的幾率,但它們結合在一起,使得大模型以高概率產生算術題的正確答案。

大模型為何做不對算術題

Llama3-8B模型無法可靠地對每道算術題時給出正確的回答?;趩l式規則,該研究闡述了模型為何會做錯,可能的機制共有兩種:

第一,由于參數量的限制,大模型缺乏足夠的算術神經元,無法針對每一種情況都給出應對。

第二種原因是,可能存在回憶不完整的情況,比如某個啟發式規則對應的神經元沒有在運算時被觸發。

圖片圖片

圖6:隨機抽取了50個正確完成和50個錯誤完成的算術題目,考察大模型中被正確和錯誤激活的算術神經元個數

如圖6所示,在大模型回答正確及錯誤時,激活的算術神經元個數不存在差異,這不支持前述的第一種算術神經元個數不足的假設。

然而,在大模型回答正確的情況下,更多比例的正確神經元被激活了,而回答錯誤的案例中,應當被激活的神經元激活概率反而較小。

這意味著大模型在特定算術題上失敗的主要原因是對能得出正確答案的神經元缺少泛化能力,而不是算術神經元的數量不足。

「算術神經元」何時誕生

由于其訓練檢查點可供公眾獲取,該研究采用Pythia-6.9B來考察大模型過程中算術神經元的出現階段。

結果顯示,大模型在訓練過程中逐漸發展其最終的算術啟發式機制,且算術神經元在模型訓練早期就已出現。

圖7 :啟發式的算術神經元的百分比隨著訓練增加圖7 :啟發式的算術神經元的百分比隨著訓練增加

在模型訓練的不同階段,移除特定的啟發式神經元會大幅降低模型在所有訓練檢查點的準確性,這表明算術準確性主要來自啟發式,即使在早期階段也是如此。算術啟發式神經元與大模型算術能力的因果關系在整個訓練過程中都存在。

圖8:不同階段敲除算術神經元對大模型進行算術運算準確性的影響圖8:不同階段敲除算術神經元對大模型進行算術運算準確性的影響

結論

理解大模型如何進行數學運算,不僅可以打開大模型內部運行的黑箱,解釋它們為何在簡單的數學題上翻車,例如最著名的「9.11和9.8哪個大」。

這項研究告訴我們,并不是因為大模型缺少相關訓練,而是激活了錯誤的啟發式神經元,例如將這個問題當成了詢問哪個版本更大。

理解了大模型的算術運算,是依賴于啟發式方法集,而非單純的依靠記憶(背題目)或學會規則,這表明提高大模型的數學能力可能需要訓練和架構的根本性改變,而不是像激活引導這樣的小修小補。

對訓練過程的分析結果指出,大模型在訓練早期就學會了這些啟發式方法,并隨時間推移逐漸強化。這可能會導致模型過度擬合到早期的簡單策略,因此可作為之后優化方向的參考。

參考資料:https://arxiv.org/abs/2410.21272

責任編輯:武曉燕 來源: 新智元
相關推薦

2022-03-14 11:04:39

人工智能機器學習神經網絡

2022-02-15 15:20:26

計算神經元研究

2022-10-31 15:17:49

AI系統

2021-10-11 20:19:16

AI

2023-10-13 22:03:32

AI訓練

2024-03-13 08:03:44

LLM人工智能技術

2022-04-09 10:16:52

神經網絡深度學習AI

2021-06-01 09:39:24

人工智能機器學習技術

2021-02-25 14:05:43

技術計算機思維

2019-10-11 14:48:42

技術研發指標

2023-10-07 13:16:40

ChatGPT神經元模型

2020-01-23 15:19:26

谷歌Android開發者

2021-06-02 14:48:34

3DAI 人工智能

2023-08-21 10:48:25

2012-10-10 09:32:51

虛擬化

2023-03-15 15:18:22

神經網絡研究

2024-01-11 15:34:18

2022-02-08 15:07:37

AI機器學習電子

2018-04-25 09:07:41

人工智能神經網絡

2021-10-20 10:51:57

AI 數據人工智能
點贊
收藏

51CTO技術棧公眾號

国内精品麻豆美女在线播放视频| √天堂资源地址在线官网| 国内激情久久| 亚洲乱码一区av黑人高潮| 无码日韩人妻精品久久蜜桃| 99免在线观看免费视频高清| 国产精品白丝jk黑袜喷水| 91精品国产色综合久久不卡98口| 欧美激情久久久久久久| 亚洲精品18| 国产激情视频在线看| 99久久国产综合精品成人影院| 日韩视频中午一区| 久久综合久久色| 午夜激情在线| 国产精品乱人伦| 狠狠色噜噜狠狠色综合久| 在线免费观看一级片| 亚洲黄色大片| 久久精品国产一区| 中文字幕一区二区人妻在线不卡 | 亚洲精品aaaaa| 91精品国产综合久久久久久| 国产欧美高清在线| 欧美人与禽猛交乱配| 欧美激情一区二区三区不卡 | 中文字幕免费在线播放| 色8久久影院午夜场| 亚洲午夜国产一区99re久久| 性刺激综合网| 青青国产在线| 国产sm精品调教视频网站| 成人a在线视频| 亚洲大片免费观看| 最新日韩欧美| 欧美激情成人在线视频| 日本一级片免费| 成人羞羞视频播放网站| 亚洲欧美中文日韩在线v日本| 蜜臀视频在线观看| 中文字幕久久精品一区二区| 欧美精品777| 亚洲视频第二页| 456成人影院在线观看| 色综合久久久久网| 免费在线观看亚洲视频| 牛牛精品一区二区| 天天色图综合网| 国产精品后入内射日本在线观看| 97在线超碰| 精品久久在线播放| 国产欧美在线一区| 成人欧美magnet| 色8久久人人97超碰香蕉987| 农村妇女精品一二区| 中文在线аv在线| 一本高清dvd不卡在线观看| 狠狠干 狠狠操| 美女露胸视频在线观看| 狠狠综合久久av一区二区小说| 波多野结衣乳巨码无在线| 99在线视频影院| 都市激情亚洲色图| 精品久久久久久久无码 | 91久久久免费一区二区| 欧美黑人又粗又大又爽免费| 成人综合网站| 欧美一区二区视频观看视频| 亚洲少妇一区二区| 久久精品色综合| 日韩精品视频在线免费观看| 蜜桃传媒一区二区亚洲av| 欧美日韩国产一区二区三区不卡 | 蜜桃视频在线观看免费视频| 欧美视频二区36p| 亚欧在线免费观看| 成人久久精品| 亚洲精品国产品国语在线| 人妻大战黑人白浆狂泄| 天天综合精品| 97人人爽人人喊人人模波多| 凹凸精品一区二区三区| 国产综合成人久久大片91| 国产精品综合久久久久久| 日韩a级作爱片一二三区免费观看| 国产色爱av资源综合区| 日本一级淫片演员| 96av在线| 欧美高清视频不卡网| 精品人妻在线视频| 日韩中文欧美| 91精品国产亚洲| 国产原创中文av| 99久久免费国产| 一区二区在线观看网站| 九色porny自拍视频在线播放 | 国产高清免费观看| 久久午夜国产精品| 国产日韩第一页| 综合久久2023| 日韩三级在线观看| 调教驯服丰满美艳麻麻在线视频| 欧美福利专区| 国产精品久久久久久久久久久新郎 | 鲁丝一区鲁丝二区鲁丝三区| 成人午夜在线影视| 91九色02白丝porn| 手机免费看av片| 久久久久av| 国产成人精品网站| 色婷婷激情五月| 亚洲日本va在线观看| 日韩av播放器| 国产精品zjzjzj在线观看| 日韩中文字幕视频在线观看| 综合网在线观看| 大尺度一区二区| 中文字幕免费高| 中文字幕系列一区| 日韩激情av在线免费观看| 欧美xxxx黑人xyx性爽| 久久99久久99| 日韩欧美99| 色综合桃花网| 亚洲精品成人免费| 久久精品亚洲无码| 国产麻豆精品一区二区| 一区二区精品免费视频| 日韩欧美一区二区三区免费观看| 亚洲精品成人免费| 日本网站免费观看| 成人免费看视频| 麻豆视频传媒入口| 国产精品一区免费在线 | 九九热精品视频在线| 成人综合婷婷国产精品久久蜜臀| 91免费视频黄| 精品999日本久久久影院| 日韩视频一区在线| 一级α片免费看刺激高潮视频| 国产亚洲精品久| 女人另类性混交zo| 欧美色女视频| 国产美女精品视频| 久草免费在线| 日韩一区国产二区欧美三区| 日韩视频中文字幕在线观看| 狠狠色丁香婷婷综合| 国产日韩视频在线播放| 国产不卡精品在线| 欧美成人一区在线| 亚洲国产综合网| 亚洲国产精品影院| 亚洲观看黄色网| 亚洲欧美日韩国产一区二区| 免费看成人av| 久久天天久久| 久久精品人人爽| 亚洲高清在线观看视频| 午夜婷婷国产麻豆精品| 丰满少妇一区二区| 青娱乐精品在线视频| 在线国产精品网| 日韩精品中文字幕一区二区| 午夜免费日韩视频| 国产小视频免费在线网址| 欧美三级电影在线看| 国产精品国产三级国产传播| 国产不卡在线播放| 欧美日韩在线视频一区二区三区| 国产成人三级| 91精品久久久久| 麻豆福利在线观看| 亚洲人成在线播放| 88av在线视频| 亚洲成a人v欧美综合天堂下载| 免费黄色在线视频| 久久国产福利国产秒拍| 日韩黄色片在线| 伊人春色精品| 92国产精品视频| 色综合亚洲图丝熟| 久久精品中文字幕一区| 亚洲欧美日本在线观看| 欧美视频中文字幕| 国产精品第72页| 中文字幕乱码久久午夜不卡 | 18成人在线视频| xfplay5566色资源网站| 美女网站在线免费欧美精品| 波多野结衣av一区二区全免费观看| 国产伦精品一区二区三区视频| 91久久精品国产91久久| 天堂网在线最新版www中文网| x99av成人免费| 午夜视频免费在线| 91精品国产综合久久小美女 | 91精品国产一区二区三区蜜臀| 精品视频一区二区在线观看| 国产日产精品1区| 免费观看污网站| 久久精品国产**网站演员| 91专区在线观看| 在线看片不卡| 神马影院一区二区| 台湾色综合娱乐中文网| 3d蒂法精品啪啪一区二区免费| 美女日韩欧美| 性视频1819p久久| 97caopron在线视频| 在线观看精品自拍私拍| 性感美女一级片| 欧美成人vr18sexvr| 伊人精品在线视频| 一本一道久久a久久精品| 欧美日韩国产精品综合| 中文字幕日本不卡| 99国产精品免费| 久久网站最新地址| 国产毛片毛片毛片毛片毛片毛片| 国产一区二区在线免费观看| 污网站免费在线| 日韩综合小视频| 国产福利视频在线播放| 99精品99| www.夜夜爱| 欧美日韩一区二区高清| 一二三四中文字幕| 自拍视频亚洲| 91传媒免费视频| 欧美~级网站不卡| 日本黄网站色大片免费观看| 亚洲一区二区三区| 国产手机视频在线观看| 四虎成人av| 在线视频不卡一区二区三区| 人人狠狠综合久久亚洲婷| 天堂精品一区二区三区| 精品国产日韩欧美| 亚洲人体一区| 国产精品久久久久久久久久10秀| 亚洲高清在线观看一区| 欧美日韩有码| 一区二区三区欧美在线| 欧美黄色录像片| 最新国产精品久久| 欧美激情日韩| 国产精品一线二线三线| 99国产精品| 欧美日韩激情视频在线观看| 亚洲欧美日韩专区| 欧美黄色性生活| 国内欧美视频一区二区| 在线免费黄色小视频| 国产精品亚洲成人| 91超薄肉色丝袜交足高跟凉鞋| 成人性生交大片| 性色av蜜臀av色欲av| 国产亚洲精品7777| 国产免费嫩草影院| 亚洲欧美日韩国产成人精品影院 | 精品国产乱码久久久久软件| 亚洲v天堂v手机在线| 亚洲欧美日韩国产yyy | 色综合视频一区中文字幕| 18aaaa精品欧美大片h| 日本a级片电影一区二区| 国产69精品久久久久按摩| 91美女片黄在线观| 久久激情av| 亚洲精品久久久久久一区二区| 这里只有精品在线| 国产精品久久中文字幕| 日韩不卡一区二区三区| 麻豆网站免费观看| 91免费看`日韩一区二区| 免费黄色片网站| 一区二区三区在线免费观看| 久久露脸国语精品国产91| 91福利国产精品| 成人h动漫精品一区二区无码| 日韩电影免费观看在线观看| 91吃瓜网在线观看| 久久免费精品日本久久中文字幕| 日日夜夜天天综合| 成人综合av网| 欧美色爱综合| 国产精品又粗又长| 久久精品国产一区二区三| 国产伦精品一区二区三区精品| 久久精品视频在线看| 丁香花五月激情| 欧美综合视频在线观看| 丰满人妻一区二区| 色狠狠av一区二区三区香蕉蜜桃| 久久香蕉av| 91精品免费看| 精品国产一区二区三区久久久蜜臀| 国产 国语对白 露脸| 秋霞电影一区二区| 欧美 变态 另类 人妖| 亚洲精品一二三区| 天天干天天插天天射| 亚洲国产精品网站| 污片视频在线免费观看| 国产成人高潮免费观看精品| 大陆精大陆国产国语精品| eeuss中文| 男人的j进女人的j一区| 粉嫩av懂色av蜜臀av分享| 亚洲欧美日韩国产综合| 姑娘第5集在线观看免费好剧| 亚洲国产日韩精品在线| huan性巨大欧美| 国产在线精品一区免费香蕉| 欧美人与拘性视交免费看| 免费一级特黄特色毛片久久看| 国产在线视频一区二区| 网站永久看片免费| 欧美亚洲综合网| 你懂的在线网址| 国产91av在线| 老汉色老汉首页av亚洲| 久久久久久久9| 国产激情一区二区三区四区 | 欧美日韩精品中文字幕| 丰满大乳国产精品| 久久91精品国产| 精品一区二区三区免费看| 爱爱爱视频网站| 久久66热re国产| 小泽玛利亚一区| 在线播放/欧美激情| 日韩免费啪啪| 91网站在线免费观看| 小处雏高清一区二区三区| 特黄视频免费观看| 国产精品国产三级国产普通话蜜臀| 无码人妻精品一区二区三区不卡| 日韩精品亚洲视频| 亚洲精品中文字幕| 奇米精品在线| 免费观看成人av| 一本一本久久a久久| 在线综合+亚洲+欧美中文字幕| 麻豆传媒在线免费看| 成人性生交xxxxx网站| 中文字幕一区二区三区久久网站| 污污视频网站在线| 亚洲黄色免费网站| 欧美一区二区在线观看视频| 国内精品400部情侣激情| 欧美有码在线| 日韩视频免费在线播放| 日本一区二区成人| 国产色综合视频| 欧美极品在线视频| 奇米色欧美一区二区三区| 91最新在线观看| 1024国产精品| 天堂av手机版| 国产精品第1页| 国产精品久久久久久久久久10秀 | 国产黄频在线观看| 欧美精品久久久久久久久| 欧美天堂社区| 亚洲一区日韩精品| 亚洲一区二区三区美女| 青青草手机在线| 91久久精品国产| 国产精品永久| 欧美自拍偷拍网| 亚洲成人精品av| jizz欧美| 337p亚洲精品色噜噜狠狠p| 91小视频在线| 亚洲一级片免费看| 久久久免费电影| 成人区精品一区二区婷婷| 国产成人av片| 欧美性大战久久| 久久久123| 亚洲国产精品久久久久久女王| 国产精品一卡二卡在线观看| 久久精品国产成人av| 日韩专区中文字幕| 精品国内亚洲2022精品成人| 男女污污的视频| 亚洲国产日韩a在线播放性色| 成人亚洲综合天堂| 丁香五月网久久综合| 日本欧美韩国一区三区| 久久免费少妇高潮99精品| 伊人伊成久久人综合网站 | 日韩欧美一区二区三区四区五区| 国产一区二区导航在线播放| 日本a级c片免费看三区| 欧美黑人一区二区三区| 日韩伦理视频| 久久精品综合视频|