精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大模型的“大腦容量”有多大?科學家用3.6比特解開了這個秘密 精華

發(fā)布于 2025-6-16 00:23
瀏覽
0收藏

你有沒有想過,當ChatGPT回答你的問題時,它的“大腦”里到底裝了多少東西?最近,來自Meta、谷歌DeepMind、康奈爾大學等機構的研究人員發(fā)表了一項突破性研究,首次精確測量出了大語言模型的“記憶容量”。這項研究不僅揭示了AI學習的奧秘,還解釋了許多我們?nèi)粘J褂弥杏龅降默F(xiàn)象。

什么是模型的“記憶”?

想象一下你在準備考試。有些知識你是真正理解的,比如數(shù)學公式的推導原理,遇到新題目時你能靈活運用;而有些內(nèi)容你只是死記硬背,比如某些特定的歷史日期或化學方程式,只能原樣復述。

大語言模型也是如此——它既會“理解”語言的一般規(guī)律,也會“死記硬背”訓練數(shù)據(jù)中的具體內(nèi)容。

研究人員將模型的記憶分為兩種:

?一種是“有意記憶”(generalization),就像我們理解數(shù)學原理一樣,模型學會了語言的通用規(guī)律,能夠回答從未見過的問題;

?另一種是“無意記憶”(unintended memorization),就像死記硬背一樣,模型直接存儲了訓練數(shù)據(jù)的具體片段。

這種區(qū)分非常重要。如果一個模型能回答“2的100次方等于多少”,這可能并不意味著它記住了這個具體的數(shù)學題,而是它學會了數(shù)學運算的一般方法。但如果它能一字不差地背出某本小說的片段,那就是真正的“死記硬背”了。

3.6比特的秘密

大模型的“大腦容量”有多大?科學家用3.6比特解開了這個秘密-AI.x社區(qū)

經(jīng)過大量實驗,研究人員發(fā)現(xiàn)了一個規(guī)律:GPT系列模型的每個參數(shù)大約能存儲3.6比特的信息。這個數(shù)字聽起來很抽象,讓我們用一個生活化的比喻來理解。

如果把模型參數(shù)比作書架上的格子,那么每個格子大約能裝下3.6比特的“知識碎片”。一個擁有10億參數(shù)的大模型,理論上最多能存儲約36億比特的具體信息,大概相當于450MB的數(shù)據(jù)——這大約是一部電影的十分之一大小。

有趣的是,研究人員還測試了精度對容量的影響。他們發(fā)現(xiàn),從半精度(bfloat16)提升到全精度(float32),模型的存儲容量只從3.51比特增加到3.83比特,遠小于理論上的2倍提升。這說明大部分額外的精度并沒有用于原始信息存儲,而是用于其他計算過程。

從死記硬背到融會貫通

更有意思的一個發(fā)現(xiàn)是,研究人員發(fā)現(xiàn)了模型學習的一個奇妙現(xiàn)象,類似于我們觀察到的“學霸效應”。

想象一個學生在學習過程中的變化:剛開始面對有限的題目時,他只能死記硬背每道題的答案;但當學習材料增加到一定程度后,他開始理解背后的原理,不再需要死記每個具體案例,而是能夠舉一反三。

大語言模型也經(jīng)歷著同樣的過程。研究人員通過訓練數(shù)百個不同規(guī)模的模型,從50萬參數(shù)到15億參數(shù),觀察了這個變化過程。當訓練數(shù)據(jù)較少時,模型會盡力記住每個具體的句子和段落;但當數(shù)據(jù)量超過模型的“記憶容量”后,模型開始“開竅”——它不再死記硬背具體內(nèi)容,而是學會了語言的普遍規(guī)律。

這個轉折點被研究人員稱為“grokking”時刻,就像學生突然開竅的那一瞬間。在這個時刻之后,模型的“死記硬背”能力下降,但“舉一反三”的能力大幅提升。研究發(fā)現(xiàn),這個轉折點恰好出現(xiàn)在數(shù)據(jù)集大小超過模型容量的時候。

AI學習中的神奇拐點

大模型的“大腦容量”有多大?科學家用3.6比特解開了這個秘密-AI.x社區(qū)

研究人員還觀察到了一個被稱為“雙下降”(double descent)的奇怪現(xiàn)象。這就像一個學生的學習曲線:剛開始時成績隨著學習時間增加而提高,但到了某個點后,成績可能暫時下降(因為開始接觸更難的內(nèi)容),然后又開始上升并達到新高度。

在AI模型中,當訓練數(shù)據(jù)量剛好等于模型容量時,模型的測試表現(xiàn)會出現(xiàn)一個明顯的峰值,然后下降,接著又開始上升。研究人員發(fā)現(xiàn),這個現(xiàn)象的根本原因是:當數(shù)據(jù)量超過模型容量時,模型被迫從個體記憶轉向模式識別,開始真正“理解”數(shù)據(jù)的內(nèi)在規(guī)律。

這個發(fā)現(xiàn)為理解AI的學習過程提供了全新的視角。之前人們一直困惑為什么會出現(xiàn)雙下降現(xiàn)象,現(xiàn)在我們知道,這其實是AI從“死記硬背”向“融會貫通”轉變的標志。

為什么ChatGPT很難被“套話”?

這項研究還解釋了一個實際問題:為什么我們很難從ChatGPT等大模型中"套出"訓練數(shù)據(jù)的原始內(nèi)容?

答案在于訓練數(shù)據(jù)的規(guī)模。研究人員建立了一個數(shù)學模型來預測“成員推理攻擊”(判斷某段文字是否在訓練數(shù)據(jù)中出現(xiàn)過)的成功率。他們發(fā)現(xiàn),這個成功率遵循一個S型曲線:當數(shù)據(jù)量遠小于模型容量時,攻擊幾乎百分之百成功;當數(shù)據(jù)量遠大于模型容量時,攻擊成功率接近隨機猜測的50%。

現(xiàn)在的大模型都使用了海量的訓練數(shù)據(jù)——遠遠超過了模型的記憶容量。比如某個80億參數(shù)的模型被訓練在15萬億個token上,按照每個token平均4個字節(jié)計算,這相當于約60TB的數(shù)據(jù),是模型容量的數(shù)千倍。

就像一個學生面對無窮無盡的習題集,他不可能記住每道題的具體內(nèi)容,只能掌握解題的一般方法。研究人員的預測模型顯示,按照目前的訓練規(guī)模,想要從主流大模型中進行成員推理攻擊幾乎是不可能的,成功率接近50%(即隨機猜測的水平)。

哪些內(nèi)容最容易被“死記”?

大模型的“大腦容量”有多大?科學家用3.6比特解開了這個秘密-AI.x社區(qū)

研究發(fā)現(xiàn):模型最容易“死記硬背”的是那些包含稀有詞匯的文本,特別是非英語內(nèi)容。

研究人員使用TF-IDF(詞頻-逆文檔頻率)來衡量文本的稀有程度。就像我們更容易記住奇特的事物一樣,模型也更傾向于記住那些在訓練數(shù)據(jù)中很少見的內(nèi)容。他們分析了一個2000萬參數(shù)的模型,發(fā)現(xiàn)在最容易被模型記住的20個文本片段中,除了3個之外,其余都包含非英語詞匯,主要是日語、中文、希伯來語和希臘語。

最極端的例子是一個包含日語詞匯的序列,模型只需要看到一個日語字符"囚",就能完整地生成整個序列。這說明稀有內(nèi)容確實更容易被模型“死記硬背”。

這個發(fā)現(xiàn)提醒我們,雖然模型整體上很難被“套話”,但對于一些特殊的、稀有的內(nèi)容,特別是少數(shù)語言的文本,我們?nèi)匀恍枰3志琛?/p>

用隨機數(shù)據(jù)驗證理論

為了驗證他們的理論,研究人員還進行了一個巧妙的實驗:他們讓模型學習完全隨機的比特序列。由于這些序列完全隨機,模型無法從中學到任何“規(guī)律”,只能純粹地死記硬背。

在這個實驗中,他們訓練了從50萬到15億參數(shù)的各種模型,讓它們學習不同長度的隨機序列。結果證實了他們的理論:每個參數(shù)確實能存儲約3.64比特的信息,而且當數(shù)據(jù)量超過模型容量時,記憶效果就達到了平臺期,無法再提升。

這個實驗特別重要,因為它排除了“理解”和“泛化”的影響,純粹測量了模型的原始存儲能力。結果與在真實文本上的實驗高度一致,證明了理論的可靠性。

不同模型架構的容量差異

研究人員還測試了不同模型架構對容量的影響。他們發(fā)現(xiàn),模型的層數(shù)和寬度都會影響容量,但影響程度不同。

通過對比1層到8層、隱藏維度從32到256的各種配置,他們發(fā)現(xiàn)寬度的影響比深度更明顯。這為模型設計提供了實用的指導:如果目標是最大化信息存儲容量,增加模型寬度可能比增加深度更有效。

預測大模型的行為

基于這些發(fā)現(xiàn),研究人員建立了一個預測模型,能夠根據(jù)模型大小和數(shù)據(jù)集規(guī)模預測成員推理攻擊的成功率。他們用這個模型預測了GPT-2系列模型的表現(xiàn),并通過實際實驗驗證了預測的準確性。

預測結果顯示,要讓一個1.25億參數(shù)的GPT-2模型的成員推理F1分數(shù)達到0.95(幾乎完美),需要將訓練數(shù)據(jù)限制在約150萬個樣本;而要降到0.55(接近隨機猜測),需要約1.7億個樣本。實際實驗結果與預測值的誤差在1-2%以內(nèi),證明了模型的可靠性。

這項研究對AI的安全性和隱私保護具有重要意義。它告訴我們,現(xiàn)代大模型由于使用了遠超其容量的訓練數(shù)據(jù),在隱私保護方面表現(xiàn)得比我們想象的要好。

但同時,研究也提醒我們需要特別關注稀有內(nèi)容和少數(shù)語言文本的隱私保護。這些內(nèi)容更容易被模型記住,可能面臨更高的隱私泄露風險。

這項研究不僅幫助我們理解了大語言模型的工作原理,也為未來的模型設計提供了重要指導。

現(xiàn)在我們知道,一個模型的“記憶容量”是有限的。如果我們想要模型更好地理解和推理,就應該用足夠多的數(shù)據(jù)來“撐滿”這個容量,迫使模型從“死記硬背”轉向“融會貫通”。這解釋了為什么現(xiàn)在的大模型需要如此龐大的訓練數(shù)據(jù)——正是這些海量數(shù)據(jù),讓模型從一個“背書機器”進化成了真正能夠理解和創(chuàng)造的“智能助手”。

研究還為模型訓練提供了實用的指導原則:當你的數(shù)據(jù)量達到模型容量的100倍以上時,模型就會進入“泛化模式”,主要學習規(guī)律而非記憶具體內(nèi)容。這為訓練數(shù)據(jù)的規(guī)模提供了科學的參考標準。

本文轉載自???芝士AI吃魚??,作者:芝士AI吃魚

收藏
回復
舉報
回復
相關推薦
久久精品国产精品青草色艺| 久久久久久久久久久av| 污污网站免费看| 国内外激情在线| av午夜一区麻豆| 国产精品久久久久不卡| 欧美日韩一级大片| 精品日产免费二区日产免费二区| 日韩欧美一区二区不卡| 久久久久久三级| 欧美巨大xxxx做受沙滩| 国产欧美精品一区| 韩日午夜在线资源一区二区| 国产原创中文av| 亚洲一区二区三区四区五区午夜 | 色久优优欧美色久优优| 免费久久久久久| 激情视频在线观看免费| 成人免费视频一区二区| 成人精品在线观看| 波多野结衣一区二区三区在线| 狠狠综合久久| 日韩三级影视基地| 卡一卡二卡三在线观看| 欧美一区二区三区久久| 日韩视频一区二区在线观看| 九一精品在线观看| 亚洲一二三四| 午夜精品久久久久久久99水蜜桃| 日韩最新中文字幕| 在线视频三区| 久久久www成人免费无遮挡大片| 成人在线视频网址| 国产视频在线免费观看| 久久精品国产免费| 国产在线观看精品| 中文字幕乱码中文字幕| 美女久久一区| 日韩av成人在线| 久久久久久91亚洲精品中文字幕| 亚洲激情网址| 国内揄拍国内精品少妇国语| 久久久久久久久久一区二区三区| 亚洲一区色图| 欧美第一页在线| 1024手机在线视频| 欧美ab在线视频| 美女av一区二区三区 | 内衣办公室在线| 99久久免费国产| 激情欧美一区二区三区中文字幕| 成人毛片在线免费观看| 成人小视频在线观看| 国产麻豆日韩| 午夜国产在线视频| 2020国产成人综合网| 久久亚洲综合网| 日韩精品视频无播放器在线看 | 日韩电影中文字幕在线观看| 中文字幕在线播放视频| 秋霞综合在线视频| 亚洲女人被黑人巨大进入al| 丰腴饱满的极品熟妇| 国产欧美日韩视频在线| 中文欧美日本在线资源| 婷婷激情四射网| 极品日韩av| 欧美在线亚洲在线| 国产第一页在线观看| 免费欧美在线视频| 91福利视频导航| 亚洲三区在线播放| 欧美经典一区二区三区| 先锋在线资源一区二区三区| 免费黄色电影在线观看| 亚洲一区二区偷拍精品| 国产欧美在线一区| 亚洲欧美一级| 亚洲黄页网在线观看| 免费观看a级片| 欧美成人日韩| 欧美在线不卡区| 亚洲手机在线观看| 成人网在线播放| 欧美一区二区三区四区在线观看地址| 最新真实国产在线视频| 亚洲精品ww久久久久久p站| 亚洲熟妇av日韩熟妇在线| 成人mm视频在线观看| 欧美成人精品福利| 日韩毛片无码永久免费看| 欧美fxxxxxx另类| 日韩av电影免费观看高清| 91亚洲国产成人精品一区| gogo大胆日本视频一区| 亚洲日本精品一区| 九色porny丨首页入口在线| 欧美日韩精品一区视频| 亚洲无人区码一码二码三码| 久久理论电影| 97在线日本国产| av中文字幕第一页| 国产亚洲精品bt天堂精选| 欧美日韩中文字幕在线播放| av一区在线| 亚洲的天堂在线中文字幕| 青青草自拍偷拍| 免费在线成人| 国产免费一区二区三区| www久久日com| 91成人免费在线视频| 国产 xxxx| 91tv官网精品成人亚洲| 国产精品久久久久久久久久久久久| 99视频免费看| 国产精品入口麻豆原神| 欧美 国产 日本| 国产三级精品三级在线观看国产| 伦伦影院午夜日韩欧美限制| 夜夜躁日日躁狠狠久久av| a级精品国产片在线观看| 国产奶头好大揉着好爽视频| 五月激情久久| 亚洲欧美制服另类日韩| 精品成人久久久| 夫妻av一区二区| 成人午夜视频免费观看| 国产精品日本一区二区不卡视频 | аⅴ天堂中文在线网| 国产日韩欧美高清免费| 国产精品区一区二区三在线播放 | 一级精品视频在线观看宜春院 | 免费观看亚洲视频大全| 色吧影院999| 中文字幕永久在线视频| 国产欧美日韩在线观看| 欧美亚洲日本在线观看| 九热爱视频精品视频| 日本久久久久久久久久久| 青春有你2免费观看完整版在线播放高清 | 懂色av中文字幕一区二区三区| 免费在线精品视频| 国产一区二区三区免费观看在线 | 日本在线视频一区二区三区| 久久精品中文字幕免费mv| 国产美女免费看| 亚洲精品国产一区二区三区四区在线 | 91杏吧porn蝌蚪| 国产精选一区二区三区| 欧美另类videosbestsex日本| 亚洲午夜免费| 午夜精品久久久久久久久久久久| 婷婷五月综合激情| 日本精品视频一区二区三区| 手机毛片在线观看| 老司机精品视频导航| 欧美一级免费在线观看| 91精品短视频| 欧美中文在线字幕| 第一页在线观看| 欧美精品视频www在线观看| 欧产日产国产v| 国产成人亚洲综合a∨猫咪| 国产人妻777人伦精品hd| 免费成人高清在线视频theav| 国产成人一区二区三区小说| avtt在线播放| 4438x成人网最大色成网站| 午夜少妇久久久久久久久| 波多野洁衣一区| 日韩视频在线免费看| 色综合久久一区二区三区| 亚洲综合大片69999| 1区2区在线| 中文字幕久热精品视频在线| 国产色综合视频| 日韩欧美福利视频| 国产真实乱在线更新| 成人丝袜高跟foot| www.色就是色| 精品动漫av| 日韩精品久久久毛片一区二区| 国产视频一区二| 国产91精品青草社区| 91caoporn在线| 亚洲成人av片在线观看| 久久久久精彩视频| 亚洲一区在线看| av免费播放网站| 丁香一区二区三区| 8x8x最新地址| 亚洲精品孕妇| 亚洲免费视频播放| 色综合中文网| 国产在线一区二区三区欧美| 婷婷丁香久久| 日本精品视频在线观看| 韩国成人免费视频| 日韩在线免费av| 日本韩国精品一区二区| 日韩免费观看高清完整版在线观看| 在线永久看片免费的视频| 亚洲综合一区在线| 麻豆一区在线观看| 26uuu另类欧美| 亚洲成人激情小说| 激情综合网最新| mm1313亚洲国产精品无码试看| 亚洲无线一线二线三线区别av| 亚洲精品成人a8198a| 欧美黑白配在线| 2022国产精品| 国产 日韩 欧美| 国产精品久久久久91| 在线高清av| 国内精品一区二区三区| 国产美女av在线| 正在播放欧美一区| 你懂的视频在线免费| 亚洲精品美女在线| 亚洲经典一区二区三区| 91精品国产综合久久久久久久久久| 五月天婷婷导航| 精品久久久中文| 国产香蕉视频在线| 亚洲国产乱码最新视频 | 亚洲国产精品自拍视频| 国产激情偷乱视频一区二区三区| 亚洲这里只有精品| 久色婷婷小香蕉久久| 日韩中文字幕免费在线| 裸体素人女欧美日韩| 国产免费毛卡片| 国产精品久久777777毛茸茸| 久久成人免费观看| 亚洲一区观看| 欧美综合在线观看视频| 三级不卡在线观看| 黄色av免费在线播放| 美女91精品| 密臀av一区二区三区| 日韩电影在线免费看| 黄色免费网址大全| 免费一级片91| 天天操精品视频| 国产成人免费视频| 中国黄色片视频| 91在线播放网址| 黄色aaa视频| 国产日韩精品一区二区三区| 日韩一级片在线免费观看| 国产精品久久久久7777按摩| 97精品在线播放| 亚洲精选免费视频| 日本三级视频在线| 欧美日韩亚洲网| 综合久久中文字幕| 91精品欧美福利在线观看| 精品人妻少妇嫩草av无码专区| 亚洲成人在线视频播放| 日韩一区av| 日韩一区二区三区国产| 久久99亚洲网美利坚合众国| 韩国精品美女www爽爽爽视频| 性欧美freesex顶级少妇| 国产精品极品美女粉嫩高清在线| 亚洲资源在线| 国产综合18久久久久久| 精品日本12videosex| 欧美精品一区二区性色a+v| 亚洲国产一区二区三区a毛片| 国产男女激情视频| 国产美女娇喘av呻吟久久| 私密视频在线观看| 中文字幕精品一区二区三区精品| 动漫性做爰视频| 高潮白浆女日韩av免费看| 中文字幕一区二区三区四区免费看 | 国产一区二区三区精彩视频| 蜜臀av性久久久久蜜臀aⅴ流畅| 伊人五月天婷婷| 久久蜜桃香蕉精品一区二区三区| 国产探花视频在线| 午夜久久久久久久久| 亚洲无码精品一区二区三区| 精品日韩欧美在线| 成人免费视频| 欧美激情久久久| 在线一区视频观看| 成人免费视频网站| 日韩一级毛片| 浮妇高潮喷白浆视频| 韩国av一区二区| 91精品人妻一区二区三区蜜桃欧美| 亚洲欧美激情插 | 日韩欧美自拍偷拍| 国产永久免费高清在线观看| 欧美黄色性视频| 农村妇女一区二区| 你懂的网址一区二区三区| 久久精品国内一区二区三区水蜜桃| 69堂免费视频| 国产激情偷乱视频一区二区三区| www.日本高清视频| 午夜国产不卡在线观看视频| 国产美女自慰在线观看| 一区二区三区四区视频| 麻豆国产在线| 国产亚洲欧美另类一区二区三区| 午夜国产一区二区| 别急慢慢来1978如如2| 成人18精品视频| 午夜69成人做爰视频| 欧美精品高清视频| a中文在线播放| 日本电影亚洲天堂| 日本精品影院| 欧美 日本 亚洲| 成人免费高清在线| 免费人成年激情视频在线观看| 欧美精品乱码久久久久久| 91伦理视频在线观看| 国产成人精品在线视频| 性人久久久久| 国产精品12345| 波多野结衣视频一区| 男人天堂中文字幕| 欧美tickling挠脚心丨vk| 色操视频在线| 91在线看网站| 合欧美一区二区三区| 少妇搡bbbb搡bbb搡打电话| 玉足女爽爽91| 黄色av一区二区三区| 国a精品视频大全| 九九热hot精品视频在线播放| 欧美国产综合在线| av不卡免费在线观看| 国产无遮挡裸体免费视频| 亚洲第一精品夜夜躁人人爽 | 国产脚交av在线一区二区| 视频一区欧美| 三级在线视频观看| 中文一区一区三区高中清不卡| 免费黄色片视频| 爱福利视频一区| 日本一区二区乱| 欧美一级视频免费看| 337p粉嫩大胆色噜噜噜噜亚洲| 国产九色在线播放九色| 亚洲视频欧洲视频| 日韩在线你懂得| 国产精品久久国产| www.性欧美| 无码人妻久久一区二区三区不卡| 国产亚洲激情在线| 95精品视频| 97超碰人人澡| 久久久国产精品麻豆| 一卡二卡三卡在线| 欧美激情va永久在线播放| 久久久伦理片| 天天插天天操天天射| 亚洲精品一二三| 色丁香婷婷综合久久| 国产精彩精品视频| 婷婷综合久久| 在线观看国产免费视频| 欧美性大战久久| 中文字幕中文字幕在线中高清免费版| 肥熟一91porny丨九色丨| 国产一区二区三区成人欧美日韩在线观看| 中文字幕在线观看免费高清| 91精品国产高清一区二区三区| 99热99re6国产在线播放| 日本在线观看一区二区| 国产乱码精品1区2区3区| a v视频在线观看| www国产91| 制服丝袜日韩| 欧美性猛交xx| 色天天综合久久久久综合片| 国产福利在线播放麻豆| 久久综合给合久久狠狠色| 久久精品av麻豆的观看方式| 国产极品在线播放| 中文字幕亚洲精品| 国产成人精品亚洲线观看| 激情五月婷婷久久| 亚洲成a人在线观看| 成人网视频在线观看| 北条麻妃高清一区| 麻豆91小视频| av资源免费观看| 欧美成人小视频| 日韩精品诱惑一区?区三区| 99久久免费看精品国产一区| 欧美日韩国产免费一区二区| 欧美久久天堂| 9191国产视频|