精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Llama架構比不上GPT2?神奇token提升10倍記憶?

人工智能 新聞
近日,朱澤園 (Meta AI) 和李遠志 (MBZUAI) 的最新研究《語言模型物理學 Part 3.3:知識的 Scaling Laws》用海量實驗(50,000 條任務,總計 4,200,000 GPU 小時)總結了 12 條定律,為 LLM 在不同條件下的知識容量提供了較為精確的計量方法。

一個 7B 規模的語言模型 LLM 能存儲多少人類知識?如何量化這一數值?訓練時間、模型架構的不同將如何影響這一數值?浮點數壓縮 quantization、混合專家模型 MoE、以及數據質量的差異 (百科知識 vs 網絡垃圾) 又將對 LLM 的知識容量產生何種影響?

近日,朱澤園 (Meta AI) 和李遠志 (MBZUAI) 的最新研究《語言模型物理學 Part 3.3:知識的 Scaling Laws》用海量實驗(50,000 條任務,總計 4,200,000 GPU 小時)總結了 12 條定律,為 LLM 在不同條件下的知識容量提供了較為精確的計量方法。

作者首先指出,通過開源模型在基準數據集 (benchmark) 上的表現來衡量 LLM 的 scaling law 是不現實的。例如,LlaMA-70B 在知識數據集上的表現比 LlaMA-7B 好 30%,這并不能說明模型擴大 10 倍僅僅能在容量上提高 30%。如果使用網絡數據訓練模型,我們也將很難估計其中包含的知識總量。

再舉個例子,我們比較 Mistral 和 Llama 模型的好壞之時,到底是他們的模型架構不同導致的區別,還是他們訓練數據的制備不同導致的?

綜合以上考量,作者采用了他們《語言模型物理學》系列論文的核心思路,即制造人工合成數據,通過控制數據中知識的數量和類型,來嚴格調控數據中的知識比特數 (bits)。同時,作者使用不同大小和架構的 LLM 在人工合成數據上進行訓練,并給出數學定理,來精確計算訓練好的模型從數據中學到了多少比特的知識。

圖片

  • 論文地址:https://arxiv.org/pdf/2404.05405.pdf
  • 論文標題:Physics of Language Models: Part 3.3, Knowledge Capacity Scaling Laws

對于這項研究,有人表示這個方向似乎是合理的。我們可以使用非常科學的方式對scaling law 進行分析。

圖片

也有人認為,這項研究將 scaling law 提升到了不同的層次。當然,對于從業者來說是一篇必讀論文。

圖片

研究概覽

作者研究了三種類型的合成數據:bioS、bioR、bioD。bioS 是使用英語模板編寫的人物傳記,bioR 是由 LlaMA2 模型協助撰寫的人物傳記(22GB 總量),bioD 則是一種虛擬但可以進一步控制細節的知識數據(譬如可以控制知識的長度、詞匯量等等細節)。作者重點研究了基于 GPT2、LlaMA、Mistral 的語言模型架構,其中 GPT2 采用了更新的 Rotary Position Embedding (RoPE) 技術

左圖為訓練時間充足,右圖為訓練時間不足的 scaling laws

上圖 1 簡要概述了作者提出的前 5 條定律,其中左 / 右分別對應了「訓練時間充足」和 「訓練時間不足」兩種情況,分別對應了常見知識(如中國首都是北京)和較少出現的知識(如清華物理系成立于 1926 年)。

如果訓練時間充足,作者發現,不論使用何種模型架構,GPT2 或 LlaMA/Mistral,模型的存儲效率均可以達到 2bit/param—— 即平均每個模型參數可以存儲 2 比特的信息。這與模型的深度無關,僅與模型大小有關。換言之,一個 7B 大小的模型,如果訓練充足,可以存儲 14B 比特的知識,這超過了維基百科和所有英文教科書中人類知識的總和!

更令人驚訝的是,盡管傳統理論認為 transformer 模型中的知識主要存儲在 MLP 層,但作者的研究反駁了這一觀點,他們發現即便移除了所有 MLP 層,模型仍能達到 2bit/param 的存儲效率。

圖 2:訓練時間不足情況下的 scaling laws

然而,當我們觀察訓練時間不足的情況時,模型間的差異就顯現出來了。如上圖 2 所示,在這種情況下,GPT2 模型能比 LlaMA/Mistral 存儲超過 30% 的知識,這意味著幾年前的模型在某些方面超越了今天的模型。為什么會這樣?作者通過在 LlaMA 模型上進行架構調整,將模型與 GPT2 的每個差異進行增減,最終發現是 GatedMLP 導致了這 30% 的損失。

強調一下,GatedMLP 并不會導致模型的「最終」存儲率變化 —— 因為圖 1 告訴我們如果訓練充足它們就不會有差。但是,GatedMLP 會導致訓練不穩定,因此對同樣的知識,需要更長的訓練時間;換句話說,對于較少出現在訓練集里的知識,模型的存儲效率就會下降。

圖 3:quantization 和 MoE 對模型 scaling laws 的影響

作者的定律 8 和定律 9 分別研究了 quantization 和 MoE 對模型 scaling law 的影響,結論如上圖 3 所示。其中一個結果是,將訓練好的模型從 float32/16 壓縮到 int8,竟然對知識的存儲毫無影響,即便對已經達到 2bit/param 存儲極限的模型也是如此。

這意味著,LLM 可以達到「信息論極限」的 1/4—— 因為 int8 參數只有 8 比特,但平均每個參數可以存儲 2 比特的知識。作者指出,這是一個普遍法則(universal law),和知識的表現形式無關。

最引人注目的結果來自于作者的定律 10-12(見圖 4)。如果我們的 (預) 訓練數據中,有 1/8 來自高質量知識庫(如百度百科),7/8 來自低質量數據(如 common crawl 或論壇對話,甚至是完全隨機的垃圾數據)。

那么,低質量數據是否會影響 LLM 對高質量知識的吸收呢?結果令人驚訝,即使對高質量數據的訓練時間保持一致,低質量數據的「存在本身」,可能會讓模型對高質量知識的存儲量下降 20 倍!即便將高質量數據的訓練時間延長 3 倍,知識儲量仍會降低 3 倍。這就像是將金子丟進沙子里,高質量數據被嚴重浪費了。

有什么辦法修復呢?作者提出了一個簡單但極其有效的策略,只需給所有的 (預) 訓練數據加上自己的網站域名 token 即可。例如,將 Wiki 百科數據統統加上 wikipedia.org。模型不需要任何先驗知識來識別哪些網站上的知識是「金子」,而可以在預訓練過程中,自動發現高質量知識的網站,并自動為這些高質量數據騰出存儲空間。

作者提出了一個簡單的實驗來驗證:如果高質量數據都加上一個特殊 token(任何特殊 token 都行,模型不需要提前知道是哪個 token),那么模型的知識存儲量可以立即回升 10 倍,是不是很神奇?所以說對預訓練數據增加域名 token,是一個極其重要的數據制備操作

圖 4:預訓練數據「知識質量不齊」情形下的 scaling laws,模型缺陷以及如何修復

結語

作者認為,通過合成數據,計算模型在訓練過程中獲得的知識總量的方法,可以為「評估模型架構、訓練方法和數據制備」提供了一套系統且精確的打分體系。這和傳統的 benchmark 比較完全不同,并且更可靠。他們希望這能幫助未來 LLM 的設計者做出更明智的決策。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-05-06 08:25:00

2020-07-22 08:30:02

代碼開發工具

2025-07-29 07:46:00

2025-08-08 09:23:00

2023-07-25 09:23:23

Llama 2GPT-4

2011-07-01 10:11:39

2023-04-14 07:09:04

2024-02-19 13:45:14

OpenAIGPT-2模型

2023-02-26 11:53:20

2024-11-25 09:11:43

2014-03-26 10:00:06

RailsRails性能

2024-10-29 08:21:05

2025-11-07 08:44:38

2020-03-26 12:38:15

代碼節點數據

2025-05-27 01:55:00

TypeScript開發者項目

2020-07-21 15:40:55

NginxJava服務器

2024-02-05 09:00:00

2024-02-07 12:13:03

AI模型

2013-04-01 00:16:41

飛魚星無線云無線AP

2018-08-23 17:45:52

點贊
收藏

51CTO技術棧公眾號

日韩精品成人一区二区在线| 久久不见久久见国语| 亚洲图片欧美一区| 韩日午夜在线资源一区二区| 免费观看日批视频| 久久久久久免费视频| 亚洲成人精品av| 中文字幕在线观看第三页| 韩国av网站在线| 99久久99久久综合| 成人av资源在线播放| 国产真实夫妇交换视频| 精品免费视频| 亚洲精品一区二区三区香蕉| 色婷婷综合网站| a'aaa级片在线观看| 国产精品日日摸夜夜摸av| 国产精品播放| 国产精品系列视频| 久久久久久9| 欧美二区在线播放| 亚洲天堂av中文字幕| 精品伊人久久久| 欧美精品九九99久久| 99色精品视频| 污污网站在线看| 国产精品你懂的| 精品国产中文字幕| www.四虎在线观看| 麻豆91在线看| 国产99久久精品一区二区| 国产亚洲自拍av| 伊人成综合网| 色小说视频一区| 一道本在线观看| 欧美sss在线视频| 精品毛片乱码1区2区3区| 日日噜噜夜夜狠狠| 电影久久久久久| 亚洲高清视频在线| 精品少妇人欧美激情在线观看| 在线播放毛片| 日本一区二区高清| 日韩免费av电影| 日本一卡二卡四卡精品| www.欧美亚洲| 成人午夜影院在线观看| 精品久久久久成人码免费动漫| 免费高清在线一区| 国产精品久久久久久搜索| 天天干在线播放| 99日韩精品| 国内久久久精品| 久久久综合久久| 欧美精品自拍| 欧美激情二区三区| jizz国产免费| aa国产精品| 欧美自拍视频在线观看| 国产精品va无码一区二区三区| 国产一区二区精品| 欧美在线视频免费观看| 中文在线第一页| 日韩经典中文字幕一区| 国产精品成人国产乱一区| 最近中文字幕免费在线观看| 美女久久久精品| 成人免费观看网址| 精品国产黄色片| 成年人午夜久久久| 看高清中日韩色视频| 日韩福利一区二区| 欧美激情一二三区| 中文字幕欧美日韩一区二区三区| 久cao在线| 一区二区不卡在线播放| 给我免费播放片在线观看| 欧美亚洲日本精品| 欧美日韩一区二区欧美激情 | 精品无码在线视频| 自拍偷拍一区| 日韩中文字幕视频在线| 国产精品99久久久久久成人| 亚洲无线视频| 日韩免费在线视频| 国产乱淫av片免费| 99这里都是精品| 日韩高清dvd| 18av在线播放| 欧美视频在线看| 亚洲精品国产一区二区三区| 粉嫩av一区二区| 一区二区三区日韩在线| 免费在线观看黄视频| 国产女优一区| 亚洲专区中文字幕| 男同在线观看| 亚洲精品国产精华液| 日本精品一区二区三区四区| 9.1麻豆精品| 日韩精品免费在线视频| 91传媒免费观看| 国产免费成人| 国产高清一区视频| 调教视频免费在线观看| 亚洲成人精品一区二区| 中国黄色片免费看| 日韩深夜影院| 欧美疯狂xxxx大交乱88av| 久久人妻免费视频| 懂色av一区二区三区免费看| 亚洲一区二三| 美女日韩欧美| 亚洲第一级黄色片| 午夜国产福利一区二区| 奇米一区二区三区av| 久久精品国产一区二区三区不卡| 国产理论在线观看| 欧美三级在线看| 男男做爰猛烈叫床爽爽小说| 艳女tv在线观看国产一区| 日韩免费在线播放| 三级av在线| 亚洲成人在线观看视频| 亚洲制服在线观看| 97精品中文字幕| 国产高清在线不卡| 亚洲欧美综合在线观看| 亚洲影视在线播放| 91网址在线观看精品| 日韩欧美网站| 国产精品欧美一区二区| 日韩一区二区三区中文字幕| 亚洲成a人v欧美综合天堂| 超碰在线超碰在线| 亚洲国产日韩欧美在线| 成人日韩av在线| 秋霞成人影院| 欧美日本韩国一区二区三区视频| 黄免费在线观看| 免费亚洲婷婷| 欧美精品123| 日韩伦理福利| 精品一区二区三区四区在线| 91国产丝袜播放在线| av不卡免费在线观看| 日韩欧美不卡在线| 久久夜色精品国产噜噜av小说| 久久久久国产精品一区| 亚洲欧美另类视频| 亚洲一区二区三区精品在线| 成年女人免费视频| 99香蕉国产精品偷在线观看 | 亚洲精品视频在线观看网站| 中文字幕视频三区| 亚洲国产精品成人| 国产精品二区在线| aa国产成人| 精品中文视频在线| 国产亚洲久一区二区| 国产精品美女一区二区三区| 三上悠亚在线一区| 伊人情人综合网| 成人xxxxx色| 国产极品在线观看| 国产亚洲欧美另类中文| 亚洲熟妇无码久久精品| 国产精品国产三级国产aⅴ中文| 亚洲一二三av| 亚洲视频福利| 麻豆久久久av免费| 亚洲美女色播| 欧美激情免费在线| 欧美色18zzzzxxxxx| 欧美在线综合视频| 亚洲国产美女视频| 成人av在线一区二区三区| 欧美日本视频在线观看| 欧美亚洲在线日韩| 91九色单男在线观看| 19禁羞羞电影院在线观看| 国产一区av在线| 99久久一区二区| 日韩欧美第一页| 欧美xxxooo| av在线不卡免费看| 日韩视频免费在线播放| 综合精品久久| 欧美日韩最好看的视频| 国产精品日本一区二区三区在线| 久久人91精品久久久久久不卡| 九色在线免费| 日韩欧美成人一区二区| 青青草免费观看视频| 1024精品合集| 亚洲第九十七页| 精品制服美女丁香| 91九色在线观看视频| 香蕉综合视频| 免费av一区二区三区| 国产精品视频一区二区三区| 日韩免费观看在线观看| 日本三级在线观看网站| 色777狠狠综合秋免鲁丝| 污视频软件在线观看| 欧美日韩国产大片| 亚洲欧美综合自拍| 亚洲一区二区三区四区五区黄| 精品人妻无码一区| 成人黄页毛片网站| 亚洲三级在线观看视频| 久久国产福利| 9久久9毛片又大又硬又粗| 91综合在线| 日韩免费中文专区| 欧美重口另类| 国产成人女人毛片视频在线| 久久亚洲精品人成综合网| 国产91ⅴ在线精品免费观看| 午夜羞羞小视频在线观看| 视频在线观看一区二区| 韩国免费在线视频| 精品一区二区三区四区| 污污视频在线免费看| 日韩欧美一区二区视频| 在线中文字幕网站| 在线观看日韩电影| 久久精品人妻一区二区三区| 亚洲靠逼com| 91香蕉视频污在线观看| 国产女同互慰高潮91漫画| 久久福利小视频| 国产.欧美.日韩| 欧美性猛交乱大交| 国产精品综合网| 免费黄频在线观看| 黄色日韩网站视频| 思思久久精品视频| 麻豆精品久久久| 欧美日韩一区二区三区69堂| 秋霞电影一区二区| 手机看片福利日韩| 蜜臀av一区二区在线免费观看| 日本成人在线免费视频| 久久综合中文| 日韩肉感妇bbwbbwbbw| 日韩影院免费视频| 日本888xxxx| 美腿丝袜亚洲综合| 第一区免费在线观看| 韩国三级在线一区| 亚洲AV无码久久精品国产一区| 国产麻豆9l精品三级站| 绯色av蜜臀vs少妇| 成人av网站在线观看| 久久久国产精品无码| 99九九99九九九视频精品| 水蜜桃av无码| www日韩大片| 精品无码国产污污污免费网站| 国产日韩欧美一区二区三区综合| xxxx日本黄色| 亚洲欧美一区二区三区国产精品| 久久久久久久久久久97| 亚洲va欧美va人人爽午夜| 精品欧美一区二区三区免费观看| 色综合一个色综合亚洲| 免费黄色片视频| 91精品国产福利在线观看| www.我爱av| 亚洲黄色在线看| 国产高清视频免费最新在线| 久久精品国产欧美激情| 福利在线导航136| 欧美做受高潮1| 国产精品3区| 国产精品久久久久久免费观看| 日韩激情毛片| 亚洲欧美日韩精品久久久 | 久久网福利资源网站| 日本精品600av| 欧美在线观看网站| 欧美天堂一区| 波多野结衣久草一区| 亚洲三级性片| 中文字幕日韩一区二区三区| 国内精品久久久久久久97牛牛 | 中文字幕亚洲欧美日韩高清 | 日韩av免费大片| 国产免费裸体视频| 视频一区视频二区中文字幕| 亚洲综合婷婷久久| 成人精品视频.| 波多野结衣家庭教师在线观看| 亚洲激情图片小说视频| 国产第一页在线观看| 欧美一级二级在线观看| 蝌蚪视频在线播放| 欧美激情亚洲自拍| 日韩护士脚交太爽了| 麻豆精品传媒视频| 狠狠爱综合网| 亚洲视频一二三四| 91麻豆蜜桃一区二区三区| 91高清免费看| 在线欧美一区二区| 免费成人在线看| 久久精品国产欧美激情| 欧美电影免费看| 国产有色视频色综合| 国产大片一区| 国产精品亚洲二区在线观看| 国产精品亚洲人在线观看| 国产黄色大片免费看| 动漫精品一区二区| 亚洲精品一区二区三区新线路| 最近2019中文字幕大全第二页| 都市激情国产精品| 超碰在线观看97| 国产二区精品| 久久人人爽av| 欧美国产禁国产网站cc| 久久久久久不卡| 亚洲激情国产精品| 国产盗摄一区二区| 91精品黄色| 四虎8848精品成人免费网站| 国产精品亚洲a| www.亚洲在线| 精品视频久久久久| 欧美成人一区二区| 九义人在线观看完整免费版电视剧| 国产精品啪视频| 成人看的视频| 婷婷免费在线观看| 中文字幕成人av| 一区精品在线观看| 中文字幕欧美精品日韩中文字幕| 日韩网站中文字幕| 欧美一级日本a级v片| 玖玖精品视频| 亚洲性猛交xxxx乱大交| 在线影视一区二区三区| 国产中文字幕在线视频| 国产97色在线|日韩| 国产亚洲欧美日韩在线观看一区二区 | 天堂成人免费av电影一区| 亚洲一级中文字幕| 色成年激情久久综合| av免费在线一区二区三区| 国产精品欧美日韩一区二区| 日韩在线观看电影完整版高清免费悬疑悬疑 | 国产美女免费无遮挡| 色婷婷精品大在线视频| 国产精品久久久久一区二区国产| 国产精品成人播放| 99热国内精品| 美女网站视频在线观看| 欧美日韩国产精品一区| 国产九九在线| 成人免费网站在线| 欧美激情第10页| 国模私拍在线观看| 色狠狠桃花综合| 免费黄网在线观看| 福利精品视频| 久久精品官网| 一起操在线播放| 精品粉嫩aⅴ一区二区三区四区| 午夜av不卡| 天堂资源在线亚洲资源| 黄色日韩网站视频| 国产做受高潮漫动| 自拍偷拍亚洲精品| 9l亚洲国产成人精品一区二三| 免费无码国产v片在线观看| 欧美—级在线免费片| 国产黄色av网站| 日本乱人伦a精品| 久久久久久久久久久9不雅视频| 国模无码视频一区| 欧美午夜精品久久久| 色呦呦视频在线观看| 欧美一区二区三区四区在线观看地址 | 国产极品久久久| 国产成人精品在线| 国产精品av久久久久久麻豆网| 三级网站在线免费观看| 欧美日本韩国一区二区三区视频| 123区在线| 制服诱惑一区| 久久嫩草精品久久久精品| 国产女人18毛片18精品| 奇米4444一区二区三区| 自拍偷拍欧美专区| av电影在线不卡| 精品国产麻豆免费人成网站| 精品久久福利| 无码人妻精品一区二区三区在线| 亚洲精品视频在线看|