精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

第一個100%開源的MoE大模型,7B的參數,1B的推理成本

人工智能 新聞
訓練代碼、中間 checkpoint、訓練日志和訓練數據都已經開源。

盡管大語言模型 (LM) 在各種任務上取得了重大進展,但在訓練和推理方面,性能和成本之間仍然需要權衡。

對于許多學者和開發人員來說,高性能的 LM 是無法訪問的,因為它們的構建和部署成本過高。改善成本 - 性能的一種方法是使用稀疏激活混合專家 (MoE)。MoE 在每一層都有幾個專家,每次只激活其中的一個子集(參見圖 2)。這使得 MoE 比具有相似參數量的密集模型更有效,因為密集模型為每個輸入激活所有參數。

圖片

出于這個原因,行業前沿模型包括 Gemini-1.5、 GPT-4 等在內的模型都使用了 MoE。

然而,大多數 MoE 模型都是閉源的,雖然有些模型公開發布了模型權重,但有關訓練數據、代碼等的信息卻很有限,甚至有些研究沒有提供這些信息。由于缺乏開放資源和對研究細節的深入探索,在 MoE 領域無法構建具有成本效益的開源模型,從而接近閉源前沿模型的能力。

為了解決這些問題,來自艾倫人工智能研究院、 Contextual AI 等機構的研究者引入了  OLMoE ,這是一個完全開源的混合專家語言模型,在類似大小的模型中具有 SOTA 性能。

圖片

  • 論文地址:https://arxiv.org/pdf/2409.02060
  • 論文標題:OLMoE: Open Mixture-of-Experts Language Models

特別的,該研究使用 5.1 萬億個 token 預訓練了 OLMoE-1B-7B 模型,該模型總共擁有 69 億參數,其中每個輸入 token 只激活 13 億參數。 

結果是與使用具有約 1B 參數的密集模型(例如 OLMo 1B 或 TinyLlama 1B )實現了類似的推理成本,只是需要更多的 GPU 內存來存儲約 7B 的總參數。實驗表明,MoE 的訓練速度比具有等效激活參數的密集 LM 快 2 倍左右。

如圖 1 所示,OLMoE-1B-7B 顯著優于所有開源 1B 模型,并且與推理成本和內存存儲明顯更高的密集模型相比表現出了競爭力。

圖片

通過指令和偏好調優,該研究還創建了 OLMoE-1B-7B-INSTRUCT,它在常見基準 MMLU、GSM8k、HumanEval 等上超越了各種更大的指令模型,包括 Llama2-13B-Chat 、OLMo-7B-Instruct (0724) 和 DeepSeekMoE-16B。

受控實驗強調了 MoE(見表 1)和一般 LM 的關鍵設計選擇。結果表明使 MoE 性能卓越的一個關鍵設計決策是使用細粒度路由和粒度專家(granular experts):在每一層使用 64 個小專家,其中 8 個被激活。

此外,路由算法的選擇也很重要:該研究發現無丟棄(dropless)基于 token 的路由優于基于專家的路由。最后,該研究分析了 OLMoE-1B-7B 中的路由行為,發現路由在預訓練的早期就飽和了,專家很少被共同激活,并且專家表現出領域和詞匯的專業化。

圖片

最后,作者希望這個完全開源的 MoE 能夠促進更多研究和分析,從而提高對這些模型的理解。訓練代碼、中間檢查點(每 5000 step )、訓練日志和訓練數據都已經開源。

論文作者 Niklas Muennighoff 表示:OLMoE 是第一個 100% 開源的混合專家 LLM。

圖片

預訓練與自適應

預訓練架構

OLMoE 是由 N_L 個 transformer 層組成的語言模型,僅包含解碼器。對于 OLMo 這樣的密集模型,原本模型中單一的前饋網絡被 N_E 個小型前饋網絡(專家)組成的混合專家網絡所替代,對于每個輸入 token x,只有 k 個專家會被選中并被激活,負責處理這個輸入。

圖片

其中,路由器(r)是一個經過訓練的線性層,將輸入的原始數據映射到被選中的 k 個專家上。對路由器的輸出應用 softmax 函數,計算 N_E 個專家的路由概率。然后,每個被指定的專家 E_i 處理輸入 x,其輸出乘以其各自的路由概率。再將所有選定的圖片專家的結果相加,構成模型單個層的 MoE 模塊輸出。

MoE 模型的訓練往往涉及對一個已經存在的大型密集模型轉換成一個稀疏模型,也就是所謂的「稀疏升級」。這個過程中,需要改變模型的訓練目標,比如調整 auxiliary load balancing 以及路由器的損失函數。具體的方法如下表所示:

圖片

在這項研究中,論文作者使用了總計 69 億參數中的 13 億活躍參數,每層有 64 個專家,其中有 8 個被激活。他們使用了一種名為「無丟棄 token」的路由方法:對于每個輸入 token,路由器網絡將分配 8 個專家來處理它。

論文作者引入了兩個輔助損失函數:負載平衡損失(圖片)和路由器 z 損失(圖片),來訓練 OLMoE-1B-7B。他們給這兩個損失函數分別設定了權重(α 和 β),然后把它們和模型的主要學習目標(交叉熵損失圖片結合起來,最終計算的損失函數為:

圖片

預訓練數據

訓練數據方面,論文作者使用了來自兩個不同來源的數據集:DCLM 和 Dolma 1.7。這些數據集包括了多種類型的數據,比如網絡爬取的數據、編程問題解答、數學問題解答和學術論文等。他們將這些數據混合起來,創建了一個名為 OLMOE-MIX 的新數據集。

下表中展示了預訓練數據的組成:

圖片

對于數據的處理,論文作者使用了過濾器去除了包含太多重復 token 的內容、GitHub 上星標少于 2 的項目以及某些詞出現頻率過高的文檔。他們將在每輪訓練開始前隨機混洗數據,總計超過 5 萬億個 token。在「退火」階段(最后 100B 個 token),他們首先重新混洗整個數據集,然后按照此前 OLMo 論文中的方法,將學習率線性衰減到 0。

自適應

論文作者從指令調優和偏好調優兩方面,基于之前的開放模型,構造了 OLMoE-1B-7B-INSTRUCT。在指令調優集中,他們增加了更多的代碼和數學數據,以提高模型在這些領域的性能。

GPT-4 和 Llama 3 在預訓練階段使用了像 GSM8k 或 MATH 這樣的數學數據集的樣本。按照這個思路,論文作者還添加了「No Robots」和「Daring Anteater」的一個子集。這些數據集不僅質量高還更多樣,這是拓展模型適應性的兩個關鍵因素。

下表展示了 OLMoE-1B-7B-INSTRUCT 所使用的數據:

圖片

實驗

該研究的評估程序由三部分組成:預訓練期間、預訓練之后和自適應之后。

預訓練期間:如圖 3 所示,該研究在預訓練期間使用當前最佳 OLMo 模型在常用下游任務上對 OLMoE-1B-7B 的性能進行了基準測試。

圖片

研究團隊發現,在所有任務中,OLMoE-1B-7B 比密集 OLMo 模型以更少的計算量 (FLOP) 獲得了更好的性能。盡管 OLMoE-1B-7B 使用了不到一半的 FLOP 進行訓練并且僅使用 1B 個激活參數,但 OLMoE-1B-7B 在訓練結束時可與 OLMo-7B 媲美,甚至優于 OLMo-7B。

預訓練之后:在表 4 中,該研究在常見的下游任務上對 OLMoE-1B-7B 進行基準測試。

研究發現 OLMoE-1B-7B 在使用少于 2B 個激活參數的模型中表現最好,使其成為許多 LM 用例中最經濟的選擇。

如果預算較大,Qwen1.5-3B-14B 具有更強的性能,但其激活參數和總參數比 OLMoE-1B-7B 多一倍以上。

研究發現,盡管每條前向傳播所需的計算量減少了約 6-7 倍,但 OLMoE-1B-7B 的性能優于一些具有 7B 參數的密集 LM,例如 Llama2-7B ,但不如其他 LM,例如 Llama3.1-8B 。上圖 1 比較了 OLMoE-1B-7B 和其他 LM 的 MMLU 性能和激活參數,表明 OLMoE-1B-7B 是其成本范圍內最先進的。

自適應之后:在表 5 中,該研究對 OLMoE-1B-7B 的指令 (SFT) 和偏好 (DPO) 調優進行了基準測試。SFT 在所有測量任務上都改進了本文的模型。

DPO 在大多數任務上都有幫助,尤其是 AlpacaEval,這與先前研究的結果一致。DPO 模型(稱之為 OLMoE-1B-7B-INSTRUCT)在所有基準測試模型中具有最高平均值。

圖片

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-06-03 10:43:34

2024-02-01 12:43:16

模型數據

2024-02-04 08:00:00

Zephyr 7B大語言模型算法

2025-08-01 14:32:35

AI模型訓練

2025-09-05 13:53:51

AI開源模型

2025-03-27 10:28:32

2024-06-11 14:30:18

2025-02-12 09:20:12

2025-09-15 08:52:00

AI模型開源

2024-03-18 07:01:42

2024-02-22 10:09:00

開源模型

2024-04-03 12:32:00

數據訓練

2024-04-02 09:17:50

AI數據開源

2025-03-10 08:30:00

AI模型訓練

2024-03-25 08:00:00

2025-04-11 09:10:00

模型開源AI

2024-08-13 15:40:00

2025-11-17 09:15:37

點贊
收藏

51CTO技術棧公眾號

男生女生差差差的视频在线观看| 日本少妇aaa| 欧美一级大黄| 1024亚洲合集| 国产一区二区久久久| 国产精品久久久久久人| 久久久久久久久久久久久久久久久久| 日韩亚洲欧美成人一区| 色综合久久久久无码专区| 91社区在线| 不卡一二三区首页| 国产中文字幕日韩| 亚洲欧美综合自拍| 国产一区久久| 色哟哟网站入口亚洲精品| 高清中文字幕mv的电影| 欧美色片在线观看| 激情久久av一区av二区av三区| 午夜久久资源| 婷婷av一区二区三区| 国模少妇一区二区三区| 欧美在线免费视频| 久久久久97国产| 日韩一区电影| 亚洲人精选亚洲人成在线| 亚洲午夜精品在线观看| 欧美高清免费| 色一情一伦一子一伦一区| www.在线观看av| 在线a人片免费观看视频| 2020日本不卡一区二区视频| 高清国语自产拍免费一区二区三区| 又骚又黄的视频| 久久久蜜桃一区二区人| 韩国日本不卡在线| 国产一级性生活| 欧美日韩国产高清| 久久精视频免费在线久久完整在线看| 精品无人区无码乱码毛片国产| 久久动漫网址| 精品国产伦一区二区三区观看体验 | 韩国精品久久久999| 国产精品老熟女一区二区| 国产精品毛片久久| 俺也去精品视频在线观看| 老头老太做爰xxx视频| 色狼人综合干| 精品国产一区二区三区忘忧草| 911av视频| av日韩一区| 56国语精品自产拍在线观看| 蜜臀一区二区三区精品免费视频 | 日韩欧美精品网站| 大j8黑人w巨大888a片| a天堂资源在线| 亚洲成人av电影| 国产免费观看高清视频| 一区二区电影免费观看| 色又黄又爽网站www久久| 国产亚洲天堂网| 成人美女视频| 欧美性受xxxx黑人xyx性爽| 男人插女人下面免费视频| 91大神在线观看线路一区| 欧美日韩综合一区| 老司机午夜性大片| 欧美2区3区4区| 欧美精品一区二区三区久久久| 911亚洲精选| 啪啪激情综合网| 亚洲性av在线| 暗呦丨小u女国产精品| 一级毛片免费高清中文字幕久久网| 久久国产加勒比精品无码| 麻豆一区二区三区精品视频| 亚洲久久一区二区| 国产精品国产三级国产aⅴ浪潮 | 日韩免费在线电影| 日韩一区二区电影在线| 中文字幕第3页| 国产精品一区二区av日韩在线| 中文字幕日韩在线观看| 欧美成人一二三区| 亚洲综合精品四区| 成人国产亚洲精品a区天堂华泰| www久久久com| 久久精品日产第一区二区三区高清版| 亚洲欧洲精品一区| 91破解版在线观看| 欧美三级蜜桃2在线观看| 美女日批在线观看| 精品一区二区三区在线| 精品视频9999| 波多野结衣电影在线播放| 国产成人综合在线| 日本高清视频一区二区三区| 影音先锋在线播放| 色先锋久久av资源部| 国产又粗又猛大又黄又爽| 五月综合久久| 欧美大胆a视频| 国产精品一区无码| 精品亚洲免费视频| 久久影院理伦片| 污视频免费在线观看| 色www精品视频在线观看| 久久久久无码精品| 不卡一区综合视频| 久久青草精品视频免费观看| 一级特黄录像免费看| 91在线免费播放| 最新av网址在线观看| 三上悠亚亚洲一区| 亚洲第一页自拍| 91九色丨porny丨极品女神| 日韩专区中文字幕一区二区| 国产精品日韩高清| 哥也色在线视频| 在线亚洲免费视频| 伊人网综合视频| 一区二区三区毛片免费| 国产精品久久久久久av福利软件| 天堂av手机版| 一区二区三区四区av| 奇米影视四色在线| 免费视频一区三区| 88国产精品欧美一区二区三区| 国产乱码一区二区| 国产精品短视频| 北条麻妃av高潮尖叫在线观看| aiss精品大尺度系列| 欧美成人免费全部| 91精品国产综合久| 国产精品久久久久一区| 国产精品久久久久9999小说| 日韩欧美天堂| 97精品在线视频| 少妇高潮一区二区三区99小说 | 五月天综合激情网| 国产91精品露脸国语对白| 波多野结衣激情| 日韩精品一级毛片在线播放| 亚洲精品一区中文| 久久精品国产亚洲av麻豆色欲 | 无码人妻精品一区二区三区99不卡| 91高清一区| 7777精品伊久久久大香线蕉语言 | 亚洲欧洲日韩综合一区二区| 奇米影音第四色| 欧美一级精品| 国产欧美一区二区三区久久 | 天海翼精品一区二区三区| 97av在线播放| 婷婷伊人综合中文字幕| 欧美日韩国产影院| 精品人妻互换一区二区三区| 久久综合亚州| 亚洲人成人77777线观看| 国产成人精品一区二区三区视频| 夜夜嗨av色一区二区不卡| 伊人免费在线观看| 亚洲欧美在线视频| 亚洲女人在线观看| 国内精品久久久久久久影视麻豆 | 少妇又色又爽又黄的视频| 疯狂蹂躏欧美一区二区精品| 麻豆av免费观看| 六月婷婷色综合| 400部精品国偷自产在线观看| 一区二区三区国产好| 2019国产精品自在线拍国产不卡| 欧美777四色影视在线| 精品1区2区3区| 久草视频中文在线| 久久婷婷久久一区二区三区| 色悠悠久久综合网| 欧美精品99| 明星裸体视频一区二区| 日韩成人在线电影| 国模极品一区二区三区| 精品999视频| 91精品国产综合久久香蕉的特点| 国产一级性生活| 国产日本亚洲高清| 免费人成视频在线播放| 性伦欧美刺激片在线观看| 中国成人在线视频| 红杏视频成人| 国产精品久久久久久久天堂| www在线视频| 亚洲欧美另类自拍| 99久久精品国产一区色| 欧美特级www| 亚洲天堂网av在线| 久久一夜天堂av一区二区三区| 红桃视频 国产| 亚洲综合欧美| japanese在线播放| 红桃视频在线观看一区二区| av一区二区三区免费| 91福利精品在线观看| 欧美极品美女电影一区| 99精品老司机免费视频| 日韩国产高清污视频在线观看| 国产美女明星三级做爰| 色综合久久综合网欧美综合网| 欧美亚洲日本在线| 欧美国产日韩精品免费观看| 91丝袜在线观看| 国产自产视频一区二区三区| www.99在线| 国产精品亚洲综合久久| 久久亚洲国产成人精品无码区| 日韩.com| 日韩欧美视频一区二区| 好吊妞国产欧美日韩免费观看网站| 国产日韩换脸av一区在线观看| 在线天堂资源www在线污| 九九九热精品免费视频观看网站| 成年人在线看| 亚洲女成人图区| 午夜一区在线观看| 精品日本一线二线三线不卡| 国产精品人人爽| 欧美日韩国产另类不卡| 国产99久久久久久免费看| 岛国精品视频在线播放| 国产无套粉嫩白浆内谢| 一区二区三区四区不卡在线| 最新一区二区三区| 亚洲欧洲精品天堂一级| 欧美色图17p| 中文字幕不卡一区| 欧美性受xxxx黑人| 欧美国产欧美综合| 在线看片中文字幕| 国产欧美一区二区在线| 亚洲熟妇一区二区三区| 久久综合狠狠综合久久综合88 | 精品久久久久久久| 日韩精品久久久毛片一区二区| 少妇久久久久| 欧美精品一区二区三区久久| 国产不卡一区| 日韩aⅴ视频一区二区三区| 国产成人精品一区二区免费看京| 你懂的视频在线一区二区| 免费看av成人| 日本一区免费观看| 俺要去色综合狠狠| 亚洲欧美日产图| 国产精品99一区二区三| 看全色黄大色大片| 黄色一区二区三区四区| 婷婷五月综合缴情在线视频| 国产深夜精品| 人妻有码中文字幕| 男女男精品视频网| 性久久久久久久久久久久久久| 国产乱妇无码大片在线观看| 性欧美18—19sex性高清| 99久久99精品久久久久久| 天天躁日日躁aaaxxⅹ | 亚洲国产精品成人无久久精品| 亚洲大型综合色站| 精品国产一区二区三区四| 在线观看三级视频欧美| 国产一区二区在线视频聊天| 精品久久久久久无| 欧美一区二区三区少妇| 中文字幕日韩欧美精品在线观看| 中文字幕中文字幕在线中高清免费版 | 在线观看日本黄色| 亚洲综合精品久久| 69视频免费在线观看| 欧美日韩国产另类不卡| 亚洲奶汁xxxx哺乳期| 亚洲深夜福利在线| 超碰caoporn久久| 欧美亚洲国产视频| 日韩有码欧美| 久久久久久久久久久久久久一区 | 黄色一级片播放| 麻豆高清免费国产一区| 东京热av一区| 国产精品欧美一级免费| 国产真人真事毛片| 91久久精品午夜一区二区| 精品国产九九九| 亚洲欧美国产高清va在线播| a视频在线免费看| 热99久久精品| 日韩中文字幕无砖| 天堂一区二区三区| 国一区二区在线观看| 亚洲少妇久久久| 99精品视频中文字幕| 中日韩一级黄色片| 欧美性xxxxx| 亚洲国产精品久久人人爱潘金莲 | 日韩在线一卡二卡| 日韩欧美在线一区| 性一交一乱一伧老太| 中文字幕精品在线视频| 澳门成人av网| 国产不卡一区二区三区在线观看 | 久久综合九色综合88i| 久久99国产精品免费网站| 中文字幕一区二区三区人妻不卡| 亚洲日本一区二区三区| 国产免费a视频| 亚洲国产欧美一区| 日本三级在线观看网站| 国产精品日韩欧美大师| 日韩av三区| av动漫在线播放| 精品一区二区三区免费毛片爱| av鲁丝一区鲁丝二区鲁丝三区| 亚洲精品菠萝久久久久久久| 7777久久亚洲中文字幕| 国产亚洲一级高清| 亚洲欧美小说色综合小说一区| 波多野结衣一区二区三区在线观看| 色婷婷综合网| 在线观看免费成人av| 久久久久青草大香线综合精品| 日韩精品在线不卡| 精品欧美黑人一区二区三区| 99自拍视频在线观看| 国产欧美精品久久久| 成人羞羞在线观看网站| 国内外免费激情视频| 久久只精品国产| 亚洲乱码国产乱码精品| 亚洲精品综合久久中文字幕| 白浆在线视频| 久久久99爱| 亚洲欧美清纯在线制服| 在线免费观看污视频| 亚洲v中文字幕| 亚洲av成人精品日韩在线播放| 久久久亚洲国产| 日韩大胆成人| 欧美 日韩 国产一区| 久久精品一区二区三区不卡牛牛 | 日韩区在线观看| 污污网站在线看| 国产日韩亚洲精品| 日韩午夜在线电影| 瑟瑟视频在线观看| 在线免费观看日韩欧美| 五十路六十路七十路熟婆| 麻豆传媒在线完整视频| 中文字幕国产一区| 日本日本19xxxⅹhd乱影响| 久久免费影院| 成人精品久久av网站| 亚洲视频电影在线| wwwxxxx在线观看| 午夜欧美在线一二页| 蜜臀久久精品久久久久| 久久免费视频观看| 免费一区二区三区视频导航| 亚洲一区在线不卡| 亚洲欧洲制服丝袜| 蜜桃久久一区二区三区| 欧美一级片一区| 中文精品一区二区| 亚洲男人天堂av在线| 亚洲激情六月丁香| 视频一区二区三区在线看免费看 | 黄色一级片在线| 亚洲第一页在线| 视频精品导航| 成年在线观看视频| 久久伊99综合婷婷久久伊| 在线不卡免费视频| 久久久久久中文| av在线不卡顿| 精品人妻一区二区三| 欧美日韩亚洲天堂| 成人看片免费| 久久这里精品国产99丫e6| 久久国产精品一区二区| 久久久久久久国产精品毛片| 亚洲欧洲美洲在线综合| 本网站久久精品| 麻豆tv在线播放| 国产精品久久午夜| 少妇喷水在线观看| 日韩欧美一区在线| 91香蕉视频免费看| 欧美激情在线精品一区二区三区| 国产成人亚洲综合91精品| 韩国三级在线观看久| 亚洲精品久久久久久久久久久久久 | 成功精品影院| 久久婷五月综合| 亚洲综合久久av| 69久久久久|