精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

小紅書hi lab首次開源文本大模型,14個checkpoint覆蓋Pretrain與Instruct階段

人工智能 開源
dots.llm1 是一個大規模的 Mixture of Experts (MoE)語言模型,在總共 1420 億參數中激活 140 億參數,借助精心設計且高效的數據處理流程,dots.llm1 在訓練 11.2T token 高質量數據后,達到了可與 Qwen2.5-72B 相媲美的性能。為促進大模型社區的研究工作,hi lab團隊開源了Pretrain階段每經過1T token的中間訓練檢查點

01、簡介

小紅書hi lab(Humane Intelligence Lab,人文智能實驗室)團隊首次開源文本大模型 dots.llm1。 dots.llm1是一個中等規模的Mixture of Experts (MoE)文本大模型,在較小激活量下取得了不錯的效果。該模型充分融合了團隊在數據處理和模型訓練效率方面的技術積累,并借鑒了社區關于 MoE 的最新開源成果。hi lab團隊開源了所有模型和必要的訓練信息,包括Instruct模型、長文base模型、退火階段前后的多個base模型及超參數等內容,希望能對大模型社區有所貢獻。

模型地址:

https://huggingface.co/rednote-hilab

https://github.com/rednote-hilab/dots.llm1

先來了解下dots.llm1的基本情況:

  • 模型參數:總參數量142B、激活參數14B
  • MoE配置:6in128 Expert、2個共享Expert
  • 預訓練數據:11.2T token高質量數據,顯著優于開源數據
  • 訓練效率:基于Interleaved 1F1B 流水并行的AlltoAll overlap和高效Grouped GEMM的MoE訓練框架

再來看下dots.llm1的模型效果,dots.llm1在預訓練階段一共使用了11.2T 高質量token,然后經過兩階段sft訓練,得到dots.llm1 base模型和instruct模型,在綜合指標上打平Qwen2.5 72B模型,具體指標對照情況如下:

關于dots.llm1開源,hi lab團隊做到了迄今為止行業最大力度:

  • 開源dots.llm1.inst模型,做到開箱即用
  • 開源一系列pretrain base模型,包括預訓練過程中每經過1T tokens后所保存的checkpoint——是目前開源中間checkpoint模型中,首個參數超過千億的大模型
  • 退火兩階段訓練對應的模型checkpoint
  • 長文base模型
  • 詳細介紹了lr schedule和batch size等信息,便于大家做Continue Pretraining和Supervised Fine-tuning

基于Interleave1F1B流水并行的AlltoAll overlap優化已經提交至NVIDIA Megatron-LM社區,會在未來一段時間正式發版。

02、dots.llm1訓練過程

2.1 預訓練數據

數據是文本大模型訓練的核心燃料,dots.llm1所用預數據主要來自Common Crawl和自有Spider抓取得到的web數據。hi lab團隊秉承寧缺毋濫的原則,精心設計了數據處理流程,在保證數據安全、準確以及豐富多樣的基礎上,確保預訓練數據的人工評測和對照實驗結果顯著優于開源數據,也幫助dots.llm1在僅訓練11.2T token的前提下,綜合指標打平Qwen2.5 72B模型,大大減少了算力消耗。

dots.llm1的數據處理流程分為以下三部分:

  • web 文檔準備

對于web HTML數據,先用URL過濾方式刪除黃賭毒等內容,再利用團隊優化后的trafilatura軟件包,提取HTML正文內容,最后進行語種過濾和MD5去重,得到web document。

  • 規則處理

參考RefinedWeb和Gopher的方案進行數據清洗和過濾操作,再采用minhash方法進行document間的去重;為處理document首尾噪聲文本,dots.llm1特別引入了document內的行級別去重策略,具體來說:首先提取每個document的前五行和后5行句子,然后按行計算在整個語料中的出現頻次,僅保留前200次出現的行句子,刪除多余的行句子,經過人工檢查,這些重復次數較多的行句子大都是廣告、導航欄等噪聲文本。

  • 模型處理

基于模型的數據處理由網頁類型模型、語料質量模型、行噪聲刪除模型、語義去重和類別均衡模型等組成。其中語料質量模型和語義去重模型采用行業通用實現方案;網頁類型模型會對web數據的站點屬性進行分類,保留以文本核心的數據,刪除音頻、視頻等非文本網頁以及地圖、公交查詢等工具類網頁文本;行噪聲刪除模型是在行級別去重策略基礎上,通過生成式模型判別的方法,繼續對行級別的長尾噪聲進行document內刪除處理;dots.llm1采用一個包含200個類別的web數據分類模型進行數據均衡和配比,提高知識類內容的比例,降低虛構內容(比如玄幻小說)、結構化內容(比如電商)的數據比例。

為了保障數據安全,hi lab團隊過濾掉包含不安全內容、個人隱私信息(PII)及被安全分類器判定為有害的站點和數據。經過上述處理流程,hi lab團隊得到一份高質量的預訓練數據,并經過人工校驗和實驗驗證,證明該數據質量顯著優于開源Txt360數據。

2.2 訓練效率

在MoE模型訓練中,EP rank之間的A2A通信在端到端時間中占據了相當大比重,對訓練效率影響很大,特別是對于 Fine-grained MoE Model,EP Size 會比較大,跨機通信基本無法避免。hi lab團隊通過讓EP A2A通信盡可能和計算overlap,用計算來掩蓋通信的時間,進而提升訓練效率。具體來說,團隊采用interleaved 1F1B with A2A overlap 方案,通過將穩態的1F1B stage 中第一個micro batch 的fprop提前到warmup stage,即 warmup step + 1,就可以在 interleaved 1F1B實現1F1B穩態階段不同 micro batch 前反向之間的 EP A2A 與計算的overlap。如下圖所示。

同時,hi lab團隊還優化了Grouped GEMM的實現,具體來說,將 M_i(專家i的token段)對齊到一個固定的塊大小。這個固定的塊大小必須是異步warpgroup 級別矩陣乘加(WGMMA,即 wgmma.mma async)指令中 tile 形狀修飾符 mMnNkK 的 M 的整數倍。因此,單個 threadblock 中的所有 warpgroups 都采用統一的tiling,且由該 threadblock 處理的整個 token 段(Mi)必定屬于同一位專家,這使得調度過程與普通 GEMM 操作非常相似。與 NVIDIA Transformer Engine中的 Grouped GEMM API 相比,hi lab團隊的實現方案展現出了顯著優勢。下表展示了在 H800 上前向和反向計算的性能對比,其中 token 被平均路由到各個專家。hi lab提出的方案在前向計算中平均提升了 14.00%,在反向計算中平均提升了 6.68%。

訓練效率部分內容與NVIDIA中國研發團隊合作完成

2.3 MoE模型設計與訓練

dots.llm1是基于Decoder-only Transformer的MoE模型,在架構方面主要參考DeepSeek系列來設計實現,具體參數如下:

dots.llm1采用WSD學習率調度方式,在學習率穩定階段保持3e-4訓練10T token語料,在此期間先后兩次增加batch size,從64M增大至128M,整個訓練過程非常穩定,沒有出現需要回滾的loss spike。在學習率退火階段,分兩個stage訓練1.2T token語料,其中stage1期間模型學習率由3e-4退火降至3e-5,數據方面強化推理和知識類型語料,共訓練1T token,stage2期間模型學習率由3e-5退火降至1e-5,數據方面提升math和code語料占比,共訓練200B token。

2.4 Post-train

在高質量預訓練完成后,dots.llm1通過兩階段監督微調進一步釋放模型潛力。hi lab 團隊精心篩選了約 40 萬條涵蓋多輪對話、知識問答、復雜指令遵循、數學與代碼推理的高質量指令數據。針對多輪對話場景,hi lab 團隊將社區開源的中英對話數據與內部標注的高質量中文指令融合,并采用教師模型優化低質量回答;為了提升知識問答能力,hi lab 團隊引入了包含事實性知識與閱讀理解的數據集;為了使模型更好地遵循復雜指令,hi lab 團隊設計了伴隨條件約束的指令數據,并過濾不遵循約束的回復;而在數學與代碼領域,微調數據則經過規則驗證器與測試樣例驗證,獲取更高質量的監督信號。

微調過程分為兩個階段:首先對全量數據進行2輪基礎訓練,通過過采樣、動態學習率調整、多輪對話拼接等技術,初步釋放模型潛力;隨后聚焦數學與代碼等特別領域,引入拒絕采樣微調(RFT),結合驗證器篩選高置信度重要樣本,進一步提升模型的推理性能。

最終評測顯示,dots.llm1.inst在僅激活 14B 參數的情況下,在中英文通用場景、數學、代碼、對齊任務上的表現亮眼,與Qwen2.5-32B-Instruct、Qwen2.5-72B-Instruct相比具備較強的競爭力;同時與Qwen3-32b相比,在中英文、數學、對齊任務上展現相似或先進性能。

03、總結

dots.llm1是小紅書首次嘗試開源的文本大模型,是一個可供大模型社區使用的中等參數規模下性能較優的MoE模型。期待大家能在dots.llm1基礎上開展各項研究和任務訓練,包括持續訓練(Continue Pretraining)、退火訓練、長文訓練、有監督微調(Supervised Fine-tuning)等;對hi lab團隊來說,dots.llm1只是一個開始,還有很大進步空間,同時希望更多優秀的大模型研究人員能加入小紅書hi lab團隊,與我們共同打造更多更強的全模態大模型!

04、團隊簡介

小紅書 hi lab 團隊(人文智能實驗室,Humane Intelligence Lab)致力于突破人工智能的邊界,通過發展人際智能、空間智能、音樂智能等多元智能形態,不斷拓展人機交互的可能性,愿景是“讓AI成為人類貼心和有益的伙伴”。

責任編輯:龐桂玉 來源: 小紅書技術REDtech
相關推薦

2025-08-07 02:00:00

2025-06-10 05:00:00

2025-08-01 03:00:00

2025-06-25 09:53:59

2025-06-11 14:44:48

AI文本大模型

2024-01-19 12:51:00

AI數據

2025-08-07 16:24:19

小紅書開源dots.vlm1

2025-06-09 09:41:25

2024-10-12 10:57:39

2024-12-05 15:22:19

2025-01-20 15:50:00

AI軟件模型

2025-03-28 09:46:05

AI算法AI人工智能

2024-01-16 12:10:33

模型數據

2025-02-10 08:30:00

2025-08-01 09:03:16

2024-01-12 21:18:22

負樣本大模型蒸餾

2025-11-20 08:35:59

2025-11-18 10:00:56

2024-10-25 14:30:00

模型AI
點贊
收藏

51CTO技術棧公眾號

亚洲欧美日产图| 秋霞av国产精品一区| 少妇愉情理伦片bd| 国产三级伦理在线| 91在线精品秘密一区二区| 午夜伦理精品一区| japanese中文字幕| 日韩精品成人| 一本久久综合亚洲鲁鲁五月天| 色播五月综合| 精品国产免费无码久久久| 日韩午夜高潮| 久久精品成人动漫| 亚洲黄色在线网站| 精品午夜av| 一本色道**综合亚洲精品蜜桃冫| 熟女视频一区二区三区| 香蕉人妻av久久久久天天| 捆绑变态av一区二区三区| 韩国精品美女www爽爽爽视频| 欧美激情久久久久久久| 国产无遮挡裸体免费久久| 欧美色图片你懂的| 天堂成人国产精品一区| 日韩av在线一区二区| 一级做a免费视频| 美女福利一区二区| 亚洲一区二区三区四区在线免费观看 | 在线亚洲观看| 久久精品国产99国产精品澳门| 亚洲欧美色图视频| 97品白浆高清久久久久久| 欧美日韩综合在线| 欧美日韩第二页| www.youjizz.com在线| 亚洲视频在线一区| 天天人人精品| 国产一级在线| 久久久亚洲高清| 精品亚洲第一| 免费国产精品视频| 国产91丝袜在线播放九色| 91精品久久久久久久久久久久久久 | 国产精品视频123| 欧美精品一级| 精品久久国产精品| 国产传媒视频在线 | 亚洲综合激情五月| 国产在线观看免费| 久久久精品天堂| 欧美h视频在线| 手机在线观看免费av| 国产成人免费视| 亚洲一区二区三区视频| 97精品人妻一区二区三区在线| 日本中文字幕一区| 国产精品久久久久久久久男| 日本一区二区免费电影| 国产婷婷精品| 51色欧美片视频在线观看| www.中文字幕在线观看| 亚洲大胆在线| 色综合久久天天综线观看| 人与动物性xxxx| 久久精品高清| 日韩视频免费在线观看| 我要看黄色一级片| 永久亚洲成a人片777777| 欧美日韩福利电影| 国产精品美女毛片真酒店| 亚洲精品黄色| 国产999视频| 欧美成人一区二区视频| 久久99久久精品| 91国产在线免费观看| 亚洲精品喷潮一区二区三区| gogo大胆日本视频一区| 欧美日韩国产不卡在线看| 国产精品秘入口| ...中文天堂在线一区| 国内精品国产三级国产99| 成人福利电影| 色婷婷国产精品| xx欧美撒尿嘘撒尿xx| 国产精品一区二区美女视频免费看| 欧美成人免费网站| 人妻丰满熟妇aⅴ无码| 成人毛片免费看| 久久最新资源网| 久久夜色精品亚洲| 免费一级片91| 高清不卡一区二区三区| 男女视频在线观看| 亚洲桃色在线一区| 欧美午夜性视频| 日韩成人亚洲| 精品国产免费一区二区三区四区| 在线观看国产免费视频| 成人羞羞视频播放网站| 九九精品在线视频| 波多野结衣电车| 国产精品自产自拍| 久久青青草综合| 黄视频网站在线| 精品久久久中文| 亚洲精品在线视频播放| 亚洲宅男一区| 久操成人在线视频| а中文在线天堂| av动漫一区二区| 中文字幕不卡每日更新1区2区| 白浆在线视频| 67194成人在线观看| 深爱五月激情网| 欧美在线91| 国产精品无av码在线观看| 搡老岳熟女国产熟妇| 最近中文字幕一区二区三区| 北条麻妃69av| 豆花视频一区二区| 俺也去精品视频在线观看| 国产又大又黄视频| 国产乱人伦偷精品视频不卡 | 国产精品久久久久久久免费观看| 1769国产精品| 韩国av免费在线| 136国产福利精品导航| 妺妺窝人体色www在线观看| 久久这里只有精品一区二区| 欧美精品在线免费| 亚洲一区二区人妻| 久久久天堂av| 看av免费毛片手机播放| 91麻豆精品激情在线观看最新| 色青青草原桃花久久综合| 天堂а√在线中文在线新版| 成人综合激情网| 熟女视频一区二区三区| 四虎永久精品在线| 伊人久久五月天| 国产婷婷色一区二区在线观看| 成人亚洲精品久久久久软件| 蜜桃视频成人在线观看| 久久精品97| 最新91在线视频| 在线免费看毛片| 国产精品网站一区| 美女一区二区三区视频| 蜜桃视频欧美| 国产成人小视频在线观看| 日韩在线免费看| 欧美日韩午夜激情| 熟女人妻在线视频| 亚洲永久网站| 欧美一区二区视频在线| 亚洲天堂一区二区| 中文字幕欧美日韩va免费视频| 无码人妻丰满熟妇精品| 国产午夜精品久久久久久久 | 国产综合av| 国产一区二区成人| 国产精品第6页| 91在线视频18| 日韩亚洲在线视频| 精品99在线| 91精品久久久久久久| av在线麻豆| 精品乱人伦小说| 97人人澡人人爽人人模亚洲| 91蜜桃传媒精品久久久一区二区| 国产淫片免费看| 久久综合欧美| 成人日韩在线电影| 1769免费视频在线观看| 精品精品国产高清一毛片一天堂| 日本在线观看视频网站| 久久久久久亚洲综合影院红桃 | 日韩有码欧美| 久久999免费视频| 无码国精品一区二区免费蜜桃| 日韩欧美在线第一页| 99自拍偷拍视频| 国产精品一区二区x88av| www.射射射| 国产精品一区二区av交换| 成人免费福利在线| 国产白浆在线免费观看| 中文字幕日韩精品在线观看| a在线观看视频| 黄色成人av网| 中文乱码字幕高清一区二区| 成人免费视频一区| jizz欧美激情18| 午夜日韩福利| 欧美日韩国产免费一区二区三区| 精品久久在线| 亚州精品天堂中文字幕| 99reav在线| 日韩精品在线看片z| 国产无码精品在线观看| 国产精品免费视频网站| 久久精品女同亚洲女同13| 美女一区二区视频| 国产69精品久久久久999小说| 久久蜜桃av| 欧美日韩国产三区| 2021年精品国产福利在线| 日韩av快播网址| 国内在线视频| yw.139尤物在线精品视频| 天堂成人在线视频| 91精品国产综合久久蜜臀| 欧美三级一区二区三区| 中文字幕在线观看一区二区| 国产ts丝袜人妖系列视频| 国产精品一区专区| 在线免费观看视频黄| 一本色道88久久加勒比精品| 国产精品h视频| 欧美精选视频在线观看| 国产乱码精品一区二区三区卡| 开心久久婷婷综合中文字幕| 日本精品久久久久久久| 在线播放一级片| 欧美777四色影| 青青草成人网| 欧美aaaaa级| 99在线看视频| 伊人久久大香线蕉综合影院首页| 欧美一级视频一区二区| 国产第一页在线| 久久国产视频网站| 无遮挡动作视频在线观看免费入口| 日韩精品中文字幕在线观看| 国精产品一品二品国精品69xx| 制服丝袜亚洲网站| 一级特黄特色的免费大片视频| 精品日本高清在线播放| 国产午夜视频在线| 亚洲一线二线三线久久久| 青青草手机在线视频| 亚洲情趣在线观看| 多男操一女视频| 综合婷婷亚洲小说| 91香蕉视频污在线观看| 综合色天天鬼久久鬼色| 男女做暖暖视频| 一区二区三区四区视频精品免费 | 国产乱淫a∨片免费观看| 欧美色精品在线视频| 中文字幕一区二区人妻| 欧美日韩一卡二卡| 91禁在线观看| 欧美一区二区性放荡片| 国产黄色一区二区| 日韩欧美国产一区二区在线播放| 亚洲av综合色区无码一二三区 | 在线视频 日韩| 99国产精品视频免费观看| 国产伦精品一区二区三区妓女 | 亚洲激情一区二区三区| 欧美日韩国产一区二区三区不卡| 欧美精品123| 欧美限制电影| 99精品一区二区三区的区别| 中文字幕一区二区三区久久网站| 色哟哟免费网站| 99国内精品| 亚洲熟妇av一区二区三区| 人人精品人人爱| 亚洲成人激情小说| 97久久超碰国产精品电影| 一级片视频免费看| 综合精品久久久| 国产亚洲欧美精品久久久www| 亚洲成a人v欧美综合天堂下载| 超碰中文字幕在线| 8x8x8国产精品| 亚洲av无码一区二区三区性色| 亚洲精品一区二区久| 日本www在线观看视频| 欧美激情亚洲一区| 亚洲精品中文字幕| 91精品久久久久久| 日本成人a网站| 亚洲一二三区精品| 精品1区2区3区4区| 日韩欧美黄色大片| 国产精品123| 欧美日韩高清丝袜| 亚洲综合区在线| 波多野结衣视频观看| 555夜色666亚洲国产免| 色综合视频在线| 日韩亚洲第一页| 成年人在线网站| 国产日韩精品综合网站| 清纯唯美亚洲经典中文字幕| 一区二区三区在线视频看| 一区二区自拍| av中文字幕网址| 久久综合狠狠综合久久激情| 日韩欧美综合视频| 91黄色免费版| 手机看片1024国产| 欧美成人午夜激情| 性欧美freehd18| 久久99精品国产99久久| 亚洲欧洲中文字幕| caopor在线视频| av动漫一区二区| www.av视频| 欧美系列亚洲系列| 无码精品一区二区三区在线 | 午夜影院在线观看国产主播| 成人春色激情网| 精品久久不卡| 青青草原成人网| 成人av资源网站| 91日韩中文字幕| 欧美日韩免费观看一区二区三区| 日本黄在线观看| 国内精品小视频| 亚洲精品一区二区三区在线| 中文字幕一区二区三区最新| 老鸭窝毛片一区二区三区| 捆绑裸体绳奴bdsm亚洲| 亚洲一区av在线| 亚洲精品国产片| 久久99热精品这里久久精品| 96视频在线观看欧美| 亚洲 日韩 国产第一区| 日韩电影一二三区| 在线 丝袜 欧美 日韩 制服| 五月婷婷激情综合| 欧美熟妇另类久久久久久不卡| 欧美巨大黑人极品精男| 91精品网站在线观看| 亚洲一区二区精品在线| 蜜臀91精品一区二区三区| 三年中国中文观看免费播放| 日韩欧美亚洲成人| 在线观看xxx| 欧美亚洲第一页| 秋霞蜜臀av久久电影网免费| 18岁网站在线观看| 26uuu国产电影一区二区| 日本少妇在线观看| 日韩成人在线观看| 欧美裸体视频| 欧洲在线视频一区| 日韩av电影免费观看高清完整版| 少妇人妻好深好紧精品无码| 在线观看成人免费视频| 国内精品在线视频| 国产精品久久久久久亚洲调教| 精品久久影院| 一女二男3p波多野结衣| 亚洲视频在线观看三级| av免费在线不卡| 久久久久国产精品一区| 红杏视频成人| 欧美激情成人网| 国产精品麻豆99久久久久久| 91久久久久国产一区二区| 欧美精品在线看| 精品福利一区| 欧美激情精品久久久久久小说| 国产亚洲欧美一区在线观看| 中文字幕一级片| 欧美精品手机在线| 欧美aaaaaaaa牛牛影院| 污视频免费在线观看网站| 日韩美女视频19| 免费激情视频网站| 国产成人在线一区二区| 亚洲综合专区| 五月天激情小说| 欧美三级电影一区| 青春草在线免费视频| 欧美日韩视频在线一区二区观看视频| 蜜桃一区二区三区在线| 久久久久久久久久久97| 亚洲色在线视频| 日韩成人在线观看视频| 欧美亚洲一二三区| 国产精品久久久久久久第一福利| 精品人妻少妇嫩草av无码专区| 欧美在线视频导航| 亚洲精品一区二区妖精| 给我免费观看片在线电影的| 欧美日韩高清在线| 国产伦理精品| 手机看片日韩国产| 91美女蜜桃在线| 精品国自产在线观看| 秋霞av国产精品一区| 韩国亚洲精品| 你懂得视频在线观看| 日韩第一页在线|