精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Hugging Face開源頂級模型:雙模式推理+128K上下文,最強3B

人工智能 新聞
全球著名大模型開放平臺Hugging Face開源了,頂級小參數(shù)模型SmolLM3。

今天凌晨,全球著名大模型開放平臺Hugging Face開源了頂級小參數(shù)模型SmolLM3。

SmolLM3只有30億參數(shù),性能卻大幅度超過了Llama-3.2-3B 、Qwen2.5-3B等同類開源模型。它擁有128k上下文窗口,支持英語、法語、西班牙語、德語等6種語言。也支持深度思考和非思考雙推理模式,用戶可以靈活切換。

圖片

值得一提的是,SmolLM3已經(jīng)把架構(gòu)細節(jié)、數(shù)據(jù)混合方式、三階段預(yù)訓(xùn)練以及構(gòu)建混合推理模型的方法全部開放了,有助于開發(fā)人員深度研究或優(yōu)化自己的模型。

圖片

基礎(chǔ)模型:https://huggingface.co/HuggingFaceTB/SmolLM3-3B-Base

推理和指導(dǎo)模型:https://huggingface.co/HuggingFaceTB/SmolLM3-3B

Hugging Face的聯(lián)合創(chuàng)始人Clement Delangue和Thomas Wolf都對該模型進行了強烈推薦,認為是3B領(lǐng)域的SOTA模型,也非常適合用于開源模型的研究。

圖片

圖片

SmolLM3架構(gòu)簡單介紹

在架構(gòu)方面,SmolLM3 采用了 Transformer 解碼器架構(gòu),與 SmolLM2 類似,基于 Llama 進行了一些關(guān)鍵修改以提高效率和長上下文性能。它使用了分組查詢注意力,16 個注意力頭共享 4 個查詢,在保持全多頭注意力性能的同時節(jié)省了推理時的內(nèi)存。

訓(xùn)練中采用了文檔內(nèi)掩碼,確保同一訓(xùn)練序列中不同文檔的標記不會相互關(guān)注,有助于長上下文訓(xùn)練。還運用了 NoPE 技術(shù),有選擇地從每第 4 層移除旋轉(zhuǎn)位置嵌入,改善長上下文性能而不影響短上下文能力。

圖片

訓(xùn)練配置方面,模型參數(shù)為 3.08B,初始化采用 N (0, std=0.02),有 36 層,Rope theta為50k,序列長度4096,批處理大小236萬tokens,優(yōu)化器為AdamW(eps=1e-8,beta1=0.8,beta2=0.95),峰值學(xué)習(xí)率 2e-4,梯度裁剪 1.0,權(quán)重衰減0.1。

圖片

參考 OLMo 2,從嵌入層移除權(quán)重衰減以提高訓(xùn)練穩(wěn)定性。訓(xùn)練使用 nanotron 框架,datatrove 進行數(shù)據(jù)處理,lighteval 進行評估,在384塊H100 GPU 上訓(xùn)練了 24天,分布式訓(xùn)練設(shè)置為 48 個節(jié)點,每個節(jié)點8個H100(80 GB),模型通過張量并行(TP=2)分布在 2 個 GPU 上,一個節(jié)點容納 4 個模型實例,再分布到 384 個節(jié)點。

訓(xùn)練數(shù)據(jù)和三階段混合訓(xùn)練方法

數(shù)據(jù)混合和訓(xùn)練階段遵循 SmolLM2 的多階段方法,采用三階段訓(xùn)練策略,在11.2 萬億 tokens 上訓(xùn)練,混合了網(wǎng)絡(luò)、數(shù)學(xué)和代碼數(shù)據(jù),且比例不斷變化。

階段 1 為穩(wěn)定階段(0T→8T tokens),建立強大的通用能力,網(wǎng)絡(luò)數(shù)據(jù)占85%(12%為多語言),包括FineWeb-Edu、DCLM、FineWeb2 和 FineWeb2-HQ;代碼數(shù)據(jù)占 12%,包括The Stack v2(16 種編程語言)、StarCoder2 拉取請求、Jupyter 和 Kaggle 筆記本、GitHub 問題和 StackExchange;數(shù)學(xué)數(shù)據(jù)占3%,包括FineMath3 + 和 InfiWebMath3+。

圖片

階段 2 為穩(wěn)定階段(8T→10T tokens),引入更高質(zhì)量的數(shù)學(xué)和代碼數(shù)據(jù)集,同時保持良好的網(wǎng)絡(luò)覆蓋,網(wǎng)絡(luò)數(shù)據(jù)占 75%(12% 為多語言),代碼數(shù)據(jù)占15%(添加了 Stack-Edu),數(shù)學(xué)數(shù)據(jù)占 10%(引入了 FineMath4+、InfiWebMath4 + 和 MegaMath)。

階段 3 為衰減階段(10T→11.1T tokens),進一步增加數(shù)學(xué)和代碼數(shù)據(jù)的采樣,網(wǎng)絡(luò)數(shù)據(jù)占 63%,代碼數(shù)據(jù)占 24%(高質(zhì)量代碼數(shù)據(jù)的上采樣),數(shù)學(xué)數(shù)據(jù)占13%,上采樣數(shù)學(xué)數(shù)據(jù)并引入指令和推理數(shù)據(jù)集,如 OpenMathReasoning。

在中期訓(xùn)練中,進行了長上下文擴展和推理適應(yīng)。長上下文擴展是在主要預(yù)訓(xùn)練后,額外訓(xùn)練 1000 億 tokens 以擴展上下文長度,分兩個階段依次擴展上下文窗口,每個階段500億tokens,先從4k過渡到32k上下文,將 RoPE theta 增加到 150 萬,然后從 32k 過渡到64k 上下文,將 RoPE theta 進一步增加到 500萬,兩個階段都對數(shù)學(xué)、代碼和推理數(shù)據(jù)進行了上采樣。

圖片

借鑒 Qwen2.5,使用 YARN 在訓(xùn)練上下文長度之外進行外推,推理時模型可處理高達 128k 的上下文(是 64k 訓(xùn)練長度的 2 倍擴展)。推理中期訓(xùn)練是在擴展模型上下文長度后,訓(xùn)練模型融入推理能力。中期訓(xùn)練數(shù)據(jù)集包含 350億tokens,來自 Open Thought 的 OpenThoughts3-1.2M 和NVIDIA 的 Llama-Nemotron-Post-Training-Dataset-v1.1 的子集,使用 ChatML 聊天模板和包裝打包,訓(xùn)練模型 4 個 epochs(約1400億tokens),并將檢查點用于后續(xù)的 SFT(監(jiān)督微調(diào))階段。

后期訓(xùn)練中,構(gòu)建了聊天模板,用戶可通過在系統(tǒng)提示中包含<code>/think</code>和<code>/no_think</code>標志分別激活推理或非推理模式,在非推理模式下,會用空的思考塊預(yù)填充模型的響應(yīng)。

聊天模板還包含 XML 工具和 Python 工具兩個不同的工具描述部分,提供了兩種推理模式的默認系統(tǒng)消息以及包含日期、知識截止日期和當前推理模式的元數(shù)據(jù)部分,用戶可通過在系統(tǒng)提示中使用<code>/system_override</code>標志排除元數(shù)據(jù)部分。

SFT和APO

SFT在推理中期訓(xùn)練階段之后進行,該階段在 1400 億 tokens 的通用推理數(shù)據(jù)上訓(xùn)練模型,進而在數(shù)學(xué)、代碼、通用推理、指令遵循、多語言和工具調(diào)用方面融合推理和非推理模式的能力。

為解決某些領(lǐng)域缺乏包含推理軌跡的數(shù)據(jù)集的問題,通過在現(xiàn)有非推理數(shù)據(jù)集的提示下提示 Qwen3-32B 在推理模式下來生成合成數(shù)據(jù)。最終的 SFT數(shù)據(jù)集包含18億tokens,其中 10 億為非推理模式,8 億為推理模式,包括12個非推理數(shù)據(jù)集和 10 個帶有推理軌跡的數(shù)據(jù)集,使用 BFD打包訓(xùn)練 4 個 epochs(約 80 億 tokens),對用戶輪次和工具調(diào)用結(jié)果的損失進行掩碼。

圖片

采用APO(錨定偏好優(yōu)化)進行離策略模型對齊,這是直接偏好優(yōu)化的一種變體,提供更穩(wěn)定的優(yōu)化目標。APO 步驟使用 Tulu3 偏好數(shù)據(jù)集(非推理模式)和新的合成偏好對(推理模式),合成偏好對由 Qwen3-32B 和 Qwen3-0.6B 生成。

圖片

由于在長上下文基準上觀察到性能下降,采用模型合并來緩解使用 MergeKit 庫,先將每個 APO 檢查點創(chuàng)建一個模型混合體,然后將模型混合體與具有強大長內(nèi)容性能的中期訓(xùn)練檢查點組合,APO 模型混合體和中期訓(xùn)練檢查點的線性合并權(quán)重分別為 0.9 和 0.1,最終模型恢復(fù)了基礎(chǔ)模型在高達 128k tokens 上下文上的 RULER 分數(shù),并在廣泛的任務(wù)中保持高性能。

責(zé)任編輯:張燕妮 來源: AIGC開放社區(qū)
相關(guān)推薦

2025-07-10 09:03:27

2024-07-19 12:45:23

2024-03-29 14:04:00

模型訓(xùn)練

2025-06-11 04:25:00

上下文窗口系統(tǒng)

2025-09-22 09:06:00

AI智能模型

2023-11-17 18:06:15

2025-08-21 10:14:18

2024-04-01 00:00:00

馬斯克Grok 1.5HumanEval

2024-03-29 12:48:00

數(shù)據(jù)訓(xùn)練

2025-05-14 01:00:00

2024-03-25 00:05:00

開源模型AI

2023-12-06 13:59:00

數(shù)據(jù)訓(xùn)練

2025-10-31 01:00:00

2025-01-14 12:22:06

2025-03-18 08:14:05

2025-08-19 21:23:45

DeepSeekAPP接口

2025-08-20 09:57:40

DeepSeekClaude 4編程

2025-08-25 09:10:00

2012-07-30 16:29:40

架構(gòu)架構(gòu)模式.NET

2023-11-13 08:03:33

點贊
收藏

51CTO技術(shù)棧公眾號

久久久av网站| 色综合欧美在线视频区| 91香蕉亚洲精品| 无码人妻精品一区二区三区夜夜嗨| 日韩高清在线观看一区二区| 亚洲h在线观看| 日韩精品久久一区| 国产成人三级一区二区在线观看一| 精品动漫一区| 亚洲午夜未删减在线观看 | 国产精品乱子乱xxxx| 久久黄色精品视频| 午夜精品久久久久久久四虎美女版| 日韩欧美一级二级| 日韩有码免费视频| 日本中文字幕中出在线| 久久精品亚洲精品国产欧美| 91久久在线视频| 黄色在线观看国产| 欧美精品一卡| 主播福利视频一区| 中文字幕在线免费看线人| 91成人福利社区| 色视频一区二区| 天天操天天干天天玩| 青青草视频在线观看| 国产一区二区久久| 国产91在线播放精品91| 国产在线综合网| 97精品国产| 亚洲天堂色网站| 少妇被狂c下部羞羞漫画| 99久久999| 91国产免费看| 九九九九免费视频| 密臀av在线| 亚洲情趣在线观看| 亚洲不卡1区| 风流少妇一区二区三区91| 美女任你摸久久| 国产99久久精品一区二区| 久久精品国产亚洲av无码娇色 | 艳母动漫在线观看| youjizz在线播放| 久久综合九色综合欧美98| 国产精品久久久久久免费观看| 91av久久久| 人妖欧美一区二区| 2019中文字幕在线| 日韩黄色三级视频| 极品少妇一区二区三区| 欧美多人乱p欧美4p久久| 四虎精品免费视频| 99久精品视频在线观看视频| 在线观看视频亚洲| jizz中文字幕| 久久av影视| 亚洲欧美精品中文字幕在线| 国产精品无码一区二区三| 亚洲视频精选| 精品精品国产高清a毛片牛牛| 中文字幕在线视频一区二区三区 | 91日韩久久| a天堂在线观看视频| 国内一区二区在线| 91传媒视频在线观看| 国产免费一区二区三区免费视频| 精品一区二区免费| 91pron在线| 欧美 日韩 国产 在线| 成人91在线观看| 精品亚洲第一| 黄色av免费在线观看| 欧美高清在线视频| 小说区视频区图片区| av在线播放国产| 亚洲一区二区在线免费看| 欧美精品卡一卡二| 中文在线а√天堂| 欧美伊人久久久久久久久影院 | 久草网在线观看| 亚洲午夜电影| 欧美一级淫片播放口| 日韩免费av网站| 久久国产精品第一页| 亚洲xxxx18| 亚州av在线播放| 国产精品系列在线| 欧美日韩激情四射| 亚洲黄色免费看| 欧美日韩久久不卡| 欧美日韩一区二区区别是什么| 精品伊人久久久| 一本色道久久88亚洲综合88| 性欧美videos| 久久不射中文字幕| 亚洲a在线播放| 亚洲AV成人无码一二三区在线| 国产清纯在线一区二区www| 糖心vlog在线免费观看| 九九精品调教| 欧美亚一区二区| 精品久久久久久无码人妻| 久久爱www成人| 欧美成人精品激情在线观看| 欧美黑人一区二区| 国产麻豆精品久久一二三| 久草精品电影| 菠萝菠萝蜜在线观看| 欧美午夜精品伦理| 激情成人在线观看| 啪啪亚洲精品| 欧美国产亚洲视频| 亚洲天堂网在线观看视频| www.一区二区| 大桥未久一区二区| 欧美成人黑人| 精品国产一区二区三区av性色| 日韩影视一区二区三区| 一本久道久久综合狠狠爱| 91色在线视频| 久久精品国产亚洲a∨麻豆| 一区二区成人在线观看| 99sesese| 精品freesex老太交| 午夜精品视频网站| 国产suv一区二区| 欧美激情在线观看视频免费| 久久综合色视频| gogo人体一区| 久久国产精彩视频| 在线观看国产小视频| 久久久久久麻豆| 水蜜桃色314在线观看| 日本一区二区三区视频在线看| 一级做a爰片久久毛片美女图片| 日韩少妇裸体做爰视频| 国产福利一区在线| 久久久久亚洲av无码专区喷水| 福利精品一区| 国产一区二区黑人欧美xxxx| 男人天堂av在线播放| 94色蜜桃网一区二区三区| 国产 欧美 日韩 一区| 精品国产亚洲一区二区三区大结局 | 超碰在线播放91| 免费看av成人| 日本不卡高字幕在线2019| 天堂网av在线播放| 午夜av区久久| 在线观看国产三级| 在线视频精品| 久久久综合香蕉尹人综合网| 国产ktv在线视频| 日韩精品日韩在线观看| 国产精品久久久久久久久久久久久久久久久 | 国产成人精品网站| 国产高清av在线| 欧美亚男人的天堂| 天海翼在线视频| 国产乱国产乱300精品| 久久99国产精品一区| 日韩激情欧美| 国模视频一区二区三区| 天天操天天干天天操| 欧美性xxxxxxx| 国产真实乱人偷精品人妻| 日本视频中文字幕一区二区三区| 亚洲精品日韩成人| 国产不卡精品| 97热精品视频官网| 成人av一区| 555www色欧美视频| xxxx 国产| 久久―日本道色综合久久| 美女网站免费观看视频| 91久久电影| 国产乱码精品一区二区三区中文| 超碰高清在线| 国产午夜精品一区理论片飘花| 中国精品一区二区| 亚洲靠逼com| 免费a级黄色片| 免费不卡在线观看| 国产精品无码电影在线观看 | 视频一区二区三区在线观看| 欧美视频在线视频精品| 欧美精品久久久久久久久久| 日本成人一区| 91精品国产综合久久蜜臀 | 日韩免费啪啪| 精品国产一区二区三区av性色| 中文字幕精品视频在线观看| 亚洲女人****多毛耸耸8| 免费黄色三级网站| 久久er精品视频| 日韩在线综合网| 亚洲一区二区三区无吗| 久久riav| 年轻的保姆91精品| 国产精品444| а_天堂中文在线| 最近2019中文字幕mv免费看 | 在线天堂中文字幕| 亚洲视频一区二区免费在线观看| 亚洲天堂网一区二区| 精品亚洲国产成人av制服丝袜| 国产美女网站在线观看| 99九九热只有国产精品| 久久综合给合久久狠狠色| 国产精品xnxxcom| 国产成人中文字幕| h片在线观看视频免费| 日韩在线观看免费av| 毛片免费在线播放| 精品国产一区二区三区av性色| 亚洲一级片免费看| 日本韩国一区二区三区| 国产在线拍揄自揄拍| 亚洲色图视频免费播放| 一色道久久88加勒比一| 成+人+亚洲+综合天堂| 天天色天天干天天色| 麻豆专区一区二区三区四区五区| 黄色动漫在线免费看| 精品91久久久久| 18视频在线观看娇喘| 91九色精品| 亚洲伊人婷婷| 成人同人动漫免费观看| 欧美xxxx黑人又粗又长密月| 久久99精品国产自在现线| 成人做爰66片免费看网站| 精品久久国产一区| 成人在线播放av| 外国成人毛片| 国产女人18毛片水18精品| 成人看片在线观看| 欧美中文字幕在线| 涩涩涩视频在线观看| 97在线视频免费观看| a级片在线免费| 欧美久久精品午夜青青大伊人| se在线电影| 最近更新的2019中文字幕| 成年女人的天堂在线| 国产亚洲精品va在线观看| 精品99又大又爽又硬少妇毛片| 亚洲精品视频免费| 久久久资源网| 中文字幕精品—区二区| 在线观看免费版| 视频直播国产精品| 精品欧美色视频网站在线观看| 日韩视频欧美视频| 超碰在线caoporen| 欧美日韩国产二区| 国产资源在线观看入口av| 性欧美激情精品| 天天综合av| 国产成人精品免高潮在线观看 | 欧美性猛交xxxx黑人交| 中文字幕 自拍偷拍| 欧美色图一区二区三区| 一级黄在线观看| 日韩三级.com| 午夜成人鲁丝片午夜精品| 亚洲精品视频二区| 在线激情小视频| 欧美日韩第一视频| 国模精品视频| 国产精品第1页| 国产一精品一av一免费爽爽| 97神马电影| 羞羞答答一区二区| 日本在线播放一区| 久久久久国产| 成人免费毛片在线观看| 久久久精品性| www.久久av.com| 成人美女视频在线观看18| 女同毛片一区二区三区| 中文字幕精品在线不卡| 久草网站在线观看| 欧美性xxxxx极品娇小| 欧美 亚洲 另类 激情 另类| 88在线观看91蜜桃国自产| 韩国av在线免费观看| 亚洲欧美综合另类中字| 久草中文在线观看| 97碰碰碰免费色视频| 精品久久毛片| 国产精品二区二区三区| 国产一区二区三区站长工具| 国产欧美自拍视频| 国产精品日韩精品欧美精品| 日韩一区二区三区不卡视频| 成人美女视频在线看| 日本高清黄色片| 亚洲一区中文在线| 中文天堂在线视频| 亚洲高清色综合| 日本不卡视频| 欧美性视频精品| www.久久草.com| 欧美18视频| 亚洲五月婷婷| 九九热精品国产| 久久亚洲捆绑美女| 青青草激情视频| 一本色道久久综合精品竹菊| 精品国产伦一区二区三| 在线观看欧美视频| 国产传媒在线观看| 亚洲一区二区三区乱码aⅴ| 一区二区三区四区在线看| 米仓穗香在线观看| 日韩精品午夜视频| 午夜视频在线观看国产| 亚洲精品免费视频| 中文字幕一二区| 亚洲男人的天堂在线播放| 污片在线免费观看| 成人欧美一区二区三区黑人| 精品国产乱码久久久| 色综合久久久久无码专区| 国产成人自拍网| 欧美丰满熟妇bbbbbb| 欧美日韩一区二区三区免费看| 你懂的免费在线观看视频网站| 久久免费高清视频| 136国产福利精品导航网址应用| 一区二区三区四区五区精品| 日韩精品欧美成人高清一区二区| 中文字幕 亚洲一区| 亚洲高清在线精品| 黄色www视频| 欧美激情综合亚洲一二区| 91精品网站在线观看| 波多野结衣三级在线| 美国三级日本三级久久99| 中字幕一区二区三区乱码| 一本高清dvd不卡在线观看| 天堂av网在线| 欧美一级视频在线观看| 亚洲国产最新| 欧美极品欧美精品欧美图片| 26uuu亚洲综合色欧美| 全部毛片永久免费看| 国产视频综合在线| 最近高清中文在线字幕在线观看1| 国产欧美日韩视频一区二区三区| 激情一区二区| 怡红院一区二区| 精品久久久久久久中文字幕| 天堂在线中文| 欧美最猛性xxxxx免费| 要久久电视剧全集免费| 国产精品69页| 国产精品天干天干在观线| 中文字幕永久免费视频| 色哟哟网站入口亚洲精品| 亚洲欧美综合久久久久久v动漫| 在线成人性视频| 国产精品一区一区| 日本少妇吞精囗交| 亚洲激情视频在线| 亚洲人成在线网站| 水蜜桃亚洲精品| 国产做a爰片久久毛片| 久操视频免费在线观看| 日韩av在线不卡| 欧美18—19sex性hd| 亚洲蜜桃在线| 国产传媒欧美日韩成人| 久久高清免费视频| 国产一区二区三区18| 中文成人激情娱乐网| 91九色国产ts另类人妖| 99re热视频精品| 日韩欧美一级大片| 欧美理论片在线观看| 亚洲最好看的视频| 中文字幕22页| 亚洲国产毛片aaaaa无费看| 蜜桃视频在线观看网站| 成人免费网视频| 国产精品试看| 黄色裸体一级片| 日韩av影院在线观看| 深夜日韩欧美| 熟女少妇在线视频播放| 欧美高清在线一区二区| 亚洲欧美另类视频| 国产精品va在线| 韩日在线一区| 超碰人人干人人| 亚洲福利视频网站| 麻豆久久久久| 精品国产一二三四区|