精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

混元A13B實測出爐,騰訊補上開源MoE模型的“尺寸斷檔”

發布于 2025-7-11 07:56
瀏覽
0收藏

騰訊前兩天開源了混元A13B模型,A13B模型是一個MoE模型,總參數80B,激活參數13B,同時支持快慢思考兩種模式切換。

Paper:https://github.com/Tencent-Hunyuan/Hunyuan-A13B/blob/main/report/Hunyuan_A13B_Technical_Report.pdf
HF:https://huggingface.co/collections/tencent/hunyuan-a13b-685ec38e5b46321e3ea7c4be

騰訊之前開源3D生成模型關注度很高,文本大模型上一次開源已經是5個月前的HunYuan-7B和HunYuan-Large模型了。

由于Qwen3的系列模型沒有開源72B級別模型,市面上80B級別的模型還沒有太好的模型,而混元這次的A13B模型80B,算是彌補了目前該尺寸的空缺。

并且量化的情況下,單卡H100可以推理,對于企業側想要探索本地模型應用,是一個不錯的備選項。

今天給大家分享一下,HunYuan-A13B模型的相關細節,再實測看看效果到底如何,最后用vllm進行部署。

模型細節

直奔主題,主看一下paper中model architechture、pre-training、post-training的細節。

模型結構

模型為MoE結構,32層,詞表大小128K,上下文長度256K,采用GQA注意力,激活函數采用SWiGLU,一個共享專家,64個非共享專家,每次會激活8個非共享專家,具體如下所示。

混元A13B實測出爐,騰訊補上開源MoE模型的“尺寸斷檔”-AI.x社區

其中,共享專家數量是經過實驗得出,發現沒有任何共享專家的情況下表現不如至少有一個共享專家的情況,而共享專家數量超過一個后,收益會逐漸減少,僅有微小提升,甚至可能出現波動。

Pre-training

預訓練依舊分為三個階段,

  • 基礎階段:共計使用20T Tokens訓練,上下文長度4096,學習率三個階段,預熱從0線性升值3e-4,余弦衰減從3e-4到3e-5,共計13.5T Tokens,再使用3e-5恒定訓練余下數據。
  • 退火階段:共計300B Tokens,上下文長度增至8092,學習率余弦衰減從3e-5到8e-6。
  • 上下文擴展階段:采用NTK 感知位置編碼,擴充上下文長度,先擴充至32K(α 值為50),再擴展至256K(α 值為100)。

在預訓練過程的數據,與之前的Hunyuan-TurboS一致,涉及成數據去重、低質量過濾、數據去噪和數據主題標記、提取純文本、語義級去重等。主要是STEM 數據進行了重點清洗,額外提取250B Tokens高質量的 STEM 預訓練數據。

Post-training

后訓練主要涉及四個步驟,推理導向的SFT和RL,通用場景的SFT和RL,如下圖所示,

混元A13B實測出爐,騰訊補上開源MoE模型的“尺寸斷檔”-AI.x社區

推理導向的SFT數據量未知,數據集含了明確的推理過程和詳細的思維鏈解決方案,數據來源:

  • 數學推理:從教科書、標準化測試和數學競賽等資源中收集數學問題,經過嚴格驗證的數學推理對才會被保留在最終數據集中。
  • 代碼推理:原始數據來自于Github代碼庫,采用代碼生成管道將代碼片段轉換為涵蓋各種任務、編程語言和問題類型的結構化指令推理對,通過多階段驗證,確保最終推理示例的數據質量。
  • 邏輯推理:各種謎題集合,同時采用自動化數據合成方法,實現數據集的可擴展增強。
  • 科學推理:物理、化學和生物學科從中學生水平到高級研究生難度的數據,最后只有通過嚴格拒絕采樣驗證的樣本才會被納入最終數據集。

而推理導向的RL,采用GRPO策略,在上一階段訓練得到的模型基礎上進行訓練,共設計兩種類型的獎勵模型,

  • 結果獎勵模型:語言模型評估器,對比最終答案和參考答案中之間的一致性,主要比較格式規范化(例如格式、單位等)、數學、邏輯上的差異,一致為1,否則為0.
  • 沙盒反饋:開發了一個支持 36 種編程語言的多語言代碼沙盒(部署在CPU分布式集群上,支持超過 1000 個并發執行),判斷生成的代碼內容是否準確、有效。

RL的數據150K,其中,數學、編碼、邏輯、科學的比例為 2:2:1:1,其中 10% 與 SFT 訓練數據重疊,90% 為新數據,同時RL 經過兩個上下文長度的訓練,第一階段使用 24K 的上下文,第二階段擴展到 32K。

同時使用了在線策略學習策略、更大的Batch Size、增加的 rollout 次數、以及較低的采樣溫度(0.6–0.8)。

通用場景的SFT的數據量未知,主要是擴展模型的適應性,增加模型的泛化能力,增加以下類型數據:語言理解任務、創意寫作任務、多語言任務、復雜指令場景任務、基于角色的互動任務、知識問答任務、Agent任務。

通用場景的RL的數據量未知,采用生成式獎勵模型(GRM),在不同任務上,采用不同的評分規則,將靈活的 GRM 與 16 個子主題和 30 多個評分服務的領域特定管道統一起來。使模型能夠在確定性、創意性和專業性場景中進行多樣的推理。

同時,支持雙模式CoT,根據任務復雜性和用戶需求動態調整推理深度,

快思考,提供簡潔、高效的輸出,適用于需要速度且計算開銷最小的簡單任務。

慢思考,提供更深入、更全面的推理步驟,在處理復雜推理任務時顯著提高了準確性和穩健性。

模型推理時,“/no think” 為快思考模式,、“/think” 為慢思考模式,未設置時默認為慢思考。

最后,模型榜單效果如下:

混元A13B實測出爐,騰訊補上開源MoE模型的“尺寸斷檔”-AI.x社區

混元A13B實測出爐,騰訊補上開源MoE模型的“尺寸斷檔”-AI.x社區

HunYuan-A13B實測

先說一下實測感受:

  • 常識類問題效果還不錯,跟Qwen、DeepSeek等相差不大
  • think的整體效果要優于no_think,符合常理
  • 代碼上,大體ok,但在小細節上會出問題
  • 工具調用上不錯,額外在自己的一些任務上做了測試,基本上可以理解的意圖準確調用工具,不過工具太多時,會出現不穩地情況,不過畢竟A13B,可以理解。

常見問題

將“I love Hunyuan-A13B”這句話的所有內容反過來寫

結果:正確。

混元A13B實測出爐,騰訊補上開源MoE模型的“尺寸斷檔”-AI.x社區

依舊弱智吧

生蠔煮熟了叫什么?

結果:正確,沒有熟蠔被誤導,哈哈哈哈。

混元A13B實測出爐,騰訊補上開源MoE模型的“尺寸斷檔”-AI.x社區

用水來兌水,得到的是濃水還是稀水

結果:正確,就是水。

混元A13B實測出爐,騰訊補上開源MoE模型的“尺寸斷檔”-AI.x社區

文本推理

小紅有2個兄弟,3個姐妹,那么小紅的兄弟有幾個姐妹

結果:正確,推理步驟很詳細。

混元A13B實測出爐,騰訊補上開源MoE模型的“尺寸斷檔”-AI.x社區

未來的某天,李同學在實驗室制作超導磁懸浮材料時,意外發現實驗室的老鼠在空中飛,分析發現,是因為老鼠不小心吃了磁懸浮材料。第二天,李同學又發現實驗室的蛇也在空中飛,分析發現,是因為蛇吃了老鼠。第三天,李同學又發現實驗室的老鷹也在空中飛,你認為其原因是

結果:不對,老鷹依舊不會飛,但這道題確實存在誤導,基本上所有模型都會跟著題干進行推理,沒有辯證世界知識。

混元A13B實測出爐,騰訊補上開源MoE模型的“尺寸斷檔”-AI.x社區

高考題感覺對于現在大模型來說基本上沒啥挑戰了,畢竟2025年數學卷,各大模型都是130+,甚至很多都140+,這里測過都差不多。

其他推理

在平面四邊形ABCD中,AB = AC = CD = 1,\angle ADC = 30^{\circ},\angle DAB = 120^{\circ}。將\triangle ACD沿AC翻折至\triangle ACP,其中P為動點。 求二面角A - CP - B的余弦值的最小值。

結果:R1滿血驗證題,正確,這個還是不錯的。

混元A13B實測出爐,騰訊補上開源MoE模型的“尺寸斷檔”-AI.x社區

大數計算

178939247893 * 299281748617等于多少?

結果:錯誤,正常,市面上的模型都對不了,還是得調用工具,不過這樣說明了僅僅LLM得局限性,也是為啥Agent是必然得原因。

混元A13B實測出爐,騰訊補上開源MoE模型的“尺寸斷檔”-AI.x社區

史詩級難題

有一天,一個女孩參加數學考試只得了 38 分。她心里對父親的懲罰充滿恐懼,于是偷偷把分數改成了 88 分。她的父親看到試卷后,怒發沖冠,狠狠地給了她一巴掌,怒吼道:“你這 8 怎么一半是綠的一半是紅的,你以為我是傻子嗎?”女孩被打后,委屈地哭了起來,什么也沒說。過了一會兒,父親突然崩潰了。請問這位父親為什么過一會崩潰了?

結果:不對,循環重復了,一直沒返回結果。

混元A13B實測出爐,騰訊補上開源MoE模型的“尺寸斷檔”-AI.x社區

但用API測試就沒問題(雖然都沒對),不知道是不是官方頁面上模型的問題。

混元A13B實測出爐,騰訊補上開源MoE模型的“尺寸斷檔”-AI.x社區

代碼

寫一個打工人時鐘、

結果:頁面做出來了,也不錯,還給我加了個工作時間計時器,難到怕我干不滿8小時嗎,哈哈哈哈!

混元A13B實測出爐,騰訊補上開源MoE模型的“尺寸斷檔”-AI.x社區

寫一個貪吃蛇得游戲。

結果:做出了,風格還可以,但是蛇走的路徑細節有點問題,會一直在原地轉圈圈。

混元A13B實測出爐,騰訊補上開源MoE模型的“尺寸斷檔”-AI.x社區

內容可視化,生成HTLM解釋內容。

結果:整體不錯,我個人覺得蠻好看的。

混元A13B實測出爐,騰訊補上開源MoE模型的“尺寸斷檔”-AI.x社區

Tool調用

上面的大數計算,直接寫個計算器工具,完美解決,

正確答案:53553251005627872913981

混元A13B實測出爐,騰訊補上開源MoE模型的“尺寸斷檔”-AI.x社區

寫個BMI計算器,看一下身體的健康情況,以及推薦飲食。

混元A13B實測出爐,騰訊補上開源MoE模型的“尺寸斷檔”-AI.x社區

我為了圖方便,就用的硅基流動的接口。當然可以在騰訊云官方上申請個API使用。

??https://hunyuan.tencent.com/modelSquare/home/list??

模型部署

有卡的同學也可以本地部署一個,官方給的部署教程也挺清晰的,

??https://huggingface.co/tencent/Hunyuan-A13B-Instruct/blob/main/README_CN.md??

這里用vllm部署,官方已經給了鏡像,直接docker pull先把鏡像拉下來,

docker pull docker.cnb.cool/tencent/hunyuan/hunyuan-a13b:hunyuan-moe-A13B-vllm

注意:模型啟動需要cuda 12.8,要不然啟動會報錯

然后把模型下載下來,直接魔搭下載,昨天我也說了,下載飛快,保持到固定的目錄下,我直接存在/home下了

nohup modelscope download --model 'Tencent-Hunyuan/Hunyuan-A13B-Instruct' --local_dir '/home/Hunyuan-A13B-Instruct' &

最后用docker 命令啟動,

docker run --privileged --user root --net=host --ipc=host -v /home:/home --gpus=all -it --entrypoint python docker.cnb.cool/tencent/hunyuan/hunyuan-a13b:hunyuan-moe-A13B-vllm -m vllm.entrypoints.openai.api_server --host 0.0.0.0 --tensor-parallel-size 8 --port 18121 --model /home/Hunyuan-A13B-Instruct/ --trust_remote_code

由于我是8卡4090,所以tensor-parallel-size設置8,port就是服務啟動的端口號,--model為模型路徑。

本文轉載自??????NLP工作站??????,作者:NLP工作站

收藏
回復
舉報
回復
相關推薦
日本a在线观看| 污网站在线免费| 久久伊伊香蕉| 麻豆国产欧美一区二区三区| 最新成人av在线| 亚洲最大av在线| 国产毛片aaa| 国产精品福利在线观看播放| 亚洲黄色片网站| 亚洲第一狼人区| 波多野结衣在线播放| 国产欧美日韩亚州综合| 91沈先生播放一区二区| 一级片视频在线观看| 亚洲国产精品成人| 亚洲欧美日韩另类| 成年人性生活视频| 精品国产欧美日韩一区二区三区| 亚洲一区在线播放| 视频一区二区综合| 婷婷丁香花五月天| 国产麻豆成人传媒免费观看| 日韩免费av片在线观看| 激情四射综合网| 日韩欧美高清在线播放| 亚洲免费视频在线观看| 制服丝袜av在线| 91精品一久久香蕉国产线看观看| 日韩欧美福利视频| 免费人成在线观看视频播放| 黄网站免费在线播放| 国产视频一区在线播放| 激情五月综合色婷婷一区二区| 精品乱码一区内射人妻无码 | 国产尤物在线视频| 在线中文字幕第一区| 中国人与牲禽动交精品| 黄色在线观看av| 国产精品极品国产中出| 欧美一区二区视频在线观看2022 | 日韩成人av毛片| 911久久香蕉国产线看观看| 伊人久久免费视频| 免费在线观看你懂的| 国内毛片久久| 精品久久久久久久久久久久包黑料 | 日韩免费成人网| 一区二区三区国产好的精华液| 亚洲天堂1区| 色国产综合视频| 91传媒久久久| 天堂中文最新版在线中文| 亚洲成人av一区| av无码久久久久久不卡网站| 日本h片在线| 亚洲综合丝袜美腿| 99久久久精品视频| 国产丝袜在线观看视频| 亚洲国产精品麻豆| 欧美精品卡一卡二| 国产色播av在线| 精品福利一区二区| 国产av无码专区亚洲精品| 免费高潮视频95在线观看网站| 亚洲电影第三页| 欧美 国产 综合| 在线日韩影院| 欧美吞精做爰啪啪高潮| 三区视频在线观看| 亚洲国产aⅴ精品一区二区| 日韩精品在线网站| 中文字幕av观看| 国产精品最新| 中文字幕日韩欧美| av黄色免费在线观看| 午夜精彩国产免费不卡不顿大片| 欧美日韩国产123| 欧美亚韩一区二区三区| 美女视频一区免费观看| 国产精品一区av| 国产黄色大片网站| 99re8在线精品视频免费播放| 免费亚洲精品视频| 日本激情视频在线观看| 亚洲宅男天堂在线观看无病毒| 国产一区二区片| 性xxxxfreexxxxx欧美丶| 欧美在线制服丝袜| 日本女人黄色片| 婷婷成人影院| 久久精品99无色码中文字幕| 日韩黄色精品视频| 日本sm残虐另类| 懂色中文一区二区三区在线视频| 香蕉国产在线视频| 国产精品美女一区二区在线观看| 欧美 日韩 国产精品| 三级中文字幕在线观看| 欧美日韩午夜在线视频| 精品少妇人妻av一区二区三区| 国产一区日韩| 欧美日本高清视频| 在线观看国产区| 国产91在线|亚洲| 日韩尤物视频| 99热99re6国产在线播放| 欧美三区在线观看| 91丝袜在线观看| 国产精品久久久久久| 欧美在线免费看| www.蜜臀av| 中文一区在线播放 | 日韩av电影天堂| 99九九视频| 2021av在线| 黄色一区二区在线观看| 中日韩av在线播放| 国产亚洲一卡2卡3卡4卡新区| 欧美成人免费观看| 这里只有精品免费视频| 99re这里只有精品视频首页| 日本特级黄色大片| 亚洲综合av一区二区三区| 亚洲精品国精品久久99热| avove在线播放| 久久精品国产99国产精品| 欧美日韩一区二区三区免费| 国产第一页在线| 7777精品伊人久久久大香线蕉 | 蜜桃国内精品久久久久软件9| 久久av资源网站| 一级α片免费看刺激高潮视频| 久久久亚洲高清| 高清在线观看免费| 精品深夜福利视频| 欧美激情第1页| jlzzjlzz亚洲女人18| 中文字幕一区日韩精品欧美| 日韩在线第三页| 欧美精选一区二区三区| 日韩美女中文字幕| 国产日韩精品在线看| 欧美性色视频在线| 最新中文字幕视频| 久久久噜噜噜久久狠狠50岁| 久久精品日韩精品| 芒果视频成人app| 日韩精品视频在线免费观看| 黄网站免费在线| av网站免费线看精品| 日韩欧美不卡在线| 国产伦精品一区二区三区在线播放| 欧美乱大交xxxxx| 精品人妻伦一区二区三区久久| 1024亚洲合集| 北条麻妃亚洲一区| 亚洲欧美一级二级三级| 成人av免费在线看| 超碰激情在线| 国产偷国产偷亚洲清高网站| 伦av综合一区| 国产精品午夜春色av| 一道本在线免费视频| 91精品国产自产拍在线观看蜜| 成人免费福利视频| 亚洲欧美成人影院| 亚洲成人激情视频| 国产农村妇女aaaaa视频| 国产日韩精品一区二区浪潮av | 久久99国产综合精品免费| 久久免费看少妇高潮| 欧美成人黄色网址| 一区二区三区在线| 国产欧美一区二区在线播放| 一区二区三区四区日本视频| 在线国产精品播放| 国产aⅴ一区二区三区| 亚洲成人av福利| 少妇av片在线观看| 国产精一品亚洲二区在线视频| 国产一线二线三线女| 精品72久久久久中文字幕| 91精品国产综合久久久久久蜜臀| 日日夜夜天天综合入口| 日韩精品在线观看一区| 中文字幕人成人乱码亚洲电影 | 中日韩黄色大片| 欧美国产日韩一二三区| 一区二区三区国产好的精华液| 在线播放亚洲| 亚洲成人第一| 99热这里只有精品首页| 国产精品成人在线| av在线free| 亚洲欧美国产日韩中文字幕| 国产免费无遮挡| 懂色av中文一区二区三区天美| 亚欧精品视频一区二区三区| 成人激情午夜影院| 在线黄色免费观看| 国产日韩欧美一区在线| 一本一生久久a久久精品综合蜜| 高清日韩欧美| 国产一区视频在线| 丝袜老师在线| 久久99久国产精品黄毛片入口| 国产亚洲依依| 亚洲精品在线三区| 夜夜嗨av禁果av粉嫩avhd| 黄色一区二区三区| 欧美黄色免费看| 国产精品卡一卡二| 日本黄色网址大全| 成人av在线资源网站| www激情五月| 美女视频免费一区| 蜜臀av午夜一区二区三区| 亚洲小说区图片区| 成年人视频大全| 久久人体视频| 日本一区二区三区四区在线观看| 精品久久ai| 国产精品美女久久久久av福利| 四虎在线精品| 国产精品色视频| 综合在线影院| 97av在线影院| 国产盗摄在线视频网站| 欧美成年人视频网站欧美| 午夜视频在线看| 这里只有精品久久| 国产三级电影在线| 国产一区二区三区在线播放免费观看| 色香蕉在线视频| 亚洲电影天堂av| 亚洲精品字幕在线观看| 91精品国产一区二区| 在线视频你懂得| 欧美区视频在线观看| 国产天堂第一区| 欧美午夜片在线观看| 波多野结衣大片| 在线观看91视频| 波多野结衣在线电影| 在线观看一区日韩| 久草热在线观看| 欧美精品精品一区| 国产女人高潮毛片| 日韩欧美国产一区二区三区 | 亚洲欧洲xxxx| 国产综合在线观看| 中国人与牲禽动交精品| 日本在线天堂| 蜜臀久久99精品久久久久久宅男| 免费av不卡| 欧美情侣性视频| 国产h片在线观看| 日本高清视频精品| 国产极品久久久久久久久波多结野| 国产精品久久一区| 欧美风情在线视频| 91中文字精品一区二区| 超碰精品在线| 欧美日本亚洲| 日韩在线观看一区| 国产精品啪啪啪视频| 91久久夜色精品国产九色| 欧美一级在线看| 久久精品国产秦先生| 香蕉视频xxxx| 99精品一区二区| 中文字幕伦理片| 亚洲精品视频在线观看免费| 国产精品第72页| 一本色道a无线码一区v| 一区二区 亚洲| 亚洲国产第一页| 牛牛澡牛牛爽一区二区| 色悠悠久久88| 成全电影大全在线观看| 国产成人高清激情视频在线观看| 国产麻豆一区| 国产精品一区二区av| 国产精选一区| 国产成人亚洲综合无码| 久久久久看片| 日韩高清一二三区| 国产丝袜欧美中文另类| 欧美爱爱小视频| 色综合天天综合网天天狠天天| 伊人网视频在线| 亚洲大胆美女视频| 欧美jizzhd欧美| 欧美亚洲激情视频| 视频欧美精品| 免费观看成人高| 亚洲精品一二三区区别| 日韩 欧美 高清| 国产精品123区| xxxx黄色片| 亚洲乱码国产乱码精品精98午夜| 黄色在线观看国产| 日韩欧美国产不卡| 成人精品一区二区三区免费| 韩国欧美亚洲国产| 日韩欧美激情| 欧美综合激情| 亚洲精品欧美| 欧美日韩久久婷婷| 国产亚洲精久久久久久| 亚洲视频免费播放| 6080日韩午夜伦伦午夜伦| 国产毛片在线| 91国产视频在线| 亚洲欧洲国产精品一区| 亚洲免费在线精品一区| 久久xxxx精品视频| 野战少妇38p| 亚洲欧美激情插| 中文在线免费观看| 亚洲欧美激情精品一区二区| 国产三级伦理在线| 亚洲最大福利视频网| 久久免费大视频| 午夜免费福利在线| 久久久久久久久久久久久久久99 | 免费国产自线拍一欧美视频| 中文字幕一区二区三区乱码不卡| 亚洲免费在线看| 97人妻人人澡人人爽人人精品| 有码中文亚洲精品| 成人精品电影在线| 欧美一区免费视频| 久久久久欧美精品| 一区二区黄色片| 色狠狠综合天天综合综合| 色视频在线观看| 欧美亚洲另类视频| 中日韩免视频上线全都免费| 欧日韩免费视频| 不卡一区二区中文字幕| 日韩成人在线免费视频| 亚洲精品av在线播放| 鲁鲁在线中文| 欧美黑人3p| 日韩精品欧美成人高清一区二区| 西西444www无码大胆| 在线欧美小视频| 8888四色奇米在线观看| 国产日韩av在线播放| 亚洲中无吗在线| wwwxxxx在线观看| 亚洲一区成人在线| 三级视频在线看| 欧美在线视频观看| 成人在线丰满少妇av| www.久久91| 亚洲精品日日夜夜| 欧美一级特黄aaaaaa| 97在线视频精品| 国产精品中文字幕亚洲欧美| 午夜视频你懂的| 亚洲婷婷综合色高清在线| 国产精品久久久久久免费免熟 | 黄色精品视频| 懂色av一区二区三区四区五区| 国产在线不卡视频| 国产无套粉嫩白浆内谢| 日韩精品在线视频美女| 国模视频一区| 男同互操gay射视频在线看| 国产**成人网毛片九色| 51国产偷自视频区视频| 日韩中文字幕视频| 91麻豆精品国产91久久久久推荐资源| 99热亚洲精品| 国产夜色精品一区二区av| 91精品国产色综合久久不8| 九九九热精品免费视频观看网站| 国产精品毛片视频| 成人免费无码av| 亚洲精品久久久久久国产精华液| 日本人妻熟妇久久久久久| 国产成人精品网站| 欧美日韩a区| 日本性高潮视频| 精品少妇一区二区三区视频免付费 | 黄色亚洲免费| 一区二区三区久久久久| 91精品国产欧美一区二区| 黄视频免费在线看| 中文字幕一区二区三区精彩视频| 国产99精品在线观看| 最近日韩免费视频| 久久久久久久久久久久久久久久久久av| 小说区图片区色综合区| 亚洲一区二区中文字幕在线观看| 精品久久香蕉国产线看观看gif| 色欧美激情视频在线| 久久久精品国产一区二区三区|