精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

字節新推理模型逆襲DeepSeek,200B參數戰勝671B,豆包史詩級加強?

人工智能 新聞
字節Seed團隊聚焦大規模強化學習,并從三個角度提升了推理表現:數據、RL算法和RL基礎設施。

字節最新深度思考模型,在數學、代碼等多項推理任務中超過DeepSeek-R1了?而且參數規模更小。

同樣是MoE架構,字節新模型Seed-Thinking-v1.5有200B總參數和20B激活參數。

對比DeepSeek-R1的671B總參數和37B激活參數,可以算得上輕量級了。

圖片

目前,完整的技術報告已公開發布,其中揭示了諸多秘訣。

字節Seed團隊聚焦大規模強化學習,并從三個角度提升了推理表現:數據、RL算法和RL基礎設施。

圖片

可驗證與不可驗證問題

從數據開始說起,字節團隊把RL訓練數據分為兩個部分,具有明確答案的可驗證問題和沒有明確答案的不可驗證問題,采用不同的獎勵建模方法。

這其中,模型的推理能力主要來自可驗證問題,并可以推廣到不可驗證問題。

可驗證問題包括問題與答案配對的STEM問題、附帶單元測試的代碼問題,以及適合自動驗證的邏輯推理問題(24點、迷宮、數獨等)。

不可驗證問題主要包括根據人類偏好評估的非推理任務,如創意寫作、翻譯、知識QA、角色扮演等。

對于不可驗證問題,字節團隊丟棄了樣本分數方差低、難度低的數據。此類數據可能過于簡單或已在數據集中大量表示。離線實驗表明,過度優化此類樣本會導致模型的探索空間過早崩潰并降低性能。

此外,團隊還打造了全新數學推理評測集BeyondAIME。

當前的推理模型通常使用AIME作為評估數學推理能力的首選基準,但該基準每年只發布30個問題,有限的規模可能會導致高方差的評估結果,難以有效區分最先進的推理模型。

字節與數學專家合作,根據既定的比賽形式開發原創問題。通過結構修改和情景重新配置來系統地調整現有的比賽問題,確保不會發生直接重復。此外還確保答案不是容易猜的數值(例如問題陳述中明確提到的數字),以減少模型在沒有適當推理的情況下猜出正確答案的機會。

RL算法

強化學習雖然強大,但訓練起來也很不穩定,經常崩潰。

字節在技術報告中提到”有時,兩次運行之間的分數差異可能高達10分”。

針對這個問題,團隊提出了VAPO和DAPO兩個RL框架,分別從基于價值和無價值的RL范式出發來穩定訓練。

圖片

VAPO和DAPO兩篇論文都已單獨發布。

圖片

圖片

此外,在Seed-Thining-v1.5中,還借鑒了之前學術界工作中的很多關鍵技術:

  • 價值預訓練(Value-Pretraining),保證價值網絡和策略網絡一致
  • 解耦的GAE(Decoupled-GAE),讓兩個網絡更獨立高效
  • 長度自適應GAE(Length-adaptive GAE),更好處理不同長度序列
  • 解耦PPO損失(Clip-Higher),為低概率token的增長創造,了更多空間鼓勵模型探索新方案
  • Token級損失(Token-level Loss),平衡每個token對訓練過程的影響。
  • 正例增強(Postive Example LM Loss),提高RL訓練過程中正樣本的利用效率,從而提高模型整體性能

圖片

RL基礎設施

在Long-CoT生成過程中,字節團隊觀察到各種提示詞之間的響應長度差異較大,在生成過程中出現大量GPU空閑時間。

為了緩解長尾響應生成的滯后問題,提出了SRS(流式Rollout系統),一種資源感知型調度框架,可戰略性地部署獨立的流式計算單元,將系統約束從內存綁定轉換為計算綁定。

為了有效地大規模訓練,團隊還設計了一個混合分布式訓練框架,集成高級并行策略、動態工作負載平衡和內存優化:

  • 并行機制:將TP (張量并行)/EP (專家并行)/CP (上下文并行)與全分片數據并行 (FSDP) 組合在一起,具體來說,將TP/CP 應用于注意力層,將EP應用于 MoE 層。
  • 序列長度平衡:DP等級之間的有效序列長度可能不平衡,導致計算工作量不平衡和訓練效率低下。利用KARP算法在一個mini-batch內重新排列輸入序列,使它們在micro-batch之間保持平衡。
  • 內存優化:采用逐層重新計算、激活卸載和優化器卸載來支持更大micro-batch的訓練,以覆蓋FSDP引起的通信開銷。
  • 自動并行:為了實現最佳系統性能,開發了AutoTuner 自動調整系統,按照基于配置文件的解決方案 對內存使用情況進行建模。然后估計各種配置的性能和內存使用情況以獲得最優配置。
  • 檢查點:使用ByteCheckpoint支持從不同的分布式配置中以最小的開銷恢復檢查點,彈性訓練以提高集群效率。

圖片

最終,在多項自動評估中,Seed-Thinking-v1.5在AIME 2024基準測試中取得86.7,與OpenAI的o3-mini-high模型的性能相當。但在最近的AIME 2025和BeyondAIME中,Seed-Thinking-v1.5仍然落后于o3級別的性能。

對于GPQA任務,Seed-Thinking-v1.5達到77.3%的準確率,接近o3-mini-high的性能。

在Codeforces等代碼生成場景中,Seed-Thinking-v1.5的性能與Gemini 2.5 Pro 的性能相當,但仍落后于o3-mini-high。

Seed-Thinking-v1.5在SimpleQA上的表現不太理想。但團隊認為,該基準測試預訓練模型規模的相關性更強,而不是考驗推理能力。

圖片

許多人看完這篇技術報告,都很感興趣,不過找了一圈也沒找到模型在哪發布。

圖片

從技術報告的口徑來看,該模型與目前豆包中的Doubao-1.5 Pro并不是一回事。

但從作者名單看,這是由字節Seed團隊負責人吳永輝帶隊,主要成員都參與的大項目。

那么是否將來會部署到豆包APP,可以期待一波了。

圖片

論文地址:
https://github.com/ByteDance-Seed/Seed-Thinking-v1.5/

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-04-11 12:04:58

2025-03-10 07:00:00

阿里開源QwQ-32B

2025-06-17 08:45:00

模型智能工具

2025-03-07 08:30:00

2025-05-01 10:33:59

2025-03-06 08:11:25

2025-04-03 06:30:00

2025-09-02 10:20:10

2025-03-27 10:28:32

2025-04-03 15:57:48

2025-07-18 09:55:11

2025-08-04 08:51:00

2025-07-18 10:12:00

2025-04-11 14:54:44

2025-03-06 12:43:03

DeepSeek阿里推理模型

2025-08-25 09:03:00

2025-06-25 08:54:03

模型訓練AI
點贊
收藏

51CTO技術棧公眾號

成人在线视频网站| 亚洲天堂男人天堂| 成年人视频观看| 国产在线视频资源| 精品一二三四区| 久久久噜噜噜久久| 国产探花视频在线播放| 日韩精品视频在线看| 亚洲综合日韩| 中文字幕亚洲第一| 美女搡bbb又爽又猛又黄www| 欧美大片免费| 一区二区三区 在线观看视频| 国产精品视频入口| 国产又粗又黄又爽| 日韩一级精品| 久久福利网址导航| 久久久久久久毛片| 欧美成人专区| 日韩一区二区三区三四区视频在线观看 | 久久久久国产精品麻豆| 亚洲一区二区在线| 在线免费观看av片| 久久综合图片| 91av在线影院| www.99re7.com| 香蕉综合视频| 在线观看亚洲视频| 9.1成人看片| 99久热这里只有精品视频免费观看| 在线看日本不卡| 北条麻妃69av| bbw在线视频| 国产不卡免费视频| 91系列在线观看| 亚洲字幕av一区二区三区四区| 99亚洲一区二区| 欧美激情区在线播放| 久艹在线观看视频| 不卡一区视频| 欧美色国产精品| 国产男女激情视频| a黄色在线观看| 99精品视频在线免费观看| 99视频免费观看| 免费人成年激情视频在线观看| 欧美3p视频| 日韩欧美国产成人一区二区| 国产超碰在线播放| 欧美精选视频一区二区| 亚洲欧洲精品天堂一级| 亚洲精品在线视频观看| a级片在线免费看| 久久99国产精品免费| 国产精品久久久久久久久久ktv| 亚洲天堂一区在线| 神马午夜久久| 亚洲国产另类 国产精品国产免费| 欧美又粗又长又爽做受| 日韩少妇视频| 亚洲国产三级在线| 久在线观看视频| 日韩大片免费观看| 在线一区二区观看| 美女网站色免费| crdy在线观看欧美| 日韩女优av电影在线观看| 麻豆精品国产传媒| 裤袜国产欧美精品一区| 色综合久久88色综合天天6| 成人在线激情网| 国外成人福利视频| 欧美一区二区三区四区视频| 又色又爽又黄18网站| 老牛精品亚洲成av人片| 亚洲视频999| 男人女人拔萝卜视频| 风间由美性色一区二区三区四区| 亚洲二区中文字幕| a级大片在线观看| 日韩精品2区| 精品综合久久久久久97| 久久久午夜影院| 日本中文字幕一区二区有限公司| 成人网在线观看| www.五月激情| 91丨porny丨国产入口| 婷婷四月色综合| av在线看片| 日韩欧美亚洲成人| 一区二区三区视频网| 日韩精品一级| 亚洲性69xxxbbb| 91在线播放观看| 久久国产一二区| 3d精品h动漫啪啪一区二区| 国产黄色片网站| 91麻豆.com| 麻豆传媒网站在线观看| 高清不卡亚洲| 日韩一区二区免费视频| aa一级黄色片| 一区二区不卡| 爽爽爽爽爽爽爽成人免费观看| 国精品无码一区二区三区| 亚洲自拍另类| 99re在线国产| 2021av在线| 狠狠干狠狠久久| www,av在线| 精品久久久久久久久久久aⅴ| 另类视频在线观看| 波多野结衣激情视频| 成人午夜视频在线| 国产卡一卡二在线| 久久影视精品| 亚洲视频视频在线| 日韩精品一区二区av| 国产在线视频一区二区三区| 欧美日韩国产高清视频| 香蕉av一区二区三区| 亚洲人被黑人高潮完整版| 一区二区欧美日韩| 欧美激情喷水| 亚洲国产精品人人爽夜夜爽| 亚洲国产美女视频| 免费视频一区二区| 欧美日韩中文国产一区发布| 超碰在线网站| 日韩精品一区二区三区老鸭窝| 国产又粗又猛又爽又黄的视频小说| 免费国产自线拍一欧美视频| 国产精品国产三级欧美二区| av在线免费播放| 91精品免费在线| 午夜成人亚洲理伦片在线观看| 久久性天堂网| 欧美日产一区二区三区在线观看| 182在线视频观看| 日韩一区二区三区在线视频| 91高清免费观看| 激情图片小说一区| 成年人黄色在线观看| 国产资源一区| 久久久国产精品亚洲一区| 在线视频1卡二卡三卡| 欧美极品美女视频| 向日葵污视频在线观看| 日韩www.| 成人久久久久久| 中文在线免费| 色偷偷久久人人79超碰人人澡| 艳妇乳肉豪妇荡乳xxx| 亚洲人体大胆视频| 久久亚洲高清| 日韩av免费| 色偷偷av一区二区三区| 91福利在线观看视频| 亚洲欧洲精品一区二区精品久久久 | 久久久影院一区二区三区| 手机av在线| 尤物99国产成人精品视频| 夜夜躁很很躁日日躁麻豆| 亚洲欧洲精品一区二区三区| 日本一区二区三区在线免费观看| 欧美成人嫩草网站| 久久国产精品免费一区| 台湾佬中文娱乐久久久| 日韩中文有码在线视频| 国产成人三级在线播放| 天天综合网 天天综合色| 亚洲少妇久久久| 99精品视频在线观看免费播放 | 国产精品久久777777换脸| 亚洲免费观看高清完整版在线观看熊 | 亚洲v在线看| 粉嫩av免费一区二区三区| 毛片在线网站| 在线播放国产精品| www.爱爱.com| 色噜噜狠狠一区二区三区果冻| xxx中文字幕| 亚洲国产一区二区三区高清| 久久综合入口| 精品中文字幕一区二区三区| 亚洲午夜久久久久久久| 97国产精品久久久| 香蕉加勒比综合久久 | 亚洲色图在线看| 男人的天堂影院| 免费高清不卡av| 男女猛烈激情xx00免费视频| 欧美日韩国产免费观看视频| 91免费观看| 香蕉成人影院| 欧美激情图片区| 97超碰人人在线| 精品国产3级a| 亚洲专区第一页| 欧美日韩一区二区三区| 黄色片子在线观看| 久久久一区二区三区捆绑**| 欧美一区二区三区影院| 免费高清在线视频一区·| 大陆av在线播放| 围产精品久久久久久久| 就去色蜜桃综合| 999久久久精品一区二区| 国产精品久久久久久av下载红粉| 黄色大片在线| 久久伊人91精品综合网站| 久青草国产在线| 婷婷夜色潮精品综合在线| 波多野结衣家庭教师在线观看| 风间由美一区二区三区在线观看| 玩弄japan白嫩少妇hd| 亚洲国产日韩在线| 成人在线视频一区二区三区| 18国产精品| 欧美精品成人在线| 日本在线天堂| 影音先锋欧美精品| 精品视频二区| 日韩电影中文字幕在线| www久久久com| 91麻豆精品国产91久久久更新时间| 黄色免费av网站| 欧美午夜精品久久久久久久| 久久亚洲AV无码| 伊人婷婷欧美激情| 永久免费看片直接| 中文字幕亚洲区| 久久视频一区二区三区| 国产亚洲精品bt天堂精选| 国产制服丝袜在线| 26uuu国产电影一区二区| 欧洲一级黄色片| 99免费精品视频| 日本黄色动态图| 日日噜噜夜夜狠狠视频欧美人| www.xxx麻豆| 伊人久久婷婷| 日韩xxxx视频| 亚洲久色影视| 久久亚洲中文字幕无码| 99国产精品视频免费观看一公开 | 蜜桃伊人久久| 欧洲av无码放荡人妇网站| 国产精品毛片| 国产视频一区二区三区在线播放 | 激情小说欧美色图| 福利一区二区在线| 六十路息与子猛烈交尾| 久久亚洲一区二区三区明星换脸 | 性网爆门事件集合av| 日韩小视频在线观看专区| 国产高清视频免费| 精品欧美乱码久久久久久1区2区| 亚洲精品久久久久久动漫器材一区| 日韩丝袜情趣美女图片| 丰满人妻av一区二区三区| 亚洲国产福利在线| 蝌蚪视频在线播放| 精品国内产的精品视频在线观看| 搞黄网站在线观看| 欧美大片在线看免费观看| 91黄页在线观看| 青青久久av北条麻妃海外网| 亚洲不卡系列| 99精品欧美一区二区三区| 国产精品黄网站| 日本10禁啪啪无遮挡免费一区二区| 日韩理论在线| 成人免费在线视频播放| 噜噜噜在线观看免费视频日韩| 九九视频精品在线观看| 极品少妇一区二区| 手机在线成人av| 国产亚洲欧洲997久久综合| 永久av免费网站| 午夜视频一区二区| 久草热在线观看| 欧美成人r级一区二区三区| 亚洲人视频在线观看| 丝袜一区二区三区| 俺来俺也去www色在线观看| 国产成人高潮免费观看精品| 9999在线精品视频| 久草精品电影| 自拍日韩欧美| 茄子视频成人免费观看| 国产在线观看一区二区| 国产精品无码永久免费不卡| 亚洲欧美在线aaa| 亚洲熟女综合色一区二区三区| 欧美男人的天堂一二区| 色丁香婷婷综合久久| 色综合亚洲精品激情狠狠| av老司机免费在线| 国产这里只有精品| 亚洲另类春色校园小说| 中文字幕精品在线播放| 久久久噜噜噜| 亚洲美女在线播放| 亚洲欧美日韩国产综合| 69国产精品视频免费观看| 欧美成人午夜电影| 色开心亚洲综合| 青草热久免费精品视频| 盗摄系列偷拍视频精品tp| 亚洲人成网站在线播放2019| 亚洲视频www| xxxxwww一片| 中文字幕一区二区三区乱码在线| 国内自拍视频在线播放| 亚洲第一视频网站| 在线āv视频| 国产日韩在线一区| 欧洲杯足球赛直播| 女人和拘做爰正片视频| 国产91露脸合集magnet| 裸体武打性艳史| 欧美日本在线播放| 都市激情一区| 国产精品黄视频| 中文字幕精品影院| 噜噜噜久久亚洲精品国产品麻豆| 粉嫩av一区二区三区| 婷婷色中文字幕| 6080国产精品一区二区| 在线观看h片| 国产精品美女久久| 第一会所亚洲原创| 日韩av手机版| 国产精品五月天| 成人一二三四区| 伊人男人综合视频网| 欧美电影免费看| 视频三区二区一区| 日本vs亚洲vs韩国一区三区| 91成人精品一区二区| 欧美在线观看一区| 国产一区二区在线视频聊天| 亚洲一级黄色片| 亚洲第一会所001| 亚洲春色在线视频| 麻豆精品视频在线观看| 一级片黄色录像| 538在线一区二区精品国产| av在线中文| 国产自摸综合网| 亚洲精品小说| 久久久久无码国产精品一区李宗瑞| 亚洲一级二级在线| 无码国产精品96久久久久| 97久久超碰福利国产精品…| 日韩成人一级| 玩弄japan白嫩少妇hd| 国产精品乱码久久久久久| 91久久国语露脸精品国产高跟| www亚洲欧美| 成人福利免费在线观看| 波多野结衣家庭教师在线| 久久久国际精品| 亚洲最大成人在线视频| 欧美另类极品videosbest最新版本| 玖玖玖视频精品| 欧美 国产 日本| 中文字幕不卡在线观看| 99久久夜色精品国产亚洲| 久久久人成影片一区二区三区| 婷婷综合福利| 爱豆国产剧免费观看大全剧苏畅| 一区二区激情视频| 色天堂在线视频| 成人疯狂猛交xxx| 黄色成人在线网址| 五月天开心婷婷| 香蕉影视欧美成人| 91啦中文在线| 国产精品一区二区欧美| 久久在线精品| 欧美成欧美va| 亚洲小视频在线| 都市激情久久| 国产又大又黄又粗又爽| 亚洲在线免费播放| 国产三区四区在线观看| 成人性色av| 日韩二区三区在线观看| 国产一卡二卡在线播放| 一本色道久久综合狠狠躁篇的优点| 人人九九精品视频| 92看片淫黄大片一级| 亚洲精品久久久久久国产精华液| 五月天婷婷在线播放| 91视频九色网站| 日精品一区二区| 日韩成人免费在线视频| xx视频.9999.com|