精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

字節(jié)Seed團(tuán)隊(duì)發(fā)布循環(huán)語言模型Ouro,在預(yù)訓(xùn)練階段直接「思考」,Bengio署名

人工智能 新聞
字節(jié) Seed 團(tuán)隊(duì)聯(lián)合多家機(jī)構(gòu)推出了 Ouro,一類被稱為循環(huán)語言模型(Looped Language Models)的新型預(yù)訓(xùn)練模型,其名稱源于象征循環(huán)與自我吞噬的「銜尾蛇」(Ouroboros)。

現(xiàn)代 LLM 通常依賴顯式的文本生成過程(例如「思維鏈」)來進(jìn)行「思考」訓(xùn)練。這種策略將推理任務(wù)推遲到訓(xùn)練后的階段,未能充分挖掘預(yù)訓(xùn)練數(shù)據(jù)中的潛力。

為解決這一問題,字節(jié) Seed 團(tuán)隊(duì)聯(lián)合多家機(jī)構(gòu)推出了 Ouro,一類被稱為循環(huán)語言模型(Looped Language Models)的新型預(yù)訓(xùn)練模型,其名稱源于象征循環(huán)與自我吞噬的「銜尾蛇」(Ouroboros)。

Ouro 另辟蹊徑通過(i)在潛在空間中進(jìn)行迭代計(jì)算,(ii)采用熵正則化目標(biāo)以實(shí)現(xiàn)學(xué)習(xí)型深度分配,以及(iii)擴(kuò)展至 7.7T tokens 的數(shù)據(jù)規(guī)模,將推理能力直接構(gòu)建到了預(yù)訓(xùn)練階段。 這些設(shè)計(jì)使得模型能夠在預(yù)訓(xùn)練階段直接學(xué)習(xí)和構(gòu)建推理能力,而非僅依賴后期微調(diào)。

  • 論文標(biāo)題:Scaling Latent Reasoning via Looped Language Models 
  • 論文地址:https://arxiv.org/pdf/2510.25741
  • 項(xiàng)目主頁:https://ouro-llm.github.io/
  • HuggingFace:https://huggingface.co/collections/ByteDance/ouro

通過對(duì)照實(shí)驗(yàn),研究者發(fā)現(xiàn) Ouro 的性能提升并非源于知識(shí)存儲(chǔ)量的增加,而是得益于其更高效的知識(shí)操控與推理能力。進(jìn)一步分析表明,Ouro 的潛在推理過程相比標(biāo)準(zhǔn) LLM,更接近真實(shí)的人類推理機(jī)制。

Ouro 循環(huán)語言模型的性能。(左)參數(shù)共享的循環(huán)架構(gòu)。(中與右)雷達(dá)圖比較了 Ouro 1.4B 與 2.6B 模型(均采用 4 個(gè)循環(huán)步,紅色)與單獨(dú)的 Transformer 基線模型。我們的模型表現(xiàn)出強(qiáng)勁性能,可與更大規(guī)模的基線模型相媲美,甚至在部分任務(wù)上超越它們。

最終,Ouro 的 1.4B 和 2.6B 參數(shù)規(guī)模的 LoopLM,分別能在幾乎所有基準(zhǔn)測(cè)試中達(dá)到與 4B 和 8B 標(biāo)準(zhǔn) Transformer 相當(dāng)?shù)男阅埽瑢?shí)現(xiàn)了 2–3 倍的參數(shù)效率提升,顯示了其在數(shù)據(jù)受限時(shí)代下作為一種新型擴(kuò)展路徑的潛力。

在高級(jí)推理基準(zhǔn)測(cè)試中的表現(xiàn)。Ouro-Thinking 系列模型與強(qiáng)大的基線模型(如 Qwen3 和 DeepSeek-Distill)進(jìn)行對(duì)比。Ouro-1.4B-Thinking R4 的性能可與 4B 規(guī)模模型相媲美,而 Ouro-2.6B-Thinking R4 在多個(gè)數(shù)學(xué)與科學(xué)數(shù)據(jù)集上的表現(xiàn)達(dá)到或超越了 8B 規(guī)模模型。

另外,LoopLM 架構(gòu)在 HEx-PHI 基準(zhǔn)上顯著降低了有害性,且隨著循環(huán)步數(shù)(包括外推步)增加,模型的安全性進(jìn)一步提升。與傳統(tǒng)的 CoT 方法不同,研究者的迭代潛變量更新機(jī)制產(chǎn)生的是因果一致的推理過程,而非事后的合理化解釋。

循環(huán)架構(gòu)

LoopLM 架構(gòu)的靈感來源于「通用 Transformer」。其核心思想是在一個(gè)固定的參數(shù)預(yù)算內(nèi)實(shí)現(xiàn)「動(dòng)態(tài)計(jì)算」。具體而言,該架構(gòu)包含一個(gè)由 N 個(gè)共享權(quán)重層組成的「層堆棧」。

在模型的前向傳播過程中,這個(gè)共享的層堆棧會(huì)被循環(huán)應(yīng)用多次,即經(jīng)歷多個(gè)「循環(huán)步驟」。這種設(shè)計(jì)將模型的計(jì)算規(guī)模從「參數(shù)數(shù)量」解耦到了「計(jì)算深度」。

該架構(gòu)的關(guān)鍵特性是其自適應(yīng)計(jì)算能力。它集成了一個(gè)學(xué)習(xí)到的「退出門」,當(dāng)模型處理輸入時(shí):簡(jiǎn)單輸入可能會(huì)在經(jīng)歷較少的循環(huán)步驟后就提前退出,從而節(jié)省計(jì)算資源;復(fù)雜輸入則會(huì)自然地被分配更多的迭代次數(shù),以進(jìn)行更深層的處理。

這種迭代重用被視為一種「潛在推理」。與 CoT 在外部生成顯式文本步驟不同,LoopLM 是在模型的內(nèi)部隱藏狀態(tài)中構(gòu)建了一個(gè)「潛在思想鏈」。每一次循環(huán)都是對(duì)表征的逐步精煉,從而在不增加參數(shù)的情況下提升了模型的知識(shí)操縱能力。

訓(xùn)練流程

Ouro 的訓(xùn)練流程是一個(gè)多階段過程,總共使用了 7.7T tokens 的數(shù)據(jù)。

如圖 4 所示,該流程始于一個(gè)通用的預(yù)熱階段,隨后是使用 3T token 的初始穩(wěn)定訓(xùn)練階段。在此之后,模型通過「upcycling」策略分支為 1.4B 和 2.6B 兩種參數(shù)規(guī)模的變體。

兩種變體均獨(dú)立經(jīng)歷后續(xù)四個(gè)相同的訓(xùn)練階段:第二次穩(wěn)定訓(xùn)練(3T token)、CT 退火(CT Annealing, 1.4T token)、用于長(zhǎng)上下文的 LongCT(20B token)以及中途訓(xùn)練(Mid-Training, 300B token)。

這個(gè)過程產(chǎn)生了 Ouro-1.4B 和 Ouro-2.6B 兩個(gè)基礎(chǔ)模型。最后,為了強(qiáng)化特定能力,模型還額外經(jīng)歷了一個(gè)專門的推理監(jiān)督微調(diào)階段,以創(chuàng)造出專注于推理的 Ouro-Thinking 系列模型。

在訓(xùn)練穩(wěn)定性方面,團(tuán)隊(duì)發(fā)現(xiàn)最初使用 8 個(gè)循環(huán)步驟會(huì)導(dǎo)致?lián)p失尖峰等不穩(wěn)定問題,因此在后續(xù)階段將循環(huán)步驟減少到 4,以此在計(jì)算深度和穩(wěn)定性之間取得了平衡。

為了讓模型學(xué)會(huì)何時(shí)「提前退出」,訓(xùn)練流程采用了新穎的兩階段目標(biāo):

循環(huán)語言模型架構(gòu)概覽。

左圖為訓(xùn)練階段。在訓(xùn)練過程中,模型使用共享參數(shù)的 N 層堆疊結(jié)構(gòu),并執(zhí)行 n 個(gè)循環(huán)步驟(R = 1 到 R = n)。在每個(gè)循環(huán)步驟 i,一個(gè)退出門預(yù)測(cè)退出概率 p?,而語言建模頭 L? 則計(jì)算對(duì)應(yīng)的任務(wù)損失。 訓(xùn)練目標(biāo)函數(shù)結(jié)合了所有循環(huán)步驟的期望任務(wù)損失,并加入熵正則化項(xiàng) H(p?,…,p?),以鼓勵(lì)模型探索不同的計(jì)算深度。

右圖為推理階段。在推理時(shí),模型可根據(jù)由退出概率計(jì)算得到的累計(jì)分布函數(shù)(CDF)提前終止。當(dāng)超過設(shè)定閾值時(shí),模型將在第 i 個(gè)循環(huán)步驟停止,從而實(shí)現(xiàn)自適應(yīng)計(jì)算:為復(fù)雜輸入分配更多循環(huán)步數(shù),同時(shí)在簡(jiǎn)單輸入上保持高效推理。圖中的虛線表示模型在提前退出后可能被跳過的后續(xù)步驟。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2025-11-05 08:53:45

語言模型訓(xùn)練AI

2025-04-29 09:10:00

2025-06-13 09:29:51

2024-11-07 15:10:00

2025-08-05 09:02:00

2020-03-13 15:33:54

Google 開源技術(shù)

2025-11-07 09:28:08

2025-06-27 08:50:40

2022-06-16 19:53:51

AIAI模型

2025-06-19 10:09:55

2025-08-13 01:00:00

2025-08-21 10:14:18

2022-03-04 19:07:03

模型視覺人工智能

2024-01-03 18:53:13

語言模型LLM

2025-10-11 09:23:28

RLPT強(qiáng)化學(xué)習(xí)預(yù)訓(xùn)練數(shù)據(jù)

2025-08-04 08:23:00

2017-08-28 21:31:37

TensorFlow深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)

2021-09-09 09:29:03

AI 數(shù)據(jù)模型

2025-08-12 15:19:32

字節(jié)跳動(dòng)生成模型工具鏈

2024-01-29 00:24:07

圖像模型預(yù)訓(xùn)練
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

中文字幕视频二区| www.欧美黄色| 一级黄色在线视频| 国产成人一区| 在线不卡a资源高清| 亚洲日本无吗高清不卡| 国产尤物视频在线观看| 欧美国内亚洲| 精品视频久久久| 日本免费色视频| 日本在线视频网址| 波波电影院一区二区三区| 欧美国产日韩一区| 国产精品jizz| 日韩综合久久| 亚洲午夜羞羞片| 欧美一级二级三级九九九| 成年人视频免费| 黄色综合网站| 自拍偷拍亚洲精品| av电影在线播放| 国产激情久久| 欧美日韩一区二区在线| 中文字幕剧情在线观看一区| 久久久久久久免费| 中文在线字幕观看| 天堂а√在线最新版中文在线| 中文文精品字幕一区二区| 不卡视频一区二区三区| 波多野结衣人妻| 国产精品地址| 中文字幕欧美日韩va免费视频| 性折磨bdsm欧美激情另类| 日韩毛片免费观看| 亚洲一区二区三区在线播放| 色狠狠久久av五月综合|| 东京干手机福利视频| 青娱乐精品在线视频| 91福利视频网| 久草视频在线资源站| 欧美一区二区三区高清视频| 亚洲电影天堂av| 国产裸体免费无遮挡| sm性调教片在线观看| 1000部国产精品成人观看| 欧美精品成人一区二区在线观看 | 亚洲在线免费观看视频| 午夜精品婷婷| 日韩中文字幕国产| 右手影院亚洲欧美| 久久久久观看| 精品国产91亚洲一区二区三区婷婷| 亚欧无线一线二线三线区别| 色婷婷视频在线观看| 久久亚洲一区二区三区明星换脸 | 亚洲不卡视频| 69久久夜色精品国产69蝌蚪网 | 激情欧美国产欧美| 久久影院资源网| 婷婷综合在线视频| 精品日韩毛片| 国产一区二区日韩精品欧美精品| 朝桐光av一区二区三区| 高清日韩欧美| av网址在线| 91在线看国产| 精品国产一二| 天堂av电影在线观看| 成人午夜av电影| 丁香婷婷久久久综合精品国产| 国产黄色大片网站| 福利电影一区二区| 国产精品9999久久久久仙踪林| 99国产精品99| 狠狠色综合日日| 91精品视频免费| www.麻豆av| 成人免费高清视频在线观看| 国产精品国产一区二区| 999久久久久| 成人av免费观看| 久久久久高清| 成人三级黄色免费网站| 亚洲国产精品t66y| 在线观看福利一区| 羞羞视频在线观看不卡| 一区二区三区精品在线观看| 国产精品va在线观看无码| av在线私库| 色婷婷久久久久swag精品| 日本熟妇人妻中出| **国产精品| 日韩欧美精品三级| 天堂久久久久久| 欧美日韩亚洲在线观看| 久久久精品日本| 懂色av.com| 免费一级欧美片在线观看| 成人免费黄色网| 亚洲精品久久久久久久久久久久久久| 激情都市一区二区| 好吊妞www.84com只有这里才有精品| 无码国产色欲xxxx视频| 久久久久久久久久久黄色| 可以在线看黄的网站| 日韩精品影院| 精品国产凹凸成av人网站| 日韩黄色中文字幕| 亚洲伦理一区| 99精品欧美一区二区三区| 黄色片视频在线观看| 岛国在线视频免费看| 国产日韩欧美亚洲| 天堂8在线天堂资源bt| 免费在线成人激情电影| 亚洲国产小视频在线观看| 久久精品在线观看视频| 免播放器亚洲| 国产精品一区二区免费看| 日本中文字幕在线看| 色哟哟国产精品免费观看| 国产精九九网站漫画| 欧美高清在线| 国产精品久久久久久久电影| 天天av综合网| 午夜视频一区二区三区| 免费人成视频在线播放| 欧美电影《轻佻寡妇》| 国产成人拍精品视频午夜网站 | 精品免费av一区二区三区| 日韩av影院在线观看| 国产精品7777| 国产高清久久久久| 宅男一区二区三区| 农村妇女一区二区| 一本大道久久加勒比香蕉| 国产毛片aaa| av不卡一区二区三区| 日韩视频在线视频| 亚洲码欧美码一区二区三区| 操日韩av在线电影| 国产手机视频在线| 亚洲精品乱码久久久久| 久久人人爽人人片| 欧美+日本+国产+在线a∨观看| 国产在线高清精品| 青青影院在线观看| 欧美日本在线一区| 国精产品一区一区二区三区mba| 美国av一区二区| 亚洲人成影视在线观看| 欧美性www| 久久精品视频导航| 99精品久久久久久中文字幕 | 狠狠躁夜夜躁人人爽天天高潮| 丰满少妇久久久久久久| 国产一区二区片| 99亚洲乱人伦aⅴ精品| 欧美精品videossex性护士| 性生交大片免费看女人按摩| 国产精品久久久久久久久久10秀| 亚洲成av人**亚洲成av**| 日韩精品在线播放视频| 午夜视频一区| 国产三区精品| 久久青青视频| 最近2019免费中文字幕视频三| 中文字幕日韩经典| 亚洲猫色日本管| 欧美熟妇精品一区二区蜜桃视频| 一区二区三区国产盗摄| 秋霞久久久久久一区二区| 精品自拍视频| 欧美激情在线一区| 日本国产在线| 欧美日韩国产精选| 国产性生活网站| 久久精品亚洲一区二区三区浴池| 欧美一级xxxx| 一区在线视频观看| 欧洲精品一区色| 中文成人在线| 2023亚洲男人天堂| 日本大片在线观看| 91精品国产综合久久福利| 国产性xxxx高清| 中国av一区二区三区| 九色91porny| 视频一区视频二区中文| 大地资源第二页在线观看高清版| 懂色av一区二区| 国产精品视频男人的天堂| 免费电影网站在线视频观看福利| 亚洲欧美另类中文字幕| 国产精品久久免费| 欧美午夜视频一区二区| 亚洲天堂网av在线| 91免费小视频| 成年人性生活视频| 日韩电影在线免费看| 97碰在线视频| 999精品在线| 免费成人av网站| 日韩精品视频一区二区三区| 日韩av日韩在线观看| 午夜伦理大片视频在线观看| 国产一区二区免费| 日韩一区免费视频| 91精品久久久久久久91蜜桃| 国产www在线| 一区二区三区在线观看国产 | 国产精品久久久久久久久图文区 | 国产va免费精品高清在线观看| av网站在线看| 中文字幕亚洲欧美日韩2019| 色哟哟中文字幕| 91精品在线麻豆| 糖心vlog精品一区二区| 欧美日韩国产一中文字不卡| 国产女人18水真多毛片18精品| 久久久久国产精品人| 国产a级片视频| 国产伦精品一区二区三区在线观看| aaa毛片在线观看| 国产视频一区在线观看一区免费| 亚洲色婷婷久久精品av蜜桃| 欧美激情黄色片| 日韩一区二区电影在线观看| 亚洲三级精品| 麻豆精品蜜桃一区二区三区| 乱亲女h秽乱长久久久| 97操在线视频| 日韩免费高清视频网站| 成人综合网网址| 久久69成人| 国产精品丝袜久久久久久高清| 性欧美hd调教| 秋霞av国产精品一区| 日韩伦理精品| 欧美孕妇性xx| 偷拍视频一区二区三区| 国产999精品久久久| 国产精品迅雷| 国产成人综合av| 欧美xx视频| 国产成人一区二区三区电影| 日本欧美一区| 国产色综合天天综合网 | 91麻豆精品国产91久久久久| 亚洲系列在线观看| 欧美美女激情18p| 99精品视频免费看| 欧美不卡在线视频| 日本黄色一区二区三区| 亚洲精品电影在线| 日韩三级电影网| 正在播放欧美一区| 日p在线观看| 久久91精品国产91久久跳| 日本动漫同人动漫在线观看| 欧美高清性猛交| 爱啪啪综合导航| 日本久久久久亚洲中字幕| 日韩欧美精品一区二区综合视频| 国产精品亚洲美女av网站| 日本电影久久久| 亚洲在线一区二区| 成人午夜三级| 日韩黄色影视| 天天综合久久| 男人天堂手机在线视频| 免费视频一区| 精品久久久99| 成人免费观看av| www在线观看免费视频| 国产精品久久久久久久久免费相片| 男人的天堂久久久| 精品福利视频导航| 中国老头性行为xxxx| 日韩欧美国产小视频| 香蕉国产在线视频| www.日本久久久久com.| 精品精品导航| 国产精品劲爆视频| 9999久久久久| 日本日本精品二区免费| 女同性一区二区三区人了人一 | 永久免费在线看片视频| 亚洲少妇一区| 亚洲色图偷拍视频| 91在线观看高清| 无码人妻精品中文字幕 | 国产又黄又大又爽| 亚洲а∨天堂久久精品9966| av免费观看一区二区| 欧美极品美女视频网站在线观看免费| 国精产品一区二区三区有限公司| 97av自拍| 国产精品成久久久久| 国产肥臀一区二区福利视频| 国产精品一区二区x88av| 91视频免费观看网站| 一区二区三区 在线观看视频| 69av视频在线观看| 亚洲成avwww人| 黄色大片在线播放| 国产精品久久久久国产a级| 国产精品任我爽爆在线播放| 中文字幕中文字幕在线中心一区| 免费在线日韩av| youjizz.com国产| 亚洲免费观看高清完整版在线| 国产又粗又猛又爽又| 亚洲精品aⅴ中文字幕乱码| 成人免费视屏| 国产精品视频yy9099| 亚洲区小说区图片区qvod按摩| 成年人视频网站免费| 国产一区二区美女| 亚洲欧美日韩第一页| 色av成人天堂桃色av| 五月婷婷六月丁香| 久久久女人电视剧免费播放下载| 亚洲成人精品综合在线| 亚洲国产日韩美| 久久这里有精品15一区二区三区| 亚洲调教欧美在线| 亚洲国产精品影院| 亚洲毛片在线播放| 欧美国产极速在线| 久久国产精品美女| 99久re热视频精品98| 国精产品一区一区三区mba视频| 91视频免费看片| 欧美日韩免费一区二区三区 | 亚洲欧美国产77777| 一级黄在线观看| 日韩中文字幕不卡视频| 日本中文字幕视频一区| 中文视频一区视频二区视频三区| 美国十次了思思久久精品导航| 欧美a在线播放| 欧美理论片在线| 日本黄色片在线观看| 91视频国产高清| 伊人情人综合网| 9191在线视频| 亚洲影视资源网| 秋霞网一区二区| 91成人性视频| 精品一二三区| 中文字幕第17页| 亚洲人成网站色在线观看| av 一区二区三区| 欧美精品第一页在线播放| 国产福利资源一区| 久久精品免费一区二区| 国产性色一区二区| 在线观看国产成人| 大胆人体色综合| 超碰成人免费| 97在线免费公开视频| 国产日韩欧美亚洲| 国产又大又粗又长| 久久久久久97| 久草在线成人| 想看黄色一级片| 亚欧色一区w666天堂| 欧美人体大胆444www| 国产精品视频网址| 亚洲调教视频在线观看| 无码人妻aⅴ一区二区三区| 欧美一a一片一级一片| 精品国产白色丝袜高跟鞋| 国产精品久久精品国产| 欧美一级一区| 欧美黄色aaa| 国产婷婷成人久久av免费高清 | 国产精品自拍首页| 欧美亚洲在线| 亚洲国产精品免费在线观看| 亚洲成人黄色在线| 日本一区二区电影| 亚洲精品蜜桃久久久久久| 国产欧美精品一区二区三区四区 | 9l亚洲国产成人精品一区二三| 无码人妻h动漫| 亚洲欧美电影一区二区| 少妇av一区二区| 成人xxxxx| 鲁大师成人一区二区三区| 极品色av影院| 亚洲男人的天堂网站| 麻豆一区在线| 人人爽人人av| 天天综合网 天天综合色| 麻豆视频在线播放| 欧美日本亚洲| 成人午夜在线播放| 91av久久久|