精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

字節Seed團隊發布循環語言模型Ouro,在預訓練階段直接「思考」,Bengio組參與

人工智能 新聞
字節 Seed 團隊聯合多家機構推出了 Ouro,一類被稱為循環語言模型(Looped Language Models)的新型預訓練模型,其名稱源于象征循環與自我吞噬的「銜尾蛇」(Ouroboros)。

現代 LLM 通常依賴顯式的文本生成過程(例如「思維鏈」)來進行「思考」訓練。這種策略將推理任務推遲到訓練后的階段,未能充分挖掘預訓練數據中的潛力。

為解決這一問題,字節 Seed 團隊聯合多家機構推出了 Ouro,一類被稱為循環語言模型(Looped Language Models)的新型預訓練模型,其名稱源于象征循環與自我吞噬的「銜尾蛇」(Ouroboros)。

Ouro 另辟蹊徑通過(i)在潛在空間中進行迭代計算,(ii)采用熵正則化目標以實現學習型深度分配,以及(iii)擴展至 7.7T tokens 的數據規模,將推理能力直接構建到了預訓練階段。 這些設計使得模型能夠在預訓練階段直接學習和構建推理能力,而非僅依賴后期微調。

  • 論文標題:Scaling Latent Reasoning via Looped Language Models 
  • 論文地址:https://arxiv.org/pdf/2510.25741
  • 項目主頁:https://ouro-llm.github.io/
  • HuggingFace:https://huggingface.co/collections/ByteDance/ouro

通過對照實驗,研究者發現 Ouro 的性能提升并非源于知識存儲量的增加,而是得益于其更高效的知識操控與推理能力。進一步分析表明,Ouro 的潛在推理過程相比標準 LLM,更接近真實的人類推理機制。

Ouro 循環語言模型的性能。(左)參數共享的循環架構。(中與右)雷達圖比較了 Ouro 1.4B 與 2.6B 模型(均采用 4 個循環步,紅色)與單獨的 Transformer 基線模型。我們的模型表現出強勁性能,可與更大規模的基線模型相媲美,甚至在部分任務上超越它們。

最終,Ouro 的 1.4B 和 2.6B 參數規模的 LoopLM,分別能在幾乎所有基準測試中達到與 4B 和 8B 標準 Transformer 相當的性能,實現了 2–3 倍的參數效率提升,顯示了其在數據受限時代下作為一種新型擴展路徑的潛力。

在高級推理基準測試中的表現。Ouro-Thinking 系列模型與強大的基線模型(如 Qwen3 和 DeepSeek-Distill)進行對比。Ouro-1.4B-Thinking R4 的性能可與 4B 規模模型相媲美,而 Ouro-2.6B-Thinking R4 在多個數學與科學數據集上的表現達到或超越了 8B 規模模型。

另外,LoopLM 架構在 HEx-PHI 基準上顯著降低了有害性,且隨著循環步數(包括外推步)增加,模型的安全性進一步提升。與傳統的 CoT 方法不同,研究者的迭代潛變量更新機制產生的是因果一致的推理過程,而非事后的合理化解釋。

循環架構

LoopLM 架構的靈感來源于「通用 Transformer」。其核心思想是在一個固定的參數預算內實現「動態計算」。具體而言,該架構包含一個由 N 個共享權重層組成的「層堆棧」。

在模型的前向傳播過程中,這個共享的層堆棧會被循環應用多次,即經歷多個「循環步驟」。這種設計將模型的計算規模從「參數數量」解耦到了「計算深度」。

該架構的關鍵特性是其自適應計算能力。它集成了一個學習到的「退出門」,當模型處理輸入時:簡單輸入可能會在經歷較少的循環步驟后就提前退出,從而節省計算資源;復雜輸入則會自然地被分配更多的迭代次數,以進行更深層的處理。

這種迭代重用被視為一種「潛在推理」。與 CoT 在外部生成顯式文本步驟不同,LoopLM 是在模型的內部隱藏狀態中構建了一個「潛在思想鏈」。每一次循環都是對表征的逐步精煉,從而在不增加參數的情況下提升了模型的知識操縱能力。

訓練流程

Ouro 的訓練流程是一個多階段過程,總共使用了 7.7T tokens 的數據。

如圖 4 所示,該流程始于一個通用的預熱階段,隨后是使用 3T token 的初始穩定訓練階段。在此之后,模型通過「upcycling」策略分支為 1.4B 和 2.6B 兩種參數規模的變體。

兩種變體均獨立經歷后續四個相同的訓練階段:第二次穩定訓練(3T token)、CT 退火(CT Annealing, 1.4T token)、用于長上下文的 LongCT(20B token)以及中途訓練(Mid-Training, 300B token)。

這個過程產生了 Ouro-1.4B 和 Ouro-2.6B 兩個基礎模型。最后,為了強化特定能力,模型還額外經歷了一個專門的推理監督微調階段,以創造出專注于推理的 Ouro-Thinking 系列模型。

在訓練穩定性方面,團隊發現最初使用 8 個循環步驟會導致損失尖峰等不穩定問題,因此在后續階段將循環步驟減少到 4,以此在計算深度和穩定性之間取得了平衡。

為了讓模型學會何時「提前退出」,訓練流程采用了新穎的兩階段目標:

循環語言模型架構概覽。

左圖為訓練階段。在訓練過程中,模型使用共享參數的 N 層堆疊結構,并執行 n 個循環步驟(R = 1 到 R = n)。在每個循環步驟 i,一個退出門預測退出概率 p?,而語言建模頭 L? 則計算對應的任務損失。 訓練目標函數結合了所有循環步驟的期望任務損失,并加入熵正則化項 H(p?,…,p?),以鼓勵模型探索不同的計算深度。

右圖為推理階段。在推理時,模型可根據由退出概率計算得到的累計分布函數(CDF)提前終止。當超過設定閾值時,模型將在第 i 個循環步驟停止,從而實現自適應計算:為復雜輸入分配更多循環步數,同時在簡單輸入上保持高效推理。圖中的虛線表示模型在提前退出后可能被跳過的后續步驟。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-11-04 16:02:42

模型訓練AI

2025-04-29 09:10:00

2025-06-13 09:29:51

2024-11-07 15:10:00

2025-08-05 09:02:00

2020-03-13 15:33:54

Google 開源技術

2025-11-07 09:28:08

2025-06-27 08:50:40

2022-06-16 19:53:51

AIAI模型

2025-06-19 10:09:55

2025-08-13 01:00:00

2025-08-21 10:14:18

2022-03-04 19:07:03

模型視覺人工智能

2024-01-03 18:53:13

語言模型LLM

2025-10-11 09:23:28

RLPT強化學習預訓練數據

2025-08-04 08:23:00

2017-08-28 21:31:37

TensorFlow深度學習神經網絡

2021-09-09 09:29:03

AI 數據模型

2025-08-12 15:19:32

字節跳動生成模型工具鏈

2024-01-29 00:24:07

圖像模型預訓練
點贊
收藏

51CTO技術棧公眾號

欧洲国内综合视频| 2021国产精品久久精品| 久久97久久97精品免视看| 激情综合激情五月| 欧美aaa视频| 亚洲情趣在线观看| 久久综合九色欧美狠狠| 91精品国产乱码久久| 亚洲午夜黄色| 最新国产精品拍自在线播放| 国产一精品一aⅴ一免费| 在线天堂新版最新版在线8| 中文字幕中文字幕中文字幕亚洲无线| 成人91免费视频| 最近中文字幕在线视频| 激情视频一区| 中文字幕日韩欧美在线视频| 91精品又粗又猛又爽| 成人综合网站| 欧美色道久久88综合亚洲精品| 亚洲一区影院| 青青久在线视频| 国产电影一区在线| 国产精品一区二区三区免费视频| 日本一区二区免费在线观看| 亚洲综合婷婷| 日韩亚洲欧美成人| 538精品视频| 天堂俺去俺来也www久久婷婷| 日韩一区二区免费视频| 艹b视频在线观看| 韩漫成人漫画| 黄色91在线观看| 国产成人一区二区三区别| 91九色在线porn| 久久蜜桃av一区精品变态类天堂| 成人激情av| 国产女主播福利| 精品午夜久久福利影院| 国产精品久久久久久久久久久久| 日韩中文在线中文网三级| 久久久久福利视频| 黄色网页在线观看| 国产精品久久久久久久久免费丝袜 | av免费播放网站| 国产成人1区| 日韩黄在线观看| 少妇一级淫免费观看| 极品国产人妖chinesets亚洲人妖| 欧美一区二区三区不卡| а 天堂 在线| 国产一区2区在线观看| 欧美精品在线视频| 亚洲一区二区三区四区精品| 精品一区二区三区亚洲| 日韩三级高清在线| 中文字幕在线观看91| 亚洲一区二区三区中文字幕在线观看| 欧美一区二区三区系列电影| 美女被艹视频网站| 91麻豆精品激情在线观看最新 | 欧美zozo| 国产亚洲一二三区| 欧美自拍资源在线| 成人av毛片| 国产精品高潮呻吟| 免费观看国产视频在线| 国产精品—色呦呦| 午夜av一区二区三区| 欧美日韩在线中文| 国产91在线精品| 宅男在线国产精品| www.四虎精品| 香蕉人人精品| 综合网中文字幕| 国产稀缺精品盗摄盗拍| 欧美粗暴jizz性欧美20| 久久久久久成人精品| 色网站在线播放| 国产模特av私拍大尺度| 日韩国产一区| 欧美成人午夜视频| 国产成人啪精品午夜在线观看| 在线亚洲免费| 国产美女直播视频一区| 国产夫妻在线观看| 26uuu亚洲综合色| 亚洲精品高清国产一线久久| 在线免费av导航| 精品国产户外野外| 在线观看的毛片| 视频精品一区| 亚洲欧美综合v| 我要看黄色一级片| 亚洲一卡久久| 亚洲一区二区三区视频播放| 污视频软件在线观看| 国产精品理论片| 人妻无码久久一区二区三区免费| 日本欧美韩国| 精品国产乱码久久久久久久| 久久婷婷五月综合| 国产精品多人| 国产欧美精品一区二区三区介绍| 蜜桃av鲁一鲁一鲁一鲁俄罗斯的 | 久久精品天堂| av噜噜色噜噜久久| av网站无病毒在线| 欧美视频在线观看免费网址| 欧美视频亚洲图片| 少妇精品久久久一区二区| 欧美激情在线观看视频| 亚洲综合免费视频| 久久欧美中文字幕| cao在线观看| 国产成年精品| 中文字幕在线日韩| 精品人妻一区二区三区潮喷在线| 丰满放荡岳乱妇91ww| 一本一道久久久a久久久精品91 | 国产精品mm| 国产情人节一区| 免费在线黄色电影| 午夜精品123| 先锋资源在线视频| 93在线视频精品免费观看| 国产成人精品电影久久久| 日本精品一区二区在线观看| 一区二区三区精品在线观看| 老司机久久精品| 成人在线免费观看网站| 日本在线精品视频| 无码h黄肉3d动漫在线观看| 一区二区三区四区激情| 精品人妻一区二区三区免费| 午夜国产一区二区| 成人激情在线观看| 日本亚洲精品| 91麻豆精品国产自产在线| 欧美色图17p| 毛片不卡一区二区| 亚洲蜜桃在线| 日韩成人综合网| 色婷婷综合成人| 中文字幕人妻互换av久久| 国产欧美日韩激情| wwwwww.色| 日韩黄色大片| 成人国产在线激情| 久久99精品久久久久久野外| 欧美福利视频导航| 乱h高h女3p含苞待放| 精品亚洲成a人| 日本道在线视频| 97精品久久| 91超碰中文字幕久久精品| 午夜视频在线免费播放| 日韩欧美成人区| 中文字幕黄色网址| 精品一区二区国语对白| 国产成人三级视频| 6080成人| 日本道色综合久久影院| av在线播放免费| 欧美日韩aaaaa| 国内偷拍精品视频| 不卡视频在线观看| 成人小视频在线看| 久久美女视频| 成人激情av| 欧美成人性网| 日韩亚洲在线观看| 成人免费视频国产免费麻豆| 红桃av永久久久| 精品熟妇无码av免费久久| 精品一区免费av| 精品国产av无码一区二区三区| 日本午夜精品久久久| 国产精品白丝jk喷水视频一区| 亚洲xxxxxx| 精品日韩在线观看| 91video| 亚洲欧美中日韩| 日本道中文字幕| 日本女人一区二区三区| 日韩欧美猛交xxxxx无码| 亚洲理论电影片| 91亚洲永久免费精品| www成人免费观看| 日韩中文字幕不卡视频| 色婷婷视频在线| 欧美精品在线一区二区三区| 91久久国产视频| 中文字幕一区二区三区在线不卡| 涩视频在线观看| 蜜臀av一级做a爰片久久| 精品国产av无码一区二区三区| 北条麻妃国产九九九精品小说| 亚洲综合在线小说| 电影亚洲一区| 午夜精品一区二区三区在线播放 | 国产最新免费视频| 91成人观看| 日韩福利视频| 激情小说一区| 97久久夜色精品国产九色| 香蕉成人av| 97视频网站入口| av观看在线| 久久精品电影一区二区| 免费在线高清av| 亚洲爱爱爱爱爱| 99久久久久久久| 欧美日韩一级二级| 日韩高清免费av| 亚洲久草在线视频| av在线免费播放网址| 久久久亚洲午夜电影| 人妖粗暴刺激videos呻吟| 国产在线视频不卡二| 欧美三级理论片| 蘑菇福利视频一区播放| 91九色丨porny丨国产jk| 女人香蕉久久**毛片精品| 五月天婷亚洲天综合网鲁鲁鲁| 亚洲黄页在线观看| 国语精品中文字幕| 岛国成人av| 俄罗斯精品一区二区| 国产精品国产亚洲精品| 国产欧美久久久久久| 欧美暴力调教| 国产精品高潮呻吟久久av无限| 忘忧草在线日韩www影院| 午夜精品福利视频| 韩国精品一区| 91国在线精品国内播放| 9765激情中文在线| 久久久久久久成人| 欧美日韩色网| 欧美激情一区二区三区久久久| 四虎影视国产在线视频| 久久91亚洲精品中文字幕奶水| 高清全集视频免费在线| 久久亚洲成人精品| caoporm免费视频在线| 粗暴蹂躏中文一区二区三区| www.在线视频| 欧美高跟鞋交xxxxhd| 蜜臀av在线播放| 国自在线精品视频| 日韩成人伦理| 午夜精品一区二区三区在线| 涩涩av在线| 国产精品91在线观看| 日韩成人亚洲| 91精品久久久久久久| 精品国模一区二区三区欧美 | www.蜜臀av.com| 精品sm在线观看| 午夜性色福利影院| 亚洲香蕉av在线一区二区三区| 91在线看黄| 九九九热精品免费视频观看网站| 丁香花在线电影小说观看| 91av视频在线观看| 成人四虎影院| 成人欧美一区二区三区在线观看| jizz性欧美23| 日本不卡一区二区三区视频| 欧美国产美女| 日韩精品在线观看av| 丝袜美腿高跟呻吟高潮一区| 在线观看av网页| 懂色一区二区三区免费观看| av无码av天天av天天爽| 国产精品素人视频| 国产亚洲精品码| 色999日韩国产欧美一区二区| 中文字幕有码视频| 精品国产一区a| 成人性爱视频在线观看| 伦伦影院午夜日韩欧美限制| 成人影院在线视频| 国产精品一区二区三区在线播放| 91九色鹿精品国产综合久久香蕉| 欧美韩国日本精品一区二区三区| 久久中文字幕av一区二区不卡| 国产aaa免费视频| 日本aⅴ亚洲精品中文乱码| 国产裸体视频网站| 国产午夜精品福利| 18精品爽视频在线观看| 欧美亚洲综合网| 蜜桃av噜噜一区二区三区麻豆| 亚洲性视频网站| 欧美1234区| 国产精品视频一区二区高潮| 国产精品调教| 在线观看一区欧美| 久久精品91| 美女伦理水蜜桃4| 综合在线观看色| 秋霞av一区二区三区| 欧美成人性战久久| av网站在线免费播放| 欧美在线免费视频| 成人性生交大片免费看96| 亚洲欧洲精品在线 | 97人人爽人人喊人人模波多| 久久天堂影院| 欧美日韩一区在线播放| 亚洲国产网站| 亚洲黄色小说在线观看| 国产精品久久久久影院亚瑟| 国产一级淫片a视频免费观看| 日韩片之四级片| 毛片av在线| 国产精品久久久999| 亚洲福利网站| 人妻夜夜添夜夜无码av| 国产福利精品一区| 午夜精品一区二区三级视频| 欧美午夜影院一区| 黄色的视频在线免费观看| 91精品国产色综合久久不卡98| 亚洲一区二区电影| 亚洲av综合色区| 国产一区二区三区日韩| 熟女少妇a性色生活片毛片| 在线区一区二视频| 欧美日韩国产亚洲沙发| 5278欧美一区二区三区| 久久影院资源站| 给我免费播放片在线观看| 国产91精品精华液一区二区三区| 老司机成人免费视频| 欧美区视频在线观看| 18视频免费网址在线观看| 国产精品丝袜一区二区三区| 凹凸成人精品亚洲精品密奴| wwwwxxxx日韩| 国产精品天干天干在线综合| 在线免费看91| 久久久精品日本| 视频一区在线| 青青草综合视频| 成人午夜视频在线| 日本熟女一区二区| 亚洲国产精品字幕| 欧美一级鲁丝片| 欧美日韩视频在线一区二区观看视频| 亚洲欧美日韩在线观看a三区| 特级西西人体wwwww| 日韩欧美a级成人黄色| 黄色小视频在线观看| 国产伦精品一区二区三区精品视频| 欧美国产一级| 欧美激情第四页| 亚洲国产视频直播| 亚州视频一区二区三区| 日韩av电影国产| 日本大胆欧美| 韩国三级与黑人| 欧美日韩国产一区在线| 欧美挠脚心网站| 国产日韩欧美电影在线观看| 这里只有精品在线| 手机在线成人av| 欧美影视一区二区三区| 在线电影福利片| 久久综合久久久| 久久精品二区亚洲w码| 久久久.www| 日韩精品有码在线观看| 欧洲午夜精品| 成人精品视频在线播放| 欧美国产成人在线| av网站在线观看免费| 91sao在线观看国产| 91一区在线| japanese在线观看| 欧美手机在线视频| 欧美色图天堂| 亚洲高清在线观看一区| 国产成人精品在线看| 亚洲婷婷综合网| 欧美成人精品xxx| 亚洲区小说区| 丰满少妇中文字幕| 色欧美88888久久久久久影院| 国产乱色在线观看| 久久本道综合色狠狠五月| 久久99精品国产.久久久久| 日韩av男人天堂| 最近的2019中文字幕免费一页| 国产精品成人自拍| 日韩大片一区二区| 午夜激情综合网| 成人片在线看|