精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

預(yù)訓(xùn)練就學(xué)會(huì)思考!字節(jié)、北大等用14億參數(shù),撬動(dòng)百億模型推理能力

人工智能 新聞
Ouro的探索確立了循環(huán)深度作為繼模型大小和數(shù)據(jù)規(guī)模之后的第三個(gè)擴(kuò)展軸,為人工智能的未來發(fā)展提供了新的思路。

你沒聽錯(cuò),讓模型在預(yù)訓(xùn)練階段就開始思考。

字節(jié),加州大學(xué),普林斯頓大學(xué),蒙特利爾大學(xué),北京大學(xué),卡內(nèi)基梅隆大學(xué)等等一眾頂尖學(xué)府、研究機(jī)構(gòu)聯(lián)合發(fā)布了一種語言模型的全新范式:Ouro模型。

Ouro模型用14億參數(shù)實(shí)現(xiàn)了百億級(jí)模型的推理能力,核心在于它在預(yù)訓(xùn)練階段就學(xué)會(huì)了循環(huán)思考。

大語言模型的推理能力,大多通過類似思維鏈(Chain-of-Thought, CoT)的方法在后天訓(xùn)練中生成冗長的文本來實(shí)現(xiàn)。

這種方式像是讓模型事后諸葛,而非在學(xué)習(xí)之初就內(nèi)化推理能力。

Ouro模型,其名取自銜尾蛇(Ouroboros)的自我吞食與循環(huán)意象,代表了一種全新的范式:循環(huán)語言模型(Looped Language Models, LoopLM)。

它通過三大創(chuàng)新,將推理能力直接構(gòu)建于預(yù)訓(xùn)練階段。

這三大創(chuàng)新分別是:在潛在空間中進(jìn)行迭代計(jì)算,好比讓模型反復(fù)咀嚼問題;引入熵正則化目標(biāo),以學(xué)習(xí)如何為不同難度的問題分配恰當(dāng)?shù)乃伎忌疃?;以及將?xùn)練數(shù)據(jù)擴(kuò)展到驚人的7.7萬億tokens。

結(jié)果是,Ouro僅用14億和26億參數(shù)的模型,就在各項(xiàng)基準(zhǔn)測試中,達(dá)到了與參數(shù)量高達(dá)120億的業(yè)界頂尖模型相匹配的性能。

實(shí)驗(yàn)證明,這種優(yōu)勢并非源于模型記住了更多知識(shí),而是它更擅長操作和運(yùn)用知識(shí)。

它的推理軌跡也比思維鏈更忠實(shí)于最終答案,更像是真正的因果推理,而非事后找補(bǔ)的合理解釋。

讓模型在預(yù)訓(xùn)練中學(xué)會(huì)循環(huán)思考

循環(huán)語言模型的概念并非橫空出世,其思想源頭可以追溯到2018年的通用變換器(Universal Transformer, UT)。

UT模型證明了讓一個(gè)神經(jīng)網(wǎng)絡(luò)模塊循環(huán)處理信息是可行的,它結(jié)合了傳統(tǒng)變換器模型的并行處理能力和循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的歸納偏置。

UT甚至在理論上被證明是圖靈完備的,為后續(xù)研究奠定了基礎(chǔ)。

Ouro正是在這一思想上的一次巨大飛躍。

它的架構(gòu)并不復(fù)雜,核心是一個(gè)參數(shù)共享的循環(huán)結(jié)構(gòu)。

相同的變換器模塊(transformer block)被循環(huán)調(diào)用,模型得以在不顯著增加參數(shù)量的前提下,通過迭代加深計(jì)算,實(shí)現(xiàn)更深層次的推理。

Ouro模型通常使用4個(gè)循環(huán)步驟,這在參數(shù)效率上達(dá)到了一個(gè)極佳的平衡點(diǎn)。

為保證這種深度循環(huán)計(jì)算的穩(wěn)定性,Ouro在架構(gòu)上做了一些精巧的設(shè)計(jì)。

它采用了旋轉(zhuǎn)位置嵌入(RoPE)、SwiGLU激活函數(shù),以及一種三明治式的層歸一化結(jié)構(gòu)(RMSNorm),這些都有助于在多輪迭代中維持穩(wěn)定的梯度流。

Ouro模型最巧妙的設(shè)計(jì)之一是自適應(yīng)計(jì)算機(jī)制。

模型在每一輪循環(huán)時(shí),都會(huì)通過一個(gè)退出門來判斷,當(dāng)前的思考深度是否已經(jīng)足夠。簡單問題可能循環(huán)1-2次就得出答案,而復(fù)雜問題則會(huì)進(jìn)入更深的循環(huán)。這讓模型能根據(jù)輸入難度動(dòng)態(tài)分配計(jì)算資源。

為了讓這個(gè)退出門學(xué)會(huì)明智地決策,研究團(tuán)隊(duì)引入了熵正則化的訓(xùn)練目標(biāo)。

若沒有約束,模型可能會(huì)陷入一種惰性模式,要么過早退出,要么總是循環(huán)到最大深度。熵正則化就像一個(gè)懲罰項(xiàng),它鼓勵(lì)模型的退出決策保持一定的多樣性,避免模型坍縮到某個(gè)固定的思考深度,從而更好地平衡探索(嘗試不同深度)與利用(選擇最優(yōu)深度)。

這個(gè)過程在7.7萬億tokens的海量數(shù)據(jù)上,通過四個(gè)精心設(shè)計(jì)的階段完成。

從使用網(wǎng)頁通用語料庫進(jìn)行基礎(chǔ)預(yù)訓(xùn)練,到使用高質(zhì)量數(shù)據(jù)集進(jìn)行持續(xù)訓(xùn)練和退火,再到專門的長上下文訓(xùn)練,最后是整合了20多種高質(zhì)量數(shù)據(jù)集的中期訓(xùn)練。

整個(gè)流程不僅塑造了模型的基礎(chǔ)能力,還通過一系列工程上的調(diào)整,如減少循環(huán)步數(shù)、擴(kuò)大批量大小,確保了這種新型循環(huán)架構(gòu)訓(xùn)練過程的穩(wěn)定收斂。

小模型也能辦大事

經(jīng)過大規(guī)模預(yù)訓(xùn)練的Ouro模型,在參數(shù)效率上展現(xiàn)了驚人的成果。

Ouro 1.4B模型,僅有14億參數(shù),在多數(shù)基準(zhǔn)測試中的表現(xiàn)與40億參數(shù)的Qwen3-Base模型相當(dāng)。特別是在數(shù)學(xué)和推理等高難度任務(wù)上,它的表現(xiàn)甚至更優(yōu),例如在GSM8K測試中得分78.92,而Qwen3-Base是72.86。

參數(shù)量稍大的Ouro 2.6B模型,則在推理密集型任務(wù)上全面超越了高達(dá)80億參數(shù)的密集型模型。它在MMLU-Pro(一個(gè)更專業(yè)的知識(shí)評(píng)測)上得分55.73,BBH(大型語言模型行為評(píng)估)上得分80.46,均超過了80億參數(shù)的Qwen3-Base模型。

表格數(shù)據(jù)清晰地顯示,Ouro模型實(shí)現(xiàn)了2到3倍的參數(shù)效率提升。這意味著在資源受限的環(huán)境,如移動(dòng)設(shè)備上,可以用更小的模型實(shí)現(xiàn)更強(qiáng)的性能。

研究團(tuán)隊(duì)通過合成任務(wù)進(jìn)行的對照實(shí)驗(yàn)揭示了這種效率提升的來源。

循環(huán)和非循環(huán)模型在存儲(chǔ)原始知識(shí)方面的能力相近,但Ouro在需要組合事實(shí)、進(jìn)行多步推理的任務(wù)上表現(xiàn)出了壓倒性優(yōu)勢。它的強(qiáng)大之處不在于知道更多,而在于會(huì)用已知。

潛在推理優(yōu)于“紙上談兵”

Ouro的成功,本質(zhì)上是潛在推理(Latent Reasoning)范式對傳統(tǒng)思維鏈(CoT)推理范式的一次勝利。

思維鏈推理,需要模型明確地生成一步步的自然語言推理過程。

這就像一個(gè)人解題時(shí),必須把每一步草稿都寫在紙上。這種方式限制了模型的表達(dá)帶寬,因?yàn)閺?fù)雜的思考過程被壓縮成了離散的文字符號(hào)。同時(shí),它也極大地增加了輸出長度,消耗了寶貴的上下文窗口。

Ouro的潛在推理則完全不同。它在模型內(nèi)部的、連續(xù)的隱藏狀態(tài)中完成多步推理。

這更像人類的默想或頓悟,思考過程在高維度的向量空間中流動(dòng),沒有被降維到文字層面。這保留了思考過程的豐富性和連續(xù)性,也更為高效。

更重要的是,Ouro的推理過程表現(xiàn)出更高的因果忠實(shí)度。它的迭代更新過程與最終答案的關(guān)聯(lián)更緊密,證明其推理是為得到答案服務(wù)的,而不是在得到答案后反向構(gòu)建一個(gè)看似合理的解釋。

Ouro模型雖然是通用變換器思想的繼承者,但它在兩個(gè)關(guān)鍵維度上實(shí)現(xiàn)了超越:一是訓(xùn)練規(guī)模,將循環(huán)模型的訓(xùn)練數(shù)據(jù)量提升到了萬億級(jí)別,驗(yàn)證了其在大規(guī)模場景下的有效性;二是通過熵正則化引入了復(fù)雜的自適應(yīng)計(jì)算,讓模型學(xué)會(huì)了動(dòng)態(tài)思考。

Ouro模型極為適合需要復(fù)雜推理但計(jì)算資源有限的場景,比如邊緣計(jì)算、移動(dòng)應(yīng)用和需要快速響應(yīng)的實(shí)時(shí)系統(tǒng)。

當(dāng)然,它也面臨挑戰(zhàn)。目前的推理加速框架(如vLLM)大多為固定計(jì)算路徑設(shè)計(jì),難以完全發(fā)揮Ouro動(dòng)態(tài)計(jì)算深度的優(yōu)勢。

此外,如何將強(qiáng)化學(xué)習(xí)更好地應(yīng)用于這種動(dòng)態(tài)架構(gòu),以進(jìn)一步提升模型的對齊能力,也是一個(gè)待解的課題。

Ouro的探索確立了循環(huán)深度作為繼模型大小和數(shù)據(jù)規(guī)模之后的第三個(gè)擴(kuò)展軸,為人工智能的未來發(fā)展提供了新的思路。

通過架構(gòu)創(chuàng)新,讓模型在內(nèi)部進(jìn)行更深層次的計(jì)算,是提升智能的另一條有效路徑。

Ouro模型的工作為我們開辟了新的想象空間。

責(zé)任編輯:張燕妮 來源: AIGC開放社區(qū)
相關(guān)推薦

2025-06-13 09:29:51

2025-10-11 09:23:28

RLPT強(qiáng)化學(xué)習(xí)預(yù)訓(xùn)練數(shù)據(jù)

2025-05-08 09:10:30

2025-05-08 02:02:02

2020-11-18 10:29:07

模型人工智能開源

2025-11-04 16:02:42

模型訓(xùn)練AI

2023-09-01 15:22:49

人工智能數(shù)據(jù)

2025-11-05 08:53:45

語言模型訓(xùn)練AI

2025-11-10 17:07:13

AI模型自動(dòng)化

2025-11-06 08:55:00

2025-11-13 08:00:00

大推理模型AI人工智能

2023-07-18 15:05:00

開源大模型

2025-10-10 01:25:00

大模型訓(xùn)練數(shù)據(jù)OpenAI

2024-07-16 13:13:26

2025-04-30 09:09:00

2024-11-19 15:00:00

模型開源

2021-04-21 10:18:25

人工智能機(jī)器學(xué)習(xí)技術(shù)

2025-08-14 09:00:00

模型訓(xùn)練數(shù)據(jù)

2025-01-15 13:01:07

2023-06-16 13:37:00

AI學(xué)習(xí)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

久久精品99久久| 欧美在线观看网址综合| 91亚洲一区二区| av中文字幕电影在线看| 国产亚洲美州欧州综合国| 成人在线免费观看视视频| 18精品爽视频在线观看| 精品国产欧美日韩| 欧美va日韩va| 久久撸在线视频| 国产第一页在线| 中文在线免费一区三区高中清不卡| 成人在线小视频| 国产精品suv一区| 欧美一区国产在线| 中文字幕亚洲欧美在线| 这里只有精品在线观看视频| 日韩大陆av| 色综合久久天天综合网| 国产内射老熟女aaaa| 高清在线观看av| 99久久综合99久久综合网站| 91久久精品美女| 欧美性猛交xxxx乱大交hd| 欧美午夜免费影院| 久久好看免费视频| 永久免费成人代码| 色哟哟精品丝袜一区二区| 日韩一区二区精品| 伊人国产在线视频| 三上悠亚激情av一区二区三区 | 日本在线免费观看一区| 国产高中女学生第一次| 美腿丝袜亚洲三区| 日本三级久久久| 久草手机在线观看| 日韩亚洲在线| 8050国产精品久久久久久| 欧美精品乱码视频一二专区| 国产精品久久久久一区二区三区厕所| 国产午夜精品理论片a级探花| 在线观看你懂的视频| 999精品嫩草久久久久久99| 欧美手机在线视频| 狠狠热免费视频| 欧美成人黑人| 欧美日韩中文字幕在线视频| 大j8黑人w巨大888a片| 超碰在线中文字幕| 亚洲综合一区二区三区| 黄色影视在线观看| av网站导航在线观看免费| 亚洲欧美一区二区在线观看| 一本一道久久a久久综合精品| 国产免费av高清在线| 国产视频911| 日韩av一区二区三区在线| 黄色片在线免费看| 日本一区二区三区四区在线视频| 视频在线精品一区| 成人亚洲综合天堂| 中文字幕中文在线不卡住| 亚洲一区高清| 性网站在线观看| 亚洲国产欧美另类丝袜| 成人性生活视频免费看| 日本不卡1234视频| 色婷婷狠狠综合| 日韩精品你懂的| 日韩在线电影| 精品国产成人在线影院| 亚洲精品激情视频| 亚洲黄页网站| 中文字幕av一区二区三区谷原希美| 亚洲精品成人av久久| 国产精品精品| 久久免费国产精品1| 天天操天天操天天操天天| 秋霞午夜鲁丝一区二区老狼| 成人精品视频在线| 欧美77777| 久久久久国色av免费看影院| 亚洲不卡一卡2卡三卡4卡5卡精品| 欧美日韩视频精品二区| 国产精品人人做人人爽人人添| 综合久久国产| 国产调教在线| 欧美日韩精品一区二区天天拍小说 | 水蜜桃一区二区三区| 免费高清在线观看| 午夜久久久久久久久| 午夜dv内射一区二区| 久久国产精品美女| 国产视频丨精品|在线观看| 极品蜜桃臀肥臀-x88av| 91久久视频| 国产精品日日摸夜夜添夜夜av| 国产黄色片网站| 国产午夜精品一区二区| 国产手机视频在线观看| 欧亚在线中文字幕免费| 91精品国产综合久久久久久漫画 | 国产亚洲女人久久久久毛片| 狠狠噜天天噜日日噜| xx欧美xxx| 日韩一区二区免费视频| 中文字幕在线观看的网站| 久久一区91| 2019精品视频| 国产av精国产传媒| 国产欧美日韩精品在线| 日本免费a视频| 欧美jizz18| 亚洲精品在线看| 国产亚洲精品女人久久久久久| 日韩黄色一级片| 国产在线欧美日韩| 最新国产在线拍揄自揄视频| 欧美视频日韩视频| 久久国产精品影院| 韩日成人av| 亚洲综合视频1区| 在线国产91| 色哟哟一区二区三区| youjizz.com日本| 亚洲香蕉av| 国产精品亚洲自拍| porn视频在线观看| 色999日韩国产欧美一区二区| 在线xxxxx| 国产精品多人| 懂色中文一区二区三区在线视频| 在线视频自拍| 欧美吻胸吃奶大尺度电影| 野花社区视频在线观看| 99av国产精品欲麻豆| aaa级精品久久久国产片| 欧美18一19xxx性| 欧美日韩在线观看一区二区 | 日韩一级片免费在线观看| 一区二区三区四区国产精品| www.51色.com| 亚洲精品久久| 亚洲xxxx在线| 污网站在线免费看| 91精品欧美久久久久久动漫| 免费成年人视频在线观看| 久久成人免费网站| 一本二本三本亚洲码 | 日韩中文欧美在线| 欧美一进一出视频| 深夜视频一区二区| 少妇久久久久久| 国产又粗又长视频| 亚洲精品自拍动漫在线| 日韩高清在线一区二区| 欧美91大片| 国产精品伊人日日| 男人av在线播放| 亚洲欧美日韩国产精品| 午夜精品久久久久久久蜜桃| 国产亚洲视频系列| 超碰超碰在线观看| 亚洲一级毛片| 狠狠色综合色区| 欧美日韩大片| 深夜精品寂寞黄网站在线观看| 97在线视频人妻无码| 亚洲精品免费看| 久久性爱视频网站| 日韩中文欧美在线| 在线丝袜欧美日韩制服| 高清一区二区中文字幕| 久久久久久美女| 免费国产在线视频| 欧美精选午夜久久久乱码6080| 欧美日韩中文字幕在线观看| youjizz久久| 91淫黄看大片| 欧美视频在线观看| 日本三级中国三级99人妇网站| a成人v在线| 欧美大片免费观看| 精华区一区二区三区| 69堂国产成人免费视频| 国产精品第108页| 久久久久成人黄色影片| 最新av免费在线观看| 影音先锋久久久| 欧美极品jizzhd欧美| 国产精品一区三区在线观看| 91高清免费在线观看| 日本美女在线中文版| 亚洲高清不卡av| 一个人看的www日本高清视频| 亚洲国产中文字幕在线视频综合| 久久久久亚洲av成人无码电影| 国产精品综合二区| 久久久久国产精品熟女影院| 欧美三级午夜理伦三级中文幕| 久久综合精品一区| 中文字幕日韩在线| 国产精品网址在线| 1区2区3区在线| 久久韩剧网电视剧| 国产三级在线观看| 亚洲аv电影天堂网| 国产一区二区在线播放视频| 日韩欧中文字幕| 国产亚洲欧美精品久久久久久 | 亚洲欧美另类在线观看| 99在线精品视频免费观看软件| 一本一道久久a久久精品| 欧美片一区二区| 国产精品女主播av| 亚洲熟妇一区二区三区| 国产福利精品一区| 久久久精品高清| 日韩高清不卡一区二区三区| 久操网在线观看| 欧美69视频| 丰满女人性猛交| 99久久夜色精品国产亚洲96 | 亚洲婷婷噜噜| 日韩中文字幕在线视频播放| 男人久久精品| 国产丝袜一区二区三区免费视频| 性一交一乱一乱一视频| 欧美日韩aaa| 中文字幕网址在线| 在线亚洲高清视频| 无码人妻aⅴ一区二区三区有奶水| 亚洲一区二区偷拍精品| 欧美黑吊大战白妞| 一区二区在线观看免费| 熟女av一区二区| 中文字幕一区在线观看视频| 国产美女永久免费无遮挡| 久久亚区不卡日本| 国产精品无码一区二区三区免费 | 日韩伦理在线视频| 亚洲成av人片| 国产在线拍揄自揄拍| 一区二区三区自拍| 欧美精品一区二区成人| 亚洲午夜免费电影| 国产主播在线观看| 五月天婷婷综合| 日韩欧美一级视频| 岛国av一区二区在线在线观看| 狠狠躁夜夜躁人人爽天天高潮| 午夜激情综合网| 免费日韩一级片| 欧美性猛交xxxx免费看久久久| 国产高清中文字幕| 欧美色中文字幕| 国产精品区在线观看| 在线不卡中文字幕播放| 国产精品亚洲lv粉色| 日韩一区二区免费视频| 亚洲精品综合网| 日韩成人久久久| 电影av在线| 久久香蕉频线观| 欧美日韩在线视频免费观看| 久久人人爽人人| 经典三级一区二区| 成人精品网站在线观看| 超碰地址久久| 欧美久久久久久| 99久久这里只有精品| 黄黄视频在线观看| 国产欧美三级| 四季av一区二区| 国产精品99久久久久久有的能看| 妖精视频一区二区| 国产片一区二区| 欧美日韩在线观看免费| 欧美日韩美女在线观看| 中文字幕在线观看你懂的| 日韩亚洲电影在线| 亚洲色图 校园春色| 日韩在线资源网| а√在线天堂官网| 国产精品免费观看在线| 亚洲日本va午夜在线电影| 欧美一区二区高清在线观看| 国产国产精品| 免费毛片小视频| 国产在线一区观看| 五级黄高潮片90分钟视频| 中文字幕中文字幕在线一区| 国产成人在线播放视频| 欧美嫩在线观看| 日韩欧美在线观看一区二区| 日韩日本欧美亚洲| 欧美日韩大片| 国产伦精品一区二区三区免| 日韩中文字幕在线免费观看| a在线观看视频| 精品亚洲va在线va天堂资源站| 日本最黄一级片免费在线| 欧美精品xxx| 九九九精品视频| 久久亚洲精品欧美| 欧美深夜福利| 国产又黄又猛的视频| 91视频免费观看| 久久久久成人精品无码| 欧美午夜精品一区二区三区| 色屁屁草草影院ccyycom| 久久精品国产成人| free欧美| 久久国产精品一区二区三区| 中文字幕免费一区二区三区| 能在线观看的av网站| jizz一区二区| 久久免费视频播放| 91超碰这里只有精品国产| 国产女主播在线直播| 97超级碰碰人国产在线观看| 在线精品视频一区| 波多野结衣激情| 麻豆成人91精品二区三区| 30一40一50老女人毛片| 亚洲国产一区二区在线播放| 99久久精品日本一区二区免费| 日韩在线免费av| 性欧美freehd18| 秋霞毛片久久久久久久久| 一本一道久久综合狠狠老精东影业| 韩国三级hd中文字幕有哪些| 日韩一区中文字幕| 中文字幕人妻精品一区| 亚洲一二三在线| 精品国产第一福利网站| 久久久久久高清| 国产精品五区| 黄色国产在线观看| 欧美三级欧美成人高清www| 手机在线精品视频| 欧美大片免费观看| 高清精品视频| 三上悠亚久久精品| 91免费观看视频在线| av黄色在线看| 日韩精品在线视频观看| 小早川怜子影音先锋在线观看| 国产一区不卡在线观看| 一本色道精品久久一区二区三区| av无码av天天av天天爽| 欧美性猛交xxxx偷拍洗澡| 蜜桃成人在线视频| 国产精品一区二区3区| 99精品电影| 国产ts在线观看| 天天综合网 天天综合色| 日本中文字幕一区二区有码在线| 欧美亚洲在线视频| re久久精品视频| 手机av在线网| 夜夜精品视频一区二区| 欧美性猛交 xxxx| 日韩av大片免费看| 日本午夜一区| 青娱乐国产精品视频| 亚洲国产欧美在线| 国产女主播在线直播| 国产美女久久久| 欧美人成在线| 在线不卡av电影| 69堂精品视频| 欧美巨大丰满猛性社交| 神马影院我不卡| 国产酒店精品激情| 西西44rtwww国产精品| 亚洲视频欧洲视频| 超碰国产精品一区二页| 免费在线看黄色片| 欧美极品少妇xxxxⅹ高跟鞋| 国产同性人妖ts口直男| 欧美在线亚洲在线| 亚洲国产一区二区在线观看| 国产乱国产乱老熟300部视频| 欧美性猛交xxxx乱大交极品| 午夜视频成人| 国产一区二区免费电影| 美女视频黄免费的久久 | 希岛爱理av一区二区三区| 中文字幕永久免费| 91激情五月电影| 欧美色图天堂| 亚洲人体一区| 91免费国产在线| 亚洲黄色在线播放| 国产精品久久久久久亚洲影视| 欧美午夜精品| 国产探花视频在线| 国产视频精品一区二区三区| 成人短视频软件网站大全app|