精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

只用2700萬參數,這個推理模型超越了DeepSeek和Claude

人工智能 新聞
近日,受到人腦分層和多時間尺度處理機制啟發,來自 Sapient Intelligence 的研究者提出了分層推理模型(HRM),這是一種全新循環架構,能夠在保持訓練穩定性和效率的同時,實現高計算深度。

大模型的架構,到了需要變革的時候?

在對復雜任務的推理工作上,當前的大語言模型(LLM)主要采用思維鏈(CoT)技術,但這些技術存在任務分解復雜、數據需求大以及高延遲等問題。

近日,受到人腦分層和多時間尺度處理機制啟發,來自 Sapient Intelligence 的研究者提出了分層推理模型(HRM),這是一種全新循環架構,能夠在保持訓練穩定性和效率的同時,實現高計算深度。

具體來說,HRM 通過兩個相互依賴的循環模塊,在單次前向傳遞中執行順序推理任務,而無需對中間過程進行明確的監督:其中一個高級模塊負責緩慢、抽象的規劃,另一個低級模塊負責處理快速、細致的計算。HRM 僅包含 2700 萬個參數,僅使用 1000 個訓練樣本,便在復雜的推理任務上取得了卓越的性能。

該模型無需預訓練或 CoT 數據即可運行,但在包括復雜數獨謎題和大型迷宮中最優路徑查找在內的挑戰性任務上卻取得了近乎完美的性能。此外,在抽象與推理語料庫 (ARC) 上,HRM 的表現優于上下文窗口明顯更長的大型模型。ARC 是衡量通用人工智能能力的關鍵基準。

由此觀之,HRM 具有推動通用計算變革性進步的潛力。

paper.png

  • 論文:Hierarchical Reasoning Model 
  • 論文鏈接:https://arxiv.org/abs/2506.21734

如下圖所示:左圖 ——HRM 的靈感源自大腦的層級處理和時間分離機制。它包含兩個在不同時間尺度上運行的循環網絡,用于協同解決任務。右圖 —— 僅使用約 1000 個訓練樣本,HRM(約 2700 萬個參數)在歸納基準測試(ARC-AGI)和具有挑戰性的符號樹搜索謎題(Sudoku-Extreme、Maze-Hard)上就超越了最先進的 CoT 模型,而 CoT 模型則完全失敗。HRM 采用隨機初始化,無需思維鏈,直接根據輸入完成任務。

1.png

分層推理模型

復雜推理中深度的必要性如下圖所示。

左圖:在需要大量樹搜索和回溯的 Sudoku-Extreme Full 上,增加 Transformer 的寬度不會帶來性能提升,而增加深度則至關重要。右圖:標準架構已飽和,無法從增加深度中獲益。HRM 克服了這一根本限制,有效地利用其計算深度實現了近乎完美的準確率。

2.png

HRM 核心設計靈感來源于大腦:分層結構 + 多時間尺度處理。 具體包括:

分層處理機制:大腦通過皮層區域的多級層次結構處理信息。高級腦區(如前額葉)在更長的時間尺度上整合信息并形成抽象表示,而低級腦區(如感覺皮層)則負責處理即時、具體的感知運動信息。

時間尺度分離:這些層次結構的神經活動具有不同的內在時間節律,體現為特定的神經振蕩模式。這種時間分離機制使得高級腦區能穩定地指導低級腦區的快速計算過程。

循環連接特性:大腦具有密集的循環神經網絡連接。這種反饋回路通過迭代優化實現表示精確度的提升和上下文適應性增強,但需要額外的處理時間。值得注意的是,這種機制能有效規避反向傳播時間算法(BPTT)中存在的深層信用分配難題。

HRM 模型由四個可學習的組件組成:輸入網絡 f_I (?; θ_I ),低級循環模塊 f_L (?; θ_L) ,高級循環模塊 f_H (?; θ_H)  和輸出網絡 f_O (?; θ_O) 。

HRM 將輸入向量 x 映射到輸出預測向量 y′。首先,輸入 x 被網絡投影成一個表示image.png

image.png

模塊在一個周期結束時的最終狀態為:

image.png

最后,在經過 N 個完整周期后,從 H 模塊的隱藏狀態中提取預測 image.png

image.png

HRM 表現出層級收斂性:H 模塊穩定收斂,而 L 模塊在周期內反復收斂,然后被 H 重置,導致殘差出現峰值。循環神經網絡表現出快速收斂,殘差迅速趨近于零。相比之下,深度神經網絡則經歷了梯度消失,顯著的殘差主要出現在初始層(輸入層)和最終層。

3.png

HRM 引入了:

首先是近似梯度。循環模型通常依賴 BPTT 計算梯度。然而,BPTT 需要存儲前向傳播過程中的所有隱藏狀態,并在反向傳播時將其與梯度結合,這導致內存消耗與時間步長 T 呈線性關系(O (T))。

HRM 設計了一種一步梯度近似法,核心思想是: 使用每個模塊最后狀態的梯度,并將其他狀態視為常數。

上述方法需要 O (1) 內存,不需要隨時間展開,并且可以使用 PyTorch 等自動求導框架輕松實現,如圖 4 所示。

image.png

其次是深度監督,本文將深度監督機制融入 HRM。

給定一個數據樣本 (x, y),然后對 HRM 模型進行多次前向傳遞,每次傳遞稱為一個段。令 M 表示終止前執行的段總數。對于每個段 m ∈ {1, ..., M},令image.png表示段 m 結束時的隱藏狀態,包含高級狀態分量和低級狀態分量。圖 4 展示了深度監督訓練的偽代碼。

自適應計算時間(ACT)。大腦在自動化思維(System 1)與審慎推理(System 2)之間動態切換。

受上述機制的啟發,本文將自適應停止策略融入 HRM,以實現快思考,慢思考。

圖 5 展示了兩種 HRM 變體的性能比較。結果表明,ACT 能夠根據任務復雜性有效地調整其計算資源,從而顯著節省計算資源,同時最大程度地降低對性能的影響。

image.png

推理時間擴展。有效的神經模型應當能夠在推理階段動態利用額外計算資源來提升性能。如圖 5-(c) 所示,HRM 模型僅需增加計算限制參數 Mmax,即可無縫實現推理計算擴展,而無需重新訓練或調整模型架構。

實驗及結果

該研究中,作者跑了 ARC-AGI、數獨和迷宮基準測試,結果如圖 1 所示:

1a.png

HRM 在復雜的推理任務上表現出色,但它引出了一個耐人尋味的問題:HRM 神經網絡究竟實現了哪些底層推理算法?解答這個問題對于增強模型的可解釋性以及加深對 HRM 解決方案空間的理解至關重要。

作者嘗試對 HRM 的推理過程進行可視化。在迷宮任務中,HRM 似乎最初會同時探索多條潛在路徑,隨后排除阻塞或低效的路徑,構建初步解決方案大綱,并進行多次優化迭代;在數獨任務中,該策略類似于深度優先搜索方法,模型會探索潛在解決方案,并在遇到死胡同時回溯;HRM 對 ARC 任務采用了不同的方法,會對棋盤進行漸進式調整,并不斷迭代改進,直至找到解決方案。與需要頻繁回溯的數獨不同,ARC 的解題路徑遵循更一致的漸進式,類似于爬山優化。

更重要的是,該模型可以適應不同的推理方法,并可能為每個特定任務選擇有效的策略。不過作者也表示,我們還需要進一步研究以更全面地了解這些解題策略。

7.png

HRM 在基準任務中對中間預測結果的可視化。上圖:MazeHard—— 藍色單元格表示預測路徑。中圖:Sudoku-Extreme—— 粗體單元格表示初始給定值;紅色突出顯示違反數獨約束的單元格;灰色陰影表示與上一時間步的變化。下圖:ARC-AGI-2 任務 —— 左圖:提供的示例輸入輸出對;右圖:求解測試輸入的中間步驟。

下圖為 HRM 模型與小鼠皮層的層級維度組織結構對比。

例如,在小鼠皮層中可以觀察到維度層次,其中群體活動的 PR( Participation Ratio )從低水平感覺區域到高水平關聯區域單調增加,支持維度和功能復雜性之間的這種聯系(圖 8 a,b)。

圖 8-(e,f) 所示的結果顯示出明顯對比:未經過訓練的模型中,高層模塊與低層模塊沒有表現出任何層級分化,它們的 PR 值都較低,且幾乎沒有差異。

這一對照實驗表明,維度層級結構是一種隨著模型學習復雜推理任務而自然涌現的特性,并非模型架構本身固有的屬性。 

2025-06-30_154319.png

作者在進一步討論中表示,HRM 的圖靈完備性與早期的神經推理算法(包括 Universal Transformer)類似,在給定足夠的內存和時間約束的情況下,HRM 具有計算通用性。

換句話說,它克服了標準 Transformer 的計算限制,屬于可以模擬任何圖靈機的模型類別。再加上具有自適應計算能力,HRM 可以在長推理過程中進行訓練,解決需要密集深度優先搜索和回溯的復雜難題,并更接近實用的圖靈完備性。

除了 CoT 微調之外,強化學習(RL)是最近另一種被廣泛采用的訓練方法。然而,最近的證據表明,強化學習主要是為了解鎖現有的類似 CoT 能力,而非探索全新的推理機制 。此外,使用強化學習進行 CoT 訓練以其不穩定性和數據效率低而聞名,通常需要大量的探索和精心的獎勵設計。相比之下,HRM 從基于梯度的密集監督中獲取反饋,而不是依賴于稀疏的獎勵信號。此外,HRM 在連續空間中自然運行,這在生物學上是合理的,避免了為每個 token 分配相同的計算資源進而導致的低效。

更多內容,請參閱原論文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-03-05 00:22:00

2025-02-25 09:13:16

2025-03-06 10:14:39

2025-03-06 09:55:49

2025-02-08 09:15:00

2025-02-10 06:50:00

AIDeepSeek推理模型

2025-02-25 14:46:59

2025-01-21 11:53:53

2025-02-10 08:37:04

2025-02-14 11:18:57

2025-06-13 01:00:00

人工智能大型推理模型推理模型

2025-06-08 14:15:42

2024-12-26 14:42:23

2025-09-15 09:43:33

分層推理模型循環網絡推理

2025-06-10 03:30:00

2025-03-11 08:37:42

2025-05-28 02:40:00

AdaptThink推理模型AI

2025-04-11 12:10:33

點贊
收藏

51CTO技術棧公眾號

成人日日夜夜| 看片网址国产福利av中文字幕| 先锋影音在线资源站91| 国产成人啪午夜精品网站男同| 不卡毛片在线看| 女同性αv亚洲女同志| av免费在线免费| 成人h精品动漫一区二区三区| 午夜精品久久久久久久99热| 免费中文字幕av| 国产极品久久久久久久久波多结野| 国产日韩综合av| 成人精品在线观看| 国产大片中文字幕| 激情综合网五月| 91精品国产一区二区| 大西瓜av在线| 久久久久国产精品嫩草影院| 久久精品国产精品青草| 欧美国产视频一区二区| 亚洲a v网站| 成人免费一区| 亚洲国产aⅴ成人精品无吗| 青青草成人网| 亚洲国产成人在线观看| 久久精品一区| 欧美二区在线播放| 公肉吊粗大爽色翁浪妇视频| 97精品资源在线观看| 精品久久久久国产| 手机在线视频你懂的| 瑟瑟在线观看| 国产成人亚洲综合色影视| 日韩av片电影专区| 国产午夜福利片| 先锋资源久久| 亚洲社区在线观看| 亚洲天堂网站在线| 欧洲亚洲两性| 亚洲国产精品综合小说图片区| 亚洲精品欧洲精品| 三级无遮挡在线观看| 国产黄色91视频| 亚洲精品国产91| 欧美黑人激情| 91视频.com| 91中文在线观看| 国产美女www爽爽爽| 亚洲日本欧美| 日韩亚洲一区二区| 久久精品国产亚洲AV熟女| 日韩电影中文字幕在线观看| 污污视频网站免费观看| 国产又色又爽又黄刺激在线视频| 亚洲国产成人午夜在线一区 | 超碰97国产在线| 中文字幕 自拍偷拍| 久久国产高清| 久久久久久久国产| 91欧美精品| 国产精品系列在线播放| 热久久免费视频精品| 国产在线一二区| 欧美另类女人| 精品自拍视频在线观看| 日本爱爱小视频| 97视频精品| 久久久久国产免费免费| 国产综合第一页| 人人妻人人澡人人爽人人欧美一区| 国产一区二区伦理片| 成人免费黄色网| 国产精品久久久午夜夜伦鲁鲁| 日本女人一区二区三区| 97成人精品区在线播放| 日韩黄色a级片| 免费亚洲网站| 日本国产欧美一区二区三区| 丰满少妇xoxoxo视频| 久久久久久黄| 日本精品性网站在线观看| 人人妻人人爽人人澡人人精品| 久久夜色精品| 国产精品激情av在线播放| 无码免费一区二区三区| 欧美bbbbb| 成人综合网网址| 丁香花免费高清完整在线播放| 丁香五精品蜜臀久久久久99网站 | 国产精品扒开腿做爽爽| 亚洲图区在线| 伊人成人开心激情综合网| 四虎影成人精品a片| 精品久久一区| 久久精品国产欧美亚洲人人爽| 少妇高潮在线观看| 婷婷亚洲最大| 国外视频精品毛片| 精品免费囯产一区二区三区| 日本伊人色综合网| 99久久精品无码一区二区毛片| 隣の若妻さん波多野结衣| 久久亚洲精华国产精华液| 爱爱爱视频网站| av成人 com a| 欧美日韩一区二区三区在线| 国内av免费观看| 成人影院中文字幕| 伊人青青综合网站| 国产精品二区一区二区aⅴ| 日韩在线观看一区二区| 91av一区二区三区| 六十路在线观看| 亚洲美女精品一区| 日韩精品视频一区二区在线观看| 国产激情欧美| 亚洲第一av在线| 国产日韩精品中文字无码| 在线免费高清一区二区三区| 国产精品极品美女在线观看免费 | 国产在线观看黄| 亚洲欧美韩国综合色| 一本大道熟女人妻中文字幕在线| 日韩一区二区三免费高清在线观看| 精品国内二区三区| youjizz亚洲女人| 在线不卡视频| 91久久国产精品| 蜜桃视频在线观看视频| 外国精品视频在线观看| 91久久夜色精品国产按摩| 九九视频这里只有精品| 亚洲黄网在线观看| 成人av在线网| 一区一区视频| 91美女主播在线视频| 欧美日韩aaa| 伊人网在线视频观看| 91精品国产综合久久精品性色 | 国内外成人免费在线视频| 亚洲第一二区| 日韩中文字幕精品| 日本一区二区三区精品| 风间由美性色一区二区三区 | 人体久久天天| 欧美插天视频在线播放| 在线观看视频二区| 国产亚洲一区二区三区在线观看| 日本免费a视频| 国产精品**亚洲精品| 亚洲性视频网址| 国产精品一久久香蕉国产线看观看| 波多野结衣电影在线播放| 成人丝袜18视频在线观看| 手机看片日韩国产| 免费一级欧美在线观看视频| 亚洲色图av在线| 男人的天堂一区二区| av在线一区二区| 我的公把我弄高潮了视频| 高清不卡一区| 久久精品久久久久久国产 免费| 中文字幕人成人乱码亚洲电影| 久久精品人人做| 国产成人av影视| 秋霞蜜臀av久久电影网免费 | 天堂av中文在线观看| 精品盗摄一区二区三区| 欧美人妻精品一区二区三区| 国产麻豆成人传媒免费观看| 欧美a级黄色大片| 欧美一级做一级爱a做片性| 中文字幕亚洲无线码在线一区| 国产第一页在线观看| 国产午夜精品一区二区| av免费中文字幕| 国产欧美高清视频在线| 国产精品色视频| 国产激情在线视频| 日韩美女一区二区三区四区| 免费视频一二三区| 99精品视频在线播放观看| 精品久久一二三| 国模吧精品视频| 成人激情黄色网| 精品精品导航| 日韩国产一区三区| 久久精品国产亚洲av麻豆蜜芽| 91丝袜呻吟高潮美腿白嫩在线观看| 日日摸日日碰夜夜爽av| 日韩欧美视频| 成人看片视频| 亚洲天堂一区二区| 久久精品国产久精国产思思| 亚洲精品一区二区三区蜜桃| 欧美日韩亚洲一区二区| 西西444www无码大胆| 精品一区二区三区在线播放视频 | 国产一区毛片| 亚洲一区二区少妇| 欧美wwww| 亚洲欧洲日产国产网站| 国产理论片在线观看| 亚洲h在线观看| 国产欧美小视频| 成人一区二区三区视频 | 精品一区二区三区在线播放视频| 国产精品无码电影在线观看| 伊人春色之综合网| 91免费人成网站在线观看18| 多野结衣av一区| 日日骚av一区| 香蕉视频网站在线| 欧美精三区欧美精三区| 亚洲大片免费观看| 午夜精品久久久久| 欧美日韩精品一区二区三区视频播放 | 国产精品2018| 51精品视频| 色综合老司机第九色激情| 五月婷婷在线视频| 一本色道久久88综合日韩精品| 午夜成人免费影院| 欧美成人aa大片| 国产手机精品视频| 欧美久久一区二区| 又骚又黄的视频| 欧美羞羞免费网站| 一二三区免费视频| 一本久道中文字幕精品亚洲嫩| 日韩欧美高清在线观看| 亚洲图片有声小说| 免费中文字幕视频| 夜夜亚洲天天久久| 欧美精品久久久久性色| 玉米视频成人免费看| 国产日韩欧美在线观看视频| 中文字幕亚洲区| 少妇av片在线观看| 国产区在线观看成人精品| 在线观看日本中文字幕| 久久精品欧美一区二区三区麻豆| 波多野结衣 在线| 91原创在线视频| 精品夜夜澡人妻无码av | 精品卡一卡二卡三卡四在线| 北条麻妃一二三区| 精品国产一区二区精华 | 日韩中文字幕在线视频播放| 欧洲日本在线| 久久国产精品久久精品| 中文字幕在线观看播放| 欧美激情伊人电影| 交100部在线观看| 日本一欧美一欧美一亚洲视频| 色婷婷综合久久久中字幕精品久久| 国产成人午夜视频网址| 成人精品一区二区三区电影| 国产日韩精品视频| 久久影院一区二区三区| www.av一区视频| 三级精品视频| 神马一区二区影院| 久久久9色精品国产一区二区三区| 无码人妻aⅴ一区二区三区日本| 欧美日韩国产色综合一二三四| 丰满少妇大力进入| 久久国产高清| 日韩视频在线观看一区二区三区| 国产不卡高清在线观看视频| 污污内射在线观看一区二区少妇| 久久―日本道色综合久久| 国产美女永久免费无遮挡| 亚洲欧洲精品一区二区精品久久久| 久久精品视频免费在线观看| 午夜亚洲国产au精品一区二区| 天天干,天天干| 制服丝袜激情欧洲亚洲| 亚洲欧洲综合在线| xxxx性欧美| 日韩大片免费观看| 91精品综合久久久久久五月天| 欧美日韩导航| 中文字幕精品一区日韩| 亚洲精品在线二区| 日日干夜夜操s8| 97久久超碰精品国产| 亚洲毛片亚洲毛片亚洲毛片| 亚洲精品ww久久久久久p站| 天天做天天爱夜夜爽| 777亚洲妇女| 你懂的视频在线播放| 欧美精品免费在线| 992tv国产精品成人影院| 国产一区二区在线网站| 五月天久久网站| 黄色国产精品视频| 国产成人av电影在线播放| 国产精品天天干| 午夜久久电影网| 国产成人精品白浆久久69| 国产亚洲人成a一在线v站| 国产丝袜视频在线播放| 91九色视频导航| 精品国产91| 国产一区二区视频播放| 国产一区在线不卡| 手机av在线不卡| 日韩欧美成人精品| 丁香六月天婷婷| 久久成人精品一区二区三区| 精品肉辣文txt下载| 九九九热999| 国内精品久久久久久久97牛牛| 亚洲欧美aaa| 国产精品久久毛片| 中文字幕手机在线视频| 日韩毛片在线观看| wwww在线观看免费视频| 91视频8mav| 99久久婷婷| 伊人国产在线视频| 国产喂奶挤奶一区二区三区| 日韩免费在线视频观看| 欧美va在线播放| 伊人在我在线看导航| 91热精品视频| 忘忧草精品久久久久久久高清| 亚洲免费黄色网| 中文字幕国产一区二区| 无码人妻丰满熟妇区bbbbxxxx| 日韩精品在线观| a一区二区三区| 欧洲一区二区在线 | 国产盗摄xxxx视频xxx69| 日本在线中文字幕一区| 欧美,日韩,国产在线| 99在线精品免费| 999这里只有精品| 精品一区二区亚洲| 视频在线日韩| 亚洲国内在线| 韩国三级在线一区| 波多野结衣爱爱视频| 91精品国产综合久久香蕉的特点 | 国产在视频线精品视频www666| www.日日操| 国产精品久久久久四虎| 91tv国产成人福利| 欧美精品在线免费| 电影一区二区在线观看| 欧美视频免费看欧美视频| 91色|porny| 男人天堂视频在线| 久久国内精品一国内精品| 成人噜噜噜噜| 国产 日韩 欧美在线| 91丝袜国产在线播放| 人人爽人人爽人人片av| 在线视频欧美日韩| 亚洲日本中文| 加勒比成人在线| 久久亚洲一区二区三区四区| 特级西西444www高清大视频| 日韩一区二区三区国产| 视频精品一区| 北条麻妃在线视频观看| 欧美高清在线一区| 国产偷人妻精品一区二区在线| 久久久久国色av免费观看性色 | 国产偷人爽久久久久久老妇app| 深夜福利91大全| 成人直播在线观看| 日本老熟妇毛茸茸| 亚洲人精品一区| 色视频在线看| 成人啪啪免费看| 亚洲一区成人| 国产美女久久久久久| 亚洲激情小视频| 欧美一级网址| 女人天堂av手机在线| 国产精品人成在线观看免费| 亚洲国产福利视频| 国产精品午夜一区二区欲梦| 欧美va天堂在线| 中文字幕第20页| 精品久久久久久无| 成人在线免费| 青青青免费在线| 亚洲欧洲另类国产综合| 少妇高潮一区二区三区69| 国产精品自产拍高潮在线观看| 亚洲视频一区| 国产视频123区| 日韩电影中文字幕一区| 日韩一二三区| 伊人网在线综合| 91久久一区二区| 超碰资源在线|