精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

無Tokenizer時代真要來了?Mamba作者再發顛覆性論文,挑戰Transformer

人工智能 新聞
Tokenization,一直是實現真正端到端語言模型的最后一個障礙。

我們終于擺脫 tokenization 了嗎?

答案是:可能性無限大。

最近,Mamba 作者之一 Albert Gu 又發新研究,他參與的一篇論文《 Dynamic Chunking for End-to-End Hierarchical Sequence Modeling 》提出了一個分層網絡 H-Net,其用模型內部的動態分塊過程取代 tokenization,從而自動發現和操作有意義的數據單元。

圖片

「這一研究預示著 Tokenizers 正在退場,智能字節分塊(Smart Byte Chunks)開始登場。或許無需 Tokenizer 訓練的時代真的要來了 —— 可能性無限大。」X 知名博主 Rohan Paul 表示道。

image.png

現階段,Tokenization 仍然是語言模型和其他順序數據不可或缺的組成部分,因為它能夠壓縮和縮短序列。然而 Tokenization 存在許多缺點,如可解釋性差,在處理復雜語言(如中文、代碼、DNA 序列)時性能下降等。

迄今為止,尚未有任何端到端的無 tokenizer 模型在計算預算相匹配的情況下超越基于 tokenizer 的語言模型的表現。最近,已經有研究開始致力于在自回歸序列模型中突破 Tokenization 限制。

在此背景下,來自 CMU、 Cartesia AI 等機構的研究者提出了一系列新技術,通過動態分塊機制實現內容與上下文自適應的分割策略,該機制可與模型其他部分聯合學習。將這一機制融入顯式分層網絡(H-Net)后,原本隱含分層的「tokenization–LM–detokenization」流程可被完全端到端的單一模型取代。

在計算資源和數據量對等的條件下,僅采用單層字節級分層的 H-Net 模型,其表現已優于基于 BPE token 的強 Transformer 語言模型。通過多級分層迭代建模不同抽象層級,模型性能得到進一步提升 —— 這不僅展現出更優的數據規模效應,更能媲美兩倍規模的基于 token 的 Transformer 模型。

在英語預訓練中,H-Net 展現出顯著增強的字符級魯棒性,并能定性學習有意義的、數據依賴的分塊策略,全程無需啟發式規則或顯式監督。

最后,在 tokenization 啟發式方法效果較弱的語言和模態(如中文、代碼或 DNA 序列)中,H-Net 相比 tokenization 流程的優勢進一步擴大(數據效率較基線提升近 4 倍),這證明了真正端到端模型從未經處理數據中實現更優學習和擴展的潛力。

image.png

論文地址:https://arxiv.org/pdf/2507.07955v1

沒有 Tokenization 的端到端序列建模

本文提出了一種端到端的分層網絡(H-Net),通過遞歸、數據依賴的動態分塊(DC,dynamic chunking)過程壓縮原始數據(見圖 1)。H-Net 在保持與 token 化流程相同效率的同時,通過用從數據中學習的內容感知和上下文依賴的分割替代手工啟發式方法,顯著提高了建模能力。 

2025-07-12_093909.png

分層處理

H-Net 采用了分層架構,其工作流程分為三步:

  • 精細處理:先用小型編碼器網絡處理原始數據(如逐個字節 / 字符);
  • 壓縮抽象:將數據壓縮下采樣后,交給主網絡(可理解為大腦核心)處理;
  • 還原輸出:最后上采樣并通過解碼器還原到原始精度。

這種設計形成了天然的認知分層 —— 外層捕捉細粒度的模式,內層處理抽象概念。

關鍵是,主網絡包含了大部分參數,并且可以適配任何標準架構,例如 Transformer 或狀態空間模型(SSM)。

動態分塊

H-Net 的核心是動態分塊(DC)機制,它位于主網絡與編碼器 / 解碼器網絡之間,用于學習如何分割數據,同時使用標準的可微優化方法。DC 由兩種互補的新技術組成:

(i) 路由模塊,通過相似度評分預測相鄰元素之間的邊界;

(ii) 平滑模塊,使用路由器的輸出插值表示,通過減弱不確定邊界的影響,顯著提高學習能力。

通過將這些技術與一個新的輔助損失函數結合,并利用現代基于梯度的離散選擇學習技術,DC 使得 H-Net 能夠以完全端到端的方式學習如何壓縮數據。

信號傳播

本文還引入了幾種架構和訓練技術,以提高端到端優化過程中的穩定性和可擴展性。這些技術包括:(i) 精心布置的投影層和歸一化層,以平衡交互子網絡之間的信號傳播;(ii) 根據每層的維度和有效批次大小調整其優化參數。

總的來說,H-Net 學習了與主干網絡聯合優化的分割策略,基于上下文信息動態地將輸入向量壓縮成有意義的數據塊。

H-Net 代表了第一個真正的端到端、無 tokenizer 的語言模型:通過一個動態分塊階段,字節級的 H-Net 在超過 10 億參數的規模下,達到了與強大的 BPE token 化 Transformer 相當的困惑度和下游性能。

從經驗上看,動態分塊模塊自然地將數據壓縮到與 BPE tokenizer 相似的分辨率(每塊 4.5-5 字節),并且在沒有任何外部監督或啟發式方法的情況下,定性地學習到有意義的邊界。 

實驗及結果

實驗中,本文采用的主要語言模型架構如下所示,如 MambaByte 是使用純 Mamba-2 層的各向同性模型。

image.png

 Training Curves. Figure 3 presents validation BPB metrics throughout training for both Large and XL model scales

訓練曲線。圖 3 顯示了 Large 和 XL 規模模型在整個訓練過程中的驗證 BPB 指標。

image.png

在較大規模上,本文注意到:

所有各向同性模型在性能上都遠遜色于分層模型。在這些模型中,MambaByte 明顯優于 LlamaByte。

SpaceByte 明顯遜色于 SpaceByte++,這一結果驗證了本文在外部網絡中使用 Mamba 的有效性。SpaceByte++ 又比 H-Net(space)差,表明本文提出的改進信號傳播技術的有效性。

H-Net(space)是一個非常強大的模型,達到了與 BPE Transformer 相當的性能,驗證了數據依賴的分塊策略與精心設計的分層架構的效果。

表 2 展示了不同模型在多個下游基準測試上的零樣本準確率。

SpaceByte++、H-Net(space)和 H-Net(1-stage)在大規模上與 BPE Transformer 的性能相似,在 XL 規模上稍微超越了 BPE Transformer。 

image.png

表 3 評估了模型在 HellaSwag 上的魯棒性。與所有基準模型相比,H-Net(2-stage)顯著提高的魯棒性。 

image.png

圖 4 提供了 H-Net(1-stage)和 H-Net(2-stage)動態繪制的邊界的可視化圖。這些可視化提供了關于模型如何決定邊界的幾個重要見解。 

2025-07-12_104349.png

即使使用 Llama3 tokenizer,本文發現 H-Net(2-stage)在中文和代碼處理上,比 BPE Transformer 和 H-Net(space)具有更好的擴展性(圖 5),并且在衰退階段后實現了更低的壓縮率(表 4)。

之前的研究已經證明,SSM 在 DNA 序列建模上比 Transformer 表現更好。實驗(表 5)也驗證了這一點:即使換成 Mamba-2 作為主網絡,SSM 的優勢仍然存在。

image.png

image.png

實際上,通過直接比較訓練穩定階段的困惑度曲線(圖 6),本文發現 H-Net 模型在數據量僅為 3.6 倍的情況下,能夠達到與各向同性模型相似的性能,這一發現適用于兩種主網絡架構的選擇。 

image.png

最后,Albert 還撰寫了精彩的博客文章,介紹關于 H-Net 的幕后故事和精彩見解。感興趣的讀者可以前去閱讀。

博客地址:https://goombalab.github.io/blog/2025/hnet-past/

了解更多內容,請參考原論文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-07-10 08:50:00

2023-12-25 15:11:16

AI模型

2018-07-06 14:34:36

iPad Pro平板電腦蘋果

2009-05-08 09:00:51

微軟鮑爾默谷歌

2024-05-13 10:38:08

2013-08-28 10:39:45

視覺設計顛覆性思維設計

2025-08-06 07:00:00

CIOIT路線圖企業

2023-02-02 11:17:44

數據中心運營商集群

2022-07-01 05:47:19

PyCharm插件開發

2017-11-15 06:55:00

區塊鏈比特幣區塊鏈技術

2023-12-29 08:02:17

大模型人工智能AI

2013-11-27 10:35:14

大數據+云顛覆科技

2019-02-21 00:06:57

物聯網IOT技術

2025-07-15 02:00:00

UIUCEBT架構

2013-05-27 10:46:05

移動互聯網自動化物聯網

2015-06-29 10:28:39

Home交互設計蘋果

2011-10-17 14:10:54

云計算服務器

2013-03-27 15:58:36

思科硅光子技術SDN

2013-02-26 13:21:33

SDN網絡世界軟件定義網絡

2013-08-20 10:05:39

Windows Azu微軟創投云平臺
點贊
收藏

51CTO技術棧公眾號

免费在线观看av电影| 在线观看不卡的av| 免费av一区| 欧美日韩精品一区二区三区| 中文字幕一区二区三区四区五区六区| 超碰在线播放97| 99视频精品免费观看| 中文字幕精品在线| 亚洲一区二区三区四区五区六区| 久久99久久久精品欧美| 亚欧色一区w666天堂| 亚洲一区三区| 偷拍自拍在线| 国产成人综合网| 国产精品美女久久久久久免费 | 理论片一区二区在线| 欧美伊人久久久久久午夜久久久久| 2022中文字幕| 在线日本视频| 26uuu亚洲| 999热视频在线观看| 国产美女www| 亚洲精一区二区三区| 日韩视频免费在线观看| 受虐m奴xxx在线观看| av不卡一区二区| 欧美精品视频www在线观看| 欧美黄色免费影院| 国产高清自产拍av在线| 亚洲激情综合网| 亚洲欧洲精品在线| 高清日韩av电影| 91偷拍与自偷拍精品| 成人久久18免费网站漫画| 亚洲一区二区影视| 美洲天堂一区二卡三卡四卡视频 | www.亚洲免费av| 亚洲最大福利视频| 国产一区二区女内射| 日本强好片久久久久久aaa| 98精品国产高清在线xxxx天堂| 欧美日韩在线视频免费播放| 99久久精品国产亚洲精品| 国产亚洲精品久久久| 亚洲精品成人无码| 国产精品最新| 亚洲深夜福利在线| 熟女少妇内射日韩亚洲| 国产成人手机高清在线观看网站| 日韩成人网免费视频| 天堂久久久久久| 日韩av三区| 亚洲免费小视频| 人妻少妇一区二区| 久操国产精品| 国产亚洲a∨片在线观看| 日韩精品无码一区二区三区久久久 | 91久久精品一区二区三区| 黄色一级大片在线观看| 浪潮色综合久久天堂| 在线视频国内自拍亚洲视频| wwwwww.色| 日韩国产一二三区| 91精品国产色综合久久ai换脸 | 欧美视频二区欧美影视| 日韩一区二区三区电影在线观看| 欧美xxxxxbbbbb| 亚洲五码在线| 精品亚洲男同gayvideo网站| 国产熟妇久久777777| 欧美丝袜丝交足nylons172| 色伦专区97中文字幕| 男的操女的网站| 黑人一区二区| 国产精品第二页| 91精品在线视频观看| 国产激情偷乱视频一区二区三区| 国产精品免费一区二区| 你懂的视频在线播放| 国产精品免费观看视频| 成年人视频大全| 中文一区一区三区高中清不卡免费| 91国产丝袜在线播放| 亚洲欧美手机在线| 久久视频在线观看| 一区二区三区高清国产| 欧美成人黄色网| 国产模特精品视频久久久久| 国产精品尤物福利片在线观看| 国产aⅴ一区二区三区| 91网页版在线| 久久精品在线免费视频| 一级毛片久久久| 欧美一区二区二区| 91精品人妻一区二区三区| 亚洲精品二区三区| 日韩美女毛茸茸| www.com欧美| 国产欧美中文在线| 国产欧美日韩网站| 91精品视频一区二区| 精品中文字幕久久久久久| 在线免费看av网站| 久久激情综合| av观看久久| 一级毛片视频在线观看| 午夜久久电影网| 亚洲黄色片免费| 免费成人结看片| 欧美激情精品久久久久久黑人| 中文天堂在线视频| 91视频一区二区三区| 国产成人精品免费看在线播放| 日韩伦理在线一区| 日韩欧美你懂的| 在线观看天堂av| 免播放器亚洲| 国内不卡一区二区三区| 黄色在线播放网站| 欧美三级韩国三级日本一级| 亚洲の无码国产の无码步美| 欧美黄色一区二区| 91精品一区二区| av播放在线| 色噜噜狠狠成人网p站| 看全色黄大色黄女片18| 亚洲视频一二| 91成人理论电影| 九七久久人人| 欧美日韩在线三级| 色欲AV无码精品一区二区久久| av成人激情| 国产在线观看一区| gogo高清在线播放免费| 欧美电影免费观看完整版| 成人在线观看免费完整| 韩国精品免费视频| 在线观看福利一区| 久久伊人国产| 爱福利视频一区| 亚洲综合精品在线| 国产精品你懂的在线欣赏| 污污网站免费看| 第一会所sis001亚洲| 国产精品免费一区| 亚洲精品传媒| 在线91免费看| 中文字幕五月天| 国产伦精品一区二区三区视频青涩| 中文字幕中文字幕一区三区| 国产亚洲人成a在线v网站| 色av中文字幕一区| 国产精品无码专区av免费播放| 亚洲欧洲韩国日本视频| 国产又粗又猛大又黄又爽| 午夜精品久久| 国产综合精品一区二区三区| 色戒汤唯在线| 国产亚洲精品美女久久久| 中文字幕一区二区三区四区免费看 | 久久久久久国产免费a片| 蜜臀av一区二区三区| 亚洲永久一区二区三区在线| 只有精品亚洲| 欧美国产在线电影| 人成网站在线观看| 日韩欧美亚洲国产一区| 日本一二三不卡视频| 国内外成人在线视频| 久久人人爽人人爽人人av| 日韩av三区| 国产欧美精品在线播放| 午夜影院免费在线| 日韩电影中文字幕| 国内av在线播放| 亚洲美女免费视频| 欧美黑人欧美精品刺激| 蜜乳av一区二区三区| 日本一级黄视频| 五月国产精品| 成人午夜激情免费视频| av中文字幕在线观看第一页| 亚洲香蕉av在线一区二区三区| 国产伦子伦对白视频| 亚洲成人中文在线| 手机看片国产日韩| 成人精品视频一区| 国产三级国产精品国产专区50| 午夜久久影院| 欧美一区二区三区四区五区六区 | 欧美一级日韩不卡播放免费| 人人干人人干人人干| 国产精品久久久久久久久免费樱桃 | 人妻va精品va欧美va| 欧亚一区二区三区| 国产精品111| 国产精品理论片| 中文字幕在线免费看线人 | 欧美性生活久久| 久青草视频在线观看| 国产精品女上位| 亚洲精品理论片| 国产精品白丝jk黑袜喷水| aaa毛片在线观看| 国内精品福利| 在线观看一区二区三区三州| 丝袜久久网站| julia一区二区中文久久94| 久久69成人| 国产成人精品av| 免费看男女www网站入口在线 | 国产精品一级片在线观看| 91视频免费版污| 国产一区二区三区的电影| 男人日女人的bb| 欧美a级片视频| 欧美日韩日本网| 国产suv精品一区| 成人精品水蜜桃| 国产精品亚洲综合在线观看| 国产精品第100页| 欧美电影免费观看| 午夜欧美大片免费观看| 日本大片在线播放| 久久亚洲精品一区二区| 日韩伦理在线电影| 在线视频中文亚洲| 二区三区在线| 尤物tv国产一区| 激情视频在线观看免费| 日韩电影第一页| 亚洲欧美综合在线观看| 亚洲国产精品视频在线观看| 亚洲第一精品网站| 欧美va亚洲va香蕉在线| 国产高清免费在线观看| 欧美一激情一区二区三区| 国产精品女同一区二区| 欧美乱妇一区二区三区不卡视频| 中文字幕在线观看视频一区| 欧美视频自拍偷拍| 中文字幕乱码人妻二区三区| 在线免费观看日本欧美| 蜜臀尤物一区二区三区直播| 91久久奴性调教| 中文在线免费观看| 欧美精品亚洲一区二区在线播放| 国产又粗又黄又爽| 91精品国产综合久久香蕉麻豆| 国产视频在线观看免费| 欧美一区二区三区免费观看视频 | 日韩视频在线免费播放| 婷婷亚洲综合| 国产xxxx振车| 日韩亚洲国产欧美| 欧美日韩在线免费播放| 日本vs亚洲vs韩国一区三区二区| 成人免费在线观看视频网站| 理论电影国产精品| 国产资源中文字幕| 不卡一区二区中文字幕| 青青草成人免费视频| 国产亚洲欧美中文| 男女全黄做爰文章| 亚洲一本大道在线| 天堂а√在线中文在线新版| 在线看日本不卡| 国产熟女精品视频| 亚洲国产精品高清久久久| 女人偷人在线视频| 久久精品中文字幕免费mv| 青草视频在线免费直播 | 国产精品美女久久久久人| 国产不卡一区二区在线观看| 色橹橹欧美在线观看视频高清 | 欧美黄色一区二区| 乱妇乱女熟妇熟女网站| 水蜜桃久久夜色精品一区的特点| 成人综合久久网| av电影在线观看一区| 91无套直看片红桃在线观看| 一区二区三区在线免费视频| 天堂在线免费观看视频| 777xxx欧美| 欧美成熟毛茸茸| 九九热精品视频| 免费污视频在线一区| 成人动漫视频在线观看免费| 狠狠色狠狠色综合婷婷tag| 欧美日韩午夜爽爽| 老司机午夜精品视频| 九色91porny| 久久久www成人免费无遮挡大片| 破处女黄色一级片| 在线观看视频一区二区欧美日韩| 99草在线视频| 在线亚洲午夜片av大片| ****av在线网毛片| 91精品视频免费看| 欧美午夜精彩| 欧美色图色综合| 国产精品乡下勾搭老头1| 摸摸摸bbb毛毛毛片| 午夜视频在线观看一区二区三区| 91丨porny丨在线中文 | 午夜在线播放视频欧美| 欧美国产在线一区| 国产三级精品在线| 亚洲综合一二三| 日韩视频永久免费| 五月婷婷在线视频| 日韩av第一页| 欧美大奶一区二区| 免费看日b视频| 韩国v欧美v日本v亚洲v| 毛片久久久久久| 在线免费观看成人短视频| 麻豆av电影在线观看| 97香蕉超级碰碰久久免费软件 | 成人污污视频在线观看| 欧美国产日韩在线观看成人| 欧美日韩在线亚洲一区蜜芽| 欧美老女人性开放| 欧美在线一级视频| 免费成人蒂法| 国产黄色片免费在线观看| 国产激情精品久久久第一区二区 | 日韩视频一区在线观看| a级网站在线播放| 成人在线小视频| 国产精品久久久久久久免费观看 | 北条麻妃在线视频| 91麻豆文化传媒在线观看| 日韩 欧美 综合| 亚洲黄一区二区| 精品三级久久| 精品一区久久| 久久久精品性| 青娱乐国产视频| 欧美色视频在线| 日日夜夜精品一区| 91九色国产社区在线观看| 香蕉av一区二区| 久久久久中文字幕亚洲精品| 亚洲精品国产精华液| 精品人妻aV中文字幕乱码色欲| 麻豆成人在线看| av日韩精品| 国产一区二区在线视频播放| 91视频www| 日韩中文字幕高清| 久久精品国产综合| 一区二区三区欧洲区| 九一国产精品视频| 91在线云播放| 最近中文字幕在线免费观看| 播播国产欧美激情| 亚洲一区电影| 日韩久久一级片| 国产蜜臀av在线一区二区三区| 一区二区日韩在线观看| 欧美成人午夜剧场免费观看| 51精品国产| 国产裸体舞一区二区三区| 国产精品素人一区二区| 国产黄色片免费| 97久久精品视频| 精品久久久久久久| 特级黄色片视频| 亚洲国产欧美一区二区三区丁香婷| 国产精品国产高清国产| 国产精品久久久久久久久久三级| 99精品在线观看| 欧洲熟妇的性久久久久久| 色综合中文综合网| 在线播放麻豆| 国产日本一区二区三区| 日本午夜精品一区二区三区电影 | 日本中文字幕视频在线| ts人妖另类在线| 新狼窝色av性久久久久久| 亚洲不卡在线播放| 亚洲黄色有码视频| www.久久热| www.四虎成人| 亚洲在线视频免费观看| 91青青在线视频| 国产伦精品一区二区三区照片| 日韩avvvv在线播放| 免费观看一级视频| 中文字幕欧美精品日韩中文字幕| 国产精品久久久网站| 污网站免费在线| 懂色av中文一区二区三区天美| 日本欧美在线视频免费观看| 精品国产一区二区三| 国产一区在线精品| 久久影视中文字幕| 91精品国产99| 国自产拍偷拍福利精品免费一|