精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Tokenization不存在了?Meta最新研究,無需Tokenizer的架構來了

人工智能 新聞
該研究提出字節潛在 Transformer(Byte Latent Transformer,簡稱 BLT)挑戰了這種常規做法。BLT 通過直接建模原始字節流,將它們根據熵動態分組為 patch 以實現高效計算。

最近幾天,來自 Meta 、芝加哥大學等機構的合著論文《 Byte Latent Transformer: Patches Scale Better Than Tokens 》火了,在 Hacker News 上受到廣泛討論。

圖片

有人表示,非常期待這項研究取得成功,這樣就可以和 tokenizer 拜拜了!

圖片

還有人擔心的表示,「現在 tokenization 是大多數模型的基礎,這項研究被采用的可能性究竟有多大?」

圖片

總結而言,該研究提出了一種新的 LLM 思想。傳統的語言模型依賴于 tokenizer 來預處理數據,但 tokenization 有其固有的局限性,包括固定的詞匯表、處理多語言或噪聲數據的效率低下,以及由壓縮啟發式方法引入的偏見。

該研究提出字節潛在 Transformer(Byte Latent Transformer,簡稱 BLT)挑戰了這種常規做法。BLT 通過直接建模原始字節流,將它們根據熵動態分組為 patch 以實現高效計算。

具體而言,BLT 不需要 tokenizer 架構,可以直接從原始字節數據中學習,避免了靜態詞匯表的限制,并能更好地處理多樣化和帶噪聲的輸入。

基于熵的 Patch:根據信息復雜度動態地將字節分組為 Patch,對高熵區域(復雜輸入)分配更多的計算資源,在低熵區域節省資源。 

高效擴展:通過優化 patch 大小并利用輕量級局部模型,BLT 實現了與基于 token 模型(如 LLaMA)相當或更好的性能,并在推理過程中節省高達 50% 的計算資源。

魯棒性與靈活性:BLT 在需要字符級理解、噪聲輸入或長尾泛化的任務中表現出色,在許多基準測試中超越了基于 token 的架構。

圖片

圖源:https://x.com/theraggedflesh/status/1867911485428482131

此外,該研究首次提出了對字節級模型進行 flop 控制的擴展研究,參數規模高達 8B,訓練字節高達 4T,從而展示了在沒有固定詞匯表 tokenization 的情況下,從字節級別端到端地大規模訓練模型。

總體而言,BLT 在訓練時的 flop 控制性能與 Llama 3 相當,同時在推理時使用的 flop 減少了高達 50%。該研究還進行了 inference-flop 控制的擴展實驗(圖 1),并觀察到與基于 tokenization 架構相比,BLT 擴展趨勢明顯更好。


圖片

這篇論文貢獻如下:

  • 提出了 BLT,這是一種字節潛在 LLM 架構,動態分配計算資源以提高 flop 效率;
  • 展示了在 8B(即 80 億)參數規模下,能夠實現與 Llama 3 模型相當的訓練 flop 控制,同時可以通過犧牲一小部分評估指標來換取高達 50% 的 flop 效率提升;
  • BLT 模型為擴展大型語言模型開啟了一個新的維度,現在可以在保持固定推理預算的同時擴展模型大小。

圖片

  • 論文標題:Byte Latent Transformer: Patches Scale Better Than Tokens
  • 論文地址:https://arxiv.org/pdf/2412.09871
  • 項目地址:https://github.com/facebookresearch/blt

這種無需 tokenizer 的方法代表了語言建模的重大轉變,為更高效、可擴展和魯棒的人工智能系統鋪平了道路。

對此,有研究者表示:「Meta 剛剛殺死了 TOKENIZATION,他們發布的 BLT 是一種無 tokenizer 的架構,可以動態地將字節編碼為 patch,并實現更好的推理效率和穩健性!」

圖片

「2025 年可能是我們告別 tokenization 的一年。」

圖片

BLT 架構

BLT 由一個對 patch 表征進行操作的大型全局自回歸語言模型以及兩個較小的局部模型組成,兩個較小的局部模型將字節序列編碼為 patch 并將 patch 表征解碼回字節(圖 2)。

圖片

潛在全局 Transformer 模型

潛在全局 Transformer 是一個具有 l_G 層的自回歸 transformer 模型 G,它將一系列潛在輸入 patch 表征 p_j 映射到一系列輸出 patch 表征 o_j。

論文使用下標 j 表示 patch,使用下標 i 表示字節。全局模型使用塊因果注意力掩碼(Dubey et al., 2024)。

局部編碼器 

局部編碼器模型(用 ε 表示)是一種基于 transformer 的輕量級模型,具有圖片層,其主要作用是有效地將輸入字節序列 b_i 映射為表達性 patch 表征 p_j。與 Transformer 架構的主要區別是在每個 Transformer 層之后添加了一個交叉注意力層,其功能是將字節表征池化為 patch 表征(圖 5)。

首先,使用圖片矩陣嵌入輸入字節序列 b_i ,表示為 x_i 。然后,這些嵌入可以選擇以散列嵌入的形式添加附加信息。然后,一系列交替的 transformer 和交叉注意力層將這些表征轉換為由全局 transformer G 處理的 patch 表征 p_i。transformer 層使用局部塊因果注意力掩碼;每個字節都關注前面字節的固定窗口,該窗口通常可以跨越動態 patch 邊界,但不能跨越文檔邊界。

局部解碼器 

與局部編碼器類似,局部解碼器 D 是一個基于 transformer 的輕量級模型,具有圖片層,它將全局 patch 表征序列 o_j 解碼為原始字節 y_i 。局部解碼器根據先前解碼的字節來預測原始字節序列,因此將局部編碼器為字節序列生成的隱藏表征作為輸入。它應用了一系列交叉注意力層和 transformer 層的 lD 交替層。解碼器中的交叉注意力層在 transformer 層之前應用,以首先從 patch 表征創建字節表征,并且局部解碼器 transformer 層對生成的字節序列進行操作。

擴展趨勢 

該研究展示了字節級模型擴展趨勢的整體圖景,可以為 BLT 模型的進一步擴展提供信息,旨在通過以下方式解決先前字節級模型研究的局限性:

  • 比較計算最優訓練方案的趨勢;
  • 在大量訓練上訓練匹配的 8B 模型數據并評估下游任務;
  • 測量推理成本控制設置中的擴展趨勢。

參數匹配計算最優擴展趨勢 

使用 Llama 2 數據集,該研究訓練了四種不同大小(參數范圍從 1B 到 8B)的各種計算最優 bpe 和 BLT 模型。然后在訓練數據混合物的代表性子集上根據語言建模性能繪制訓練 flops 圖。BPE 模型使用 Llama 3 確定的模型參數與訓練數據的最佳比率進行訓練(Dubey et al., 2024)。這種計算最優設置理論上旨在在給定的訓練預算內實現訓練數據集的最佳性能(Hoffmann et al., 2022),為模型提供魯棒的基線。對于每個 bpe 模型,該研究還使用與相應 bpe Transformer 的大小和架構相匹配的潛在 Transformer 在相同數據上訓練相應的 BLT 模型。 

如圖 6(右)所示,BLT 模型要么相當,要么優于 BPE 模型,并且隨著擴展模型大小和 flops,這種趨勢仍然存在。

圖片

為了進一步評估擴展特性,該研究在更大的高質量數據集 BLT-1T 上訓練了一個 8B 參數規模的 BLT 模型。表 1 比較了在 BLT-1T 數據集上訓練的三個模型,基于 tokenizer 的 BPE Llama 3 模型和 BLT 模型的兩個變體(一個采用空間 - patch 方案 (BLT-Space),另一個采用基于熵的 patch 方案 (BLT-Entropy))。

結果顯示,BLT-Entropy 模型在 7 項任務中的 4 項上的表現優于 Llama 3 模型。這種改進是由于 (1) 通過動態 patch 更好地利用了訓練計算,以及 (2) 直接對字節級信息進行建模,而不是對 token 進行建模。

圖片

此外,論文還介紹了 Patch 比 Token 更容易擴展。

圖片

總結來說,對 patch 長度擴展研究表明,BLT 這種基于 patch 的架構可以通過同時增加 patch 和模型的大小來實現更好的擴展趨勢。這樣的趨勢似乎在更大規模的模型中持續存在,甚至有所改善。

字節建模提高魯棒性

字符級任務

在對帶噪聲的 HellaSwag 測試結果發現,BLT 確實在魯棒性方面全面超越了基于 tokenizer 的模型,平均優勢達到 8 個百分點,甚至超過了在更大數據集上訓練的 Llama 3.1 模型。

圖片

圖 7 展示了 Llama 3 tokenizer 模型表現不佳,但 BLT 模型表現良好的幾個場景。

圖片

表 4 表明,BLT 的表現超過了使用 Llama 3 tokenizer 訓練的模型。在流行的語言對中,BLT 的表現與 Llama 3 相當或略好。然而,在資源較少的語言對上,BLT 的表現超過了 Llama 3,這強調了字節建模在泛化到長尾字節序列上的有效性。

圖片

從 Llama 3 到 BLT 

最后,作者還探討了一種工作流,其中 BLT 模型可以利用經過預訓練的基于 tokenizer 的模型,通過使用經過預訓練的 Llama 3.1 初始化 BLT 的全局 tokenizer 參數來實現更好更快的訓練收斂。表 5 為結果。

很明顯,經過 Llama 3.1 初始化的 BLT 顯著優于 Llama 3 和 BLT 基線,這些基線是用相同數量的 flop 訓練的。

圖片

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-05-14 09:22:51

模型技術

2023-03-02 11:44:08

AI技術

2024-12-13 08:25:59

DML操作SQL

2018-07-19 06:14:09

2021-01-25 07:21:24

GitHub 開源代碼下載

2023-09-12 08:02:13

viewport斷點

2018-07-03 14:20:10

數據庫恢復備份

2025-08-04 14:17:47

AI馬斯克模型

2024-07-22 08:03:55

2020-11-03 10:23:22

云計算容器技術

2015-10-20 10:30:59

創業時機

2009-09-12 09:34:18

Windows 7中國售價

2010-01-05 13:52:02

2017-12-26 08:25:57

硬盤數據丟失

2017-12-07 14:57:13

404互聯網錯誤代碼

2025-01-07 07:05:00

生成式檢索系統GenAI人工智能

2012-05-16 11:35:16

SQL Server拒絕訪問

2019-12-31 09:11:01

后臺Android系統

2025-02-07 14:08:45

2024-03-14 08:15:18

COUNT(*)數據庫LIMIT 1?
點贊
收藏

51CTO技術棧公眾號

黄色一级片免费的| 亚洲看片网站| 无码人妻久久一区二区三区 | 日韩国产欧美在线播放| 日韩在线欧美在线国产在线| 深夜做爰性大片蜜桃| 超级碰碰不卡在线视频| 国产丝袜在线精品| 懂色中文一区二区三区在线视频| 精品人妻一区二区三区免费看 | 精品国产欧美一区二区五十路| 最好看的中文字幕| 91在线亚洲| 精品久久久国产精品999| 一区二区三区的久久的视频| 五月天福利视频| 国产一区二区三区观看| 日本久久久久久久| 日本少妇性生活| 1024精品久久久久久久久| 日韩精品中文在线观看| 日本中文字幕精品| 日韩专区视频| 色综合网站在线| 波多野结衣av一区二区全免费观看| 国内在线免费高清视频| 成av人片一区二区| 成人久久18免费网站漫画| 中文字幕人妻一区二区三区视频 | 亚洲美女偷拍久久| 亚洲国产成人不卡| 猫咪在线永久网站| 不卡视频在线观看| 成人xxxxx色| 国产wwwwwww| 韩国一区二区在线观看| 国产精品黄视频| 精品无码一区二区三区的天堂| 亚洲福利国产| 久久久久久999| 青娱乐国产在线| 亚洲国产日韩欧美在线| 日韩小视频在线| 嘿嘿视频在线观看| av中字幕久久| 国产一区二区三区高清在线观看| 国产国语性生话播放| 林ゆな中文字幕一区二区| 精品国产百合女同互慰| 久久av一区二区三| 99re热精品视频| 精品成人私密视频| 老司机午夜免费福利| 国产成人在线中文字幕| 亚洲成色777777在线观看影院 | 久久嫩草精品久久久久| 农村寡妇一区二区三区| 日本福利在线观看| 国产亚洲精久久久久久| 亚洲.欧美.日本.国产综合在线| 国产小视频免费在线观看| 久久久久久久一区| 五码日韩精品一区二区三区视频| 9色在线观看| 自拍偷拍欧美激情| 国产精品第157页| 欧美xxxhd| 91国产成人在线| 国产九九热视频| 视频精品一区| 亚洲精品美女久久久| 91视频在线网站| 91久久夜色精品国产按摩| 欧美xxxx18国产| 国产精品第一页在线观看| 国产模特精品视频久久久久| 国产精品久久久久久网站| 国产一区二区在线视频观看| 国产成人在线看| 精品日产一区2区三区黄免费| 欧洲成人av| 中文字幕制服丝袜一区二区三区 | 欧美大片xxxx| 亚洲精品男同| 国产精品美女免费视频| 精品国自产在线观看| 99国产精品久久久久久久久久久 | 激情综合中文娱乐网| 国产成人精品久久二区二区| 国产欧美日韩成人| 久久综合999| 亚洲.欧美.日本.国产综合在线| 亚洲h片在线看| 日韩欧美中文在线| 性久久久久久久久久久久久久| 欧美精品中文| 久久久国产精品一区| 中日韩黄色大片| 黑人精品欧美一区二区蜜桃| 久久99精品国产99久久| 久久综合之合合综合久久| 天天综合天天做天天综合| 五月天av在线播放| 青青草原在线亚洲| 欧美精品一区二区免费| 国产情侣免费视频| 成人黄色777网| 综合操久久久| 国产私拍福利精品视频二区| 亚洲国产欧美一区二区丝袜黑人 | 欧美色图12p| 中文在线观看免费视频| 五月激情综合| 国产精品第一页在线| 成人免费视频国产| 亚洲欧洲韩国日本视频| 日日摸天天爽天天爽视频| 国产suv精品一区| 另类图片亚洲另类| 中文字幕 亚洲视频| 26uuu另类欧美| 久青草视频在线播放| 只有精品亚洲| 中文字幕亚洲精品| 久久久久久久久久久影院| 成人综合婷婷国产精品久久蜜臀| 黄色网址在线免费看| 国产福利一区二区三区在线播放| 日韩av在线网站| 国产精品美女毛片真酒店| 韩国成人精品a∨在线观看| 日韩欧美电影一区二区| 亚洲最大网站| 日韩av在线资源| 青青草av在线播放| 岛国精品在线播放| 人妻互换免费中文字幕| 国产一精品一av一免费爽爽| 丝袜美腿亚洲一区二区| 国产成人麻豆免费观看| 欧美极品少妇xxxxⅹ高跟鞋 | 国产成人三级视频| 亚洲国产一区二区久久| www.xxxx精品| 国产露脸国语对白在线| 亚洲欧洲日产国产综合网| 思思久久精品视频| 久久久久久影院| 91亚洲国产成人久久精品网站 | 日韩1区在线| 国产在线观看精品| 免费高清在线观看| 在线播放中文一区| 欧美日韩免费做爰视频| 国产精品888| 无码 制服 丝袜 国产 另类| 欧美激情影院| 国产91在线高潮白浆在线观看| 精品三级久久久久久久电影聊斋| 91福利精品第一导航| 久久久久久国产免费a片| 免费成人在线观看视频| a级网站在线观看| 国产精品xxxav免费视频| 97色在线播放视频| 精品美女视频在线观看免费软件 | 午夜精品电影| 国产一区二区自拍| 精品3atv在线视频| 久久五月天色综合| 免费看国产片在线观看| 色素色在线综合| 182在线观看视频| 成人综合婷婷国产精品久久蜜臀| 国产视频九色蝌蚪| 红桃视频在线观看一区二区| 国产主播在线一区| 波多野结衣精品| 亚洲丝袜在线视频| 国产精品区在线观看| 亚洲五码中文字幕| 99精品欧美一区二区| 国产精品一二二区| 免费观看精品视频| 亚洲一区二区三区| 精品网站在线看| 午夜不卡一区| 97在线看免费观看视频在线观看| 岛国在线视频| 精品黑人一区二区三区久久| 亚洲精品中文字幕乱码三区91| 《视频一区视频二区| 添女人荫蒂视频| 国产呦精品一区二区三区网站| 国内精品视频一区二区三区| 成人综合专区| 国产日韩欧美精品| 欧美大片1688网站| 91大神福利视频在线| 免费看a在线观看| 亚洲日韩第一页| 成人免费观看在线视频| 欧美男女性生活在线直播观看| 久久中文字幕无码| 中文字幕一区二区在线播放| 亚洲成av人片在线观看无| 久久国产剧场电影| 国产免费一区二区三区视频| 欧美三级视频| 最新中文字幕久久| 国产一区二区亚洲| 国产精品一区二区免费看| 亚洲aⅴ网站| 国产91免费看片| 日本乱码一区二区三区不卡| 欧美精品免费看| 日韩理伦片在线| 亚洲欧美日韩爽爽影院| 视频二区在线观看| 日韩欧美国产精品| 国产在成人精品线拍偷自揄拍| 欧洲精品视频在线观看| 午夜毛片在线观看| 亚洲超丰满肉感bbw| 欧洲猛交xxxx乱大交3| 国产精品毛片高清在线完整版| 中文字幕av网址| 91在线看国产| 亚洲熟女乱综合一区二区三区| 国产精品亚洲一区二区三区妖精| 欧美激情第3页| 麻豆精品久久久| 成人性生交免费看| 日韩av二区在线播放| 爱福利视频一区二区| 99亚洲一区二区| 日本福利视频一区| 亚洲国产三级| 精品少妇人妻av免费久久洗澡| 国内精品美女在线观看| 9色视频在线观看| 欧美国内亚洲| av在线免费观看国产| 欧美国产高清| 国产高清不卡无码视频| 欧美午夜不卡影院在线观看完整版免费 | 亚洲av无码乱码在线观看性色| 日韩一级高清毛片| 精品国产av一区二区| 日韩欧美一级片| 亚洲精品成av人片天堂无码| 亚洲精品一区在线观看| 三级小视频在线观看| 日韩精品中文字幕在线播放| 日本福利片在线| 一区二区三区美女xx视频| av电影在线网| 欧美巨大黑人极品精男| 男人天堂亚洲天堂| 8050国产精品久久久久久| 成人免费短视频| 国产女人精品视频| 欧美电影院免费观看| 懂色av一区二区三区在线播放| 欧美变态挠脚心| 日本精品一区二区三区高清 久久 日本精品一区二区三区不卡无字幕 | jizz在线观看视频| 久久视频在线播放| free性m.freesex欧美| 奇米四色中文综合久久| 国产一区二区色噜噜| 91久久久一线二线三线品牌| 风间由美一区二区av101| 欧美日韩在线观看一区二区三区| 欧美日韩色图| 黄色成人在线免费观看| 国产精品日韩欧美一区| jizzzz日本| 成人免费毛片高清视频| 四虎国产精品成人免费入口| 中文字幕视频一区| 日韩av黄色片| 欧美日韩国产一级片| 丰满人妻妇伦又伦精品国产| 亚洲午夜久久久影院| 日本片在线观看| 国产精品国产三级国产专播精品人| 国产一区二区三区免费在线| 麻豆精品蜜桃一区二区三区| 天天做天天爱天天爽综合网| 国产精品裸体瑜伽视频| 看国产成人h片视频| 欧美做受喷浆在线观看| 亚洲精品国久久99热| 无码人妻丰满熟妇奶水区码| 日韩欧美国产一区二区三区 | 中文字幕亚洲成人| yjizz国产| 精品区一区二区| 欧美极品另类| 欧洲成人午夜免费大片| 91成人短视频| 中文字幕精品—区二区日日骚| 亚洲一区黄色| 国产女主播在线播放| 亚洲欧洲韩国日本视频| 波多野结衣av无码| 日韩高清免费观看| 香蕉成人app免费看片| 国产精品久久久久久五月尺| 天天躁日日躁成人字幕aⅴ| 超碰超碰超碰超碰超碰| 捆绑调教美女网站视频一区| 毛片网站免费观看| 亚洲一二三区在线观看| 国产裸体无遮挡| 久久精品电影一区二区| 国产一区一一区高清不卡| 久久综合婷婷综合| 亚洲电影成人| 久久久久国产免费| 亚洲欧美日韩国产一区二区三区| 欧美一区免费看| 亚洲欧美第一页| 亚洲福利影院| 精品卡一卡二| 99精品热视频只有精品10| 亚洲v在线观看| 亚洲一区二区欧美| 亚洲高清视频网站| 欧美成人小视频| 高清一区二区| 中文字幕一区二区三区最新| 麻豆精品一区二区| 国产大屁股喷水视频在线观看| 在线观看视频一区二区欧美日韩| 国产色a在线| 国产mv久久久| 欧美色网址大全| 亚洲色图38p| 国产日韩精品一区二区三区在线| 波多野结衣电影在线播放| 亚洲欧美色婷婷| 日本精品在线中文字幕| 亚洲人成人77777线观看| 久久精品99国产精品日本| 国产wwwwxxxx| 51精品国自产在线| 色www永久免费视频首页在线| 国产成人免费电影| 亚洲精品婷婷| xxxx日本免费| 欧美亚洲一区二区在线观看| 91sp网站在线观看入口| 成人在线视频福利| 欧美精品国产一区| 动漫美女无遮挡免费| 粉嫩老牛aⅴ一区二区三区| 青青草免费在线视频| 国产精品99导航| 久久免费大视频| 欧美人与性动交α欧美精品| 亚洲国产一区在线观看| 日韩一级片免费在线观看| 日韩免费av一区二区| 91综合久久| 催眠调教后宫乱淫校园| 一本色道久久综合亚洲aⅴ蜜桃 | 亚洲狼人综合网| 日本视频久久久| 久久精品高清| 99re这里只有| 欧美伊人久久大香线蕉综合69| 久久黄色美女电影| 国产精品一国产精品最新章节| 日韩精品高清不卡| 欧美丰满熟妇bbbbbb| 精品国产91乱码一区二区三区 | 欧美三日本三级三级在线播放| 国产激情在线| 久久国产一区二区| 麻豆国产一区二区| 日韩少妇裸体做爰视频| 日韩中文字幕在线观看| 久久久久久毛片免费看 | 久久视频在线观看免费| 日韩黄色网络| 蜜桃福利午夜精品一区| 欧美日韩精品在线观看| av在线影院| 日本一区二区三区四区在线观看| 国产精品一品视频| 波多野结衣电影在线播放| 欧美富婆性猛交| 成人免费电影网址| 中文字幕一区三区久久女搜查官| 欧美日韩国产综合久久| 亚洲妇女成熟| 免费网站在线观看视频| 中文字幕一区在线观看视频|