精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Token化一切,甚至網(wǎng)絡(luò)!北大&谷歌&馬普所提出TokenFormer,Transformer從來沒有這么靈活過!

人工智能 新聞
新一代通用靈活的網(wǎng)絡(luò)結(jié)構(gòu) TokenFormer: Rethinking Transformer Scaling with Tokenized Model Parameters 來啦!

本論文第一作者是汪海洋,北京大學(xué)20級博士生,目前主要關(guān)注是通用模型的架構(gòu)設(shè)計和學(xué)習(xí)算法。指導(dǎo)教授主要包括王立威,北京大學(xué)智能學(xué)院教授;Bernt Schiele,德國馬普計算所教授;Federico Tombari 谷歌人工智能科學(xué)家等。

新一代通用靈活的網(wǎng)絡(luò)結(jié)構(gòu) TokenFormer: Rethinking Transformer Scaling with Tokenized Model Parameters 來啦!

TokenFormer 不僅像原始 Transformer 一樣 Token 化了 input data,并且 Token 化了網(wǎng)絡(luò)參數(shù),將 attention 機(jī)制拓展到 Token 和 parameters 的交互中,最大化了 Transformer 的靈活性,真正得到了一個 Fully attention-based 的網(wǎng)絡(luò)結(jié)構(gòu)。

這種方式打破了原有人們區(qū)別看待 data 和 model 的觀念,即所有的計算都?xì)w納為不同類型的 Token(e.g., data, param token)通過靈活的 attention 來交互。得益于這一靈活的性質(zhì),TokenFormer 允許 incremental scaling model size,基于訓(xùn)好的模型上增量的拓展新的更大的模型,大大節(jié)省了計算的開銷:

圖片

這項名為 TokenFormer 的新工作,由谷歌,馬普計算所和北大的研究者提出,在 Twitter,HackerNews, Reddit 上得到廣泛的討論和關(guān)注 (Twitter 上有 150K + 的瀏覽量)。

圖片

目前代碼、模型和項目主頁均已放出:


  • 論文鏈接:https://arxiv.org/pdf/2410.23168
  • 開源代碼:https://github.com/Haiyang-W/TokenFormer
  • 開源模型:https://huggingface.co/Haiyang-W

背景介紹

得益于其處理各種數(shù)據(jù)的靈活性,Transformer 網(wǎng)絡(luò)結(jié)構(gòu)在各個 AI 領(lǐng)域都取得了巨大的成功。

Transformer 模型通常將處理單個 Token 所需的計算分為兩個部分:與其他 Token 的交互(Token-Token Interaction)和涉及模型參數(shù)的計算(Token-Parameter Interaction)。

Attention 促進(jìn)了 Token-Token 之間的交互,使現(xiàn)代通用基礎(chǔ)模型能夠?qū)⒍嗄B(tài)數(shù)據(jù)編碼成統(tǒng)一的 Token 序列,并有效捕捉它們之間的復(fù)雜依賴關(guān)系。

相反,Token-Parameter 計算主要依賴于固定的 linear projection,大大限制 model size 的 scaling。Scaling model 是通常改變模型結(jié)構(gòu),往往需要從頭訓(xùn)練整個模型,帶來了過多的資源消耗,使其越來越不切實(shí)際。

在本文中,研究團(tuán)隊使用 token 這一概念建模所有的計算,即將 model parameters 也視為一種 token,網(wǎng)絡(luò)的計算統(tǒng)一為各種不同的 token ( e.g., data tokens and parameter tokens) 之間通過 attention 來進(jìn)行交互,大大增強(qiáng)了 Token-Parameter 交互的靈活性,從而能夠增量式的擴(kuò)展模型參數(shù),有效地重用先前訓(xùn)練的模型,從而顯著降低了訓(xùn)練負(fù)擔(dān)。

為實(shí)現(xiàn)這一目標(biāo),研究團(tuán)隊引入了 TokenFormer。統(tǒng)一 Token-Token 和 Token-Parameters Interaction 的計算。其 Token-Parameter attention 具有靈活性,并能夠處理可變數(shù)量的參數(shù),從而本質(zhì)上最大化了 Transformer 的靈活性,增強(qiáng)了模型的可擴(kuò)展性。

TokenFormer 提供一種新的看待模型的視角,即網(wǎng)絡(luò)的計算就是一些 Tokens 相互任意交互。基于這些 Tokens (e.g., data token, parameter token, memory token)和 attention 機(jī)制可以靈活地構(gòu)造任意的網(wǎng)絡(luò)結(jié)構(gòu)。

該團(tuán)隊希望 TokenFormer 作為一種通用的網(wǎng)絡(luò)結(jié)構(gòu),不僅在 incremental model scaling 上有貢獻(xiàn),還在 Sparse Inference, Parameter-Efficient Tuning, Vision and Language Models, Device-Cloud Collaboration 和 Model Interpretability 等領(lǐng)域有更多的貢獻(xiàn)。

方法

Tokenformer 的核心創(chuàng)新是 Token-Parameter Attention(Pattention) Layer,它結(jié)合了一組 Trainable Tokens 作為 model parameters,并通過 cross-attention 來管理 Input Token 與這些 Parameter Tokens 之間的交互。

通過這種方式,Pattention 層引入了一個額外的維度 —Parameter Token 的數(shù)量,這一維度獨(dú)立于輸入和輸出維度。此解耦方式使得輸入數(shù)據(jù)可以與 variable number of parameters 進(jìn)行交互,提供了增量模型擴(kuò)展所需的靈活性。  

圖片

Pattention Layer: 具體來說,就是讓 input data 作為 query, 研究團(tuán)隊引入了兩組具有 n 個可學(xué)習(xí)的 Tokens:圖片代表 key, 圖片表示 value。輸出如下:

圖片

其中 Θ 是改進(jìn)的 softmax,為了防止梯度 exponential 帶來的梯度問題,

圖片

這里 f () 是任意非線性函數(shù),默認(rèn)使用 gelu。圖片

研究團(tuán)隊使用 Pattention Layer 替換掉標(biāo)準(zhǔn) Transformer 中的所有的 linear projection,最大化 Transformer 的靈活性。

應(yīng)用:天生的增量式 Model Scaling

有了 TokenFormer 這一靈活的性質(zhì),可以延伸出很多應(yīng)用。這里以增量式 model scaling 為例。

圖片

假設(shè)已經(jīng)訓(xùn)練好了一個 TokenFormer,其 key parameters 和 value parameters 計為 圖片圖片

如上圖所示,加入新的重新初始化的 key-value parameter pairs,計為 圖片圖片,進(jìn)而組合成新的 key-value set,

圖片

然后使用 pattention layer,讓 input data 與 Parameter tokens 進(jìn)行交互。

圖片

這里直觀的理解就是每個 Key-Value 代表一種學(xué)好的 pattern,其組成一個巨大的知識庫。文中的 incremental scaling 就是在原有的知識庫上進(jìn)一步拓展訓(xùn)練。

實(shí)驗結(jié)果

增量式 model scaling:如下右圖所示,模型在已經(jīng)訓(xùn)好的 124M 的模型的基礎(chǔ)上,采用增量式訓(xùn)練,只用十分之一的數(shù)據(jù)就可以達(dá)到從頭訓(xùn)練策略相近的性能,讓模型可以不斷迭代,真正地活起來了

圖片

Language Modeling:如下表所示,研究團(tuán)隊比較了 Transformer-based 的模型和 TokenFormer 在語言建模上的能力。

圖片

在相同規(guī)模、相同模型尺寸下, TokenFormer 在大大增加靈活性的前提下達(dá)到了比 Transformer 更好的 zero-shot 性能。這里研究團(tuán)隊 follow 了 pythia 標(biāo)準(zhǔn)的訓(xùn)練代碼以及數(shù)據(jù)集:Pile (300B)。上述結(jié)果展現(xiàn)了 TokenFormer 在語言模型建模上的能力。

Visual Modeling: 為了進(jìn)一步驗證 TokenFormer 的表達(dá)能力,研究團(tuán)隊還和標(biāo)準(zhǔn)的 vision transformer 進(jìn)行了對比。

圖片

在 ImageNet-1K 的監(jiān)督訓(xùn)練的 setting 上,使用相同的訓(xùn)練策略, TokenFormer 的性能超過了 vision-transformer,驗證了其在 visual modeling 上的能力。

未來研究方向

極致的專家混合(Mixture-of-Experts)范式

研究團(tuán)隊認(rèn)為 Tokenformer 是專家混合(MoE)框架的極致實(shí)例化,其中每一組鍵 - 值參數(shù)對都充當(dāng)一個獨(dú)立的專家。這種創(chuàng)新的類 MoE 架構(gòu)有可能顯著減少與 Token-Parameter 交互相關(guān)的計算成本。

新的參數(shù)高效微調(diào)范式

Tokenformer 的擴(kuò)展方法通過集成額外的 key-value parameter pairs,展現(xiàn)了一種參數(shù)高效的微調(diào)策略。當(dāng)面對新任務(wù)或數(shù)據(jù)集時,該模型可以通過加入新的 Token Parameters 來擴(kuò)展其預(yù)訓(xùn)練參數(shù),從而快速適應(yīng)特定任務(wù)需求。

整合視覺和語言模型

利用 Tokenformer 的參數(shù)高效微調(diào)能力,可以實(shí)現(xiàn)視覺和語言模態(tài)的無縫集成。具體方法是將預(yù)訓(xùn)練的 Visual Tokenformer 和 Language Tokenformer 的 key-value parameter Tokens 統(tǒng)一為一個參數(shù)集,然后引入新的 Trainable Tokens 來執(zhí)行視覺 - 語言對齊和指令微調(diào)。

端云協(xié)同

Tokenformer 可以在設(shè)備 - 云協(xié)作中充當(dāng)云端知識庫,為設(shè)備端的大語言模型(LLM)提供支持,其中每組 key-value parameter tokens 代表一個可學(xué)習(xí)模式,通過設(shè)備進(jìn)行實(shí)時處理,并利用云端執(zhí)行密集任務(wù)。

增強(qiáng)模型的可解釋性

由于 Tokenformer 完全基于注意力機(jī)制,它自然受益于在 Token-Parameter 交互中與注意力相關(guān)的可解釋性特性。這一特點(diǎn)增強(qiáng)了模型的可解釋性,為 AI 社區(qū)開發(fā)更透明、易理解的模型貢獻(xiàn)力量。


責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2019-12-26 08:33:11

Filnkjava語言

2025-03-13 10:31:20

DeepSeek開源EPLB

2011-07-06 14:29:49

中國移動王建宙4G

2020-04-08 12:50:29

Python編程語言開發(fā)

2025-01-03 09:24:10

模型架構(gòu)論文

2010-03-24 14:33:05

互聯(lián)網(wǎng)

2021-01-28 15:24:36

數(shù)字化轉(zhuǎn)型數(shù)字中臺

2014-10-18 11:24:17

麗維家

2024-03-01 10:04:11

研究訓(xùn)練編碼器

2021-06-09 19:25:13

IODubbo

2023-05-04 12:19:47

模型AI

2018-09-18 09:52:46

Windows Pho谷歌微軟

2018-07-31 05:15:36

2014-03-13 09:09:55

2015-08-17 10:47:54

網(wǎng)絡(luò)安全技術(shù)

2014-11-20 17:46:08

2011-05-18 13:45:30

MongoDB

2013-06-25 11:06:51

編程技巧蘋果

2016-08-31 17:24:05

大數(shù)據(jù)分析

2012-12-31 11:22:58

開源開放
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

污污网站免费看| 国产成人jvid在线播放| 久久久无码人妻精品无码| 国产蜜臀一区二区打屁股调教| 精品1区2区3区4区| 欧美精品久久久久久久久老牛影院| 九九久久99| 嫩草影院一区二区三区| 欧美gvvideo网站| 日韩免费观看高清完整版在线观看| 亚洲精品中字| 色婷婷av一区二区三区之e本道| 欧美一区激情| 国产精品99久久久久久有的能看| 亚洲欧美在线x视频| 538任你躁在线精品免费| 三级福利片在线观看| 久久久久亚洲蜜桃| 国产成人免费av| 亚洲AV无码国产成人久久| 欧美男男tv网站在线播放| av一区二区三区在线| 国产精自产拍久久久久久| 五月天婷婷丁香| 欧美hd在线| 国产一区二区三区在线视频| 800av在线播放| 欧美视频二区欧美影视| 国内精品久久久久久久影视简单| 女厕盗摄一区二区三区| 国产精品日韩精品欧美在线| 91九色视频在线| 黄色一级视频免费看| 国内揄拍国内精品久久| 久久亚洲精品视频| 日本一区二区在线观看视频| 欧美专区视频| 91精品欧美久久久久久动漫| 国产二区视频在线| av免费在线观看网站| 国产精品久久久一区麻豆最新章节| 91久久国产综合久久91精品网站| 久久久久亚洲av成人片| 正在播放日韩欧美一页| 日韩综合视频在线观看| 自拍偷拍你懂的| 欧美色网址大全| 国产午夜精品视频免费不卡69堂| 又黄又爽又色的视频| 91精品国产自产观看在线| 欧美日韩免费一区二区三区| 日本xxxx黄色| 国产直播在线| 午夜电影网一区| 日韩视频在线视频| 国产777精品精品热热热一区二区| 欧美韩日一区二区三区| 视频一区二区在线观看| 91视频在线观看| 中文文精品字幕一区二区| 天天爽天天狠久久久| 欧洲美女少妇精品| 亚洲男人的天堂在线aⅴ视频| 欧美日韩一区二区三区免费| 国产精品秘入口| 中文字幕一区二区三区四区| 久久免费视频1| 精品久久av| 亚洲精品成人| 精品对白一区国产伦| 四虎精品一区二区| 天美av一区二区三区久久| 日韩电影第一页| 人妻aⅴ无码一区二区三区| 青青草成人影院| 精品国产精品网麻豆系列| 黑森林av导航| 综合亚洲色图| 在线一区二区观看| 精品久久一二三| 成年人国产在线观看| 精品国产老师黑色丝袜高跟鞋| 日本美女爱爱视频| 成av人片在线观看www| 色哟哟国产精品免费观看| 性猛交ⅹ×××乱大交| 99精品国产一区二区三区2021 | 日韩欧美亚洲视频| 久久久久国产精品一区三寸| 国产精品美女999| 国内老熟妇对白xxxxhd| 韩国av一区二区三区| dy888夜精品国产专区| 色视频在线观看| 亚洲欧洲日韩综合一区二区| 日韩中字在线观看| 日本在线一区二区| 欧美精品乱人伦久久久久久| 中文字幕有码av| 爱高潮www亚洲精品| 亚洲午夜精品视频| 久久婷婷国产麻豆91| 亚洲视频免费| 国产免费亚洲高清| 神马午夜电影一区二区三区在线观看 | 久久精品国产亚洲5555| 最近2019中文免费高清视频观看www99 | 成人动态视频| 中文字幕欧美精品在线| 色播视频在线播放| 国产在线不卡视频| 91在线在线观看| 国产高清一区在线观看| 亚洲精品中文在线影院| 搡女人真爽免费午夜网站| 亚洲乱码一区| 久久久久www| 一区视频免费观看| 免费不卡在线观看| 亚洲aa中文字幕| 超碰在线国产| 色一情一乱一乱一91av| 国模私拍在线观看| 红桃视频国产精品| 亚洲xxx自由成熟| 久草免费在线| 欧美三级视频在线观看| 国产伦精品一区二区三区妓女下载| 国产精品丝袜在线播放| 久久国产精品视频| 午夜精品三级久久久有码| 国产精品夜夜嗨| 香蕉视频在线网址| 亚洲国产天堂| 日韩中文在线中文网在线观看 | 九色在线观看视频| 国产精品久线在线观看| 免费裸体美女网站| 综合亚洲色图| 人人澡人人澡人人看欧美| 一本色道久久综合亚洲| 国产欧美日韩三级| 国产又粗又长又大的视频| 狠狠色丁香婷婷综合影院| 国产91色在线|| 国产精品一区二区婷婷| 在线观看91视频| 正在播放国产对白害羞| 久久99国内精品| 波多野结衣激情| 久久综合偷偷噜噜噜色| 九九九久久国产免费| 亚洲国产精品18久久久久久| 一区二区三区中文字幕电影 | 国产精品视频在| 亚洲高清激情| 精品在线视频一区二区| 在线能看的av网址| 亚洲天堂av综合网| 最新黄色网址在线观看| 中文字幕一区二区在线观看| 欧美日韩第二页| 精品欧美激情在线观看| 国产精品视频不卡| 九色porny在线| 在线观看视频一区| 亚洲国产123| 丁香婷婷深情五月亚洲| 无码精品a∨在线观看中文| 国产精品一区二区精品| 中文字幕欧美亚洲| 探花视频在线观看| 中文字幕精品在线不卡| 日本77777| 极品少妇一区二区三区| 亚洲精品日产aⅴ| 182在线视频观看| 日韩久久免费视频| 中文字幕永久在线观看| 国产日产亚洲精品系列| 欧美日韩理论片| 在线亚洲欧美| 一本色道久久综合亚洲二区三区| 亚州一区二区三区| 久久艳片www.17c.com | 日韩五码在线| 日韩精品一线二线三线| 亚洲精品成a人ⅴ香蕉片| 欧美精品第一页在线播放| 日本不卡视频一区二区| 欧美精品v国产精品v日韩精品| 日本激情小视频| 激情五月激情综合网| 黄网站欧美内射| 日本午夜精品| 成人在线中文字幕| 久久综合之合合综合久久| 亚洲高清福利视频| 国产尤物在线观看| 精品美女久久久久久免费| 五月天色婷婷丁香| 久久先锋影音av鲁色资源网| 69久久精品无码一区二区| 日韩综合小视频| av在线免费观看国产| 九九热精品视频在线观看| 91在线在线观看| 中文在线а√在线8| 久久艹在线视频| 亚洲国产精品久久久久爰性色| 一区二区三区在线免费播放| 韩国av中国字幕| 麻豆一区二区三区| 成人观看免费完整观看| 成人激情开心网| 5566av亚洲| 欧美网站免费| 国产91精品久久久| 国产盗摄一区二区| 亚洲女成人图区| 韩国av永久免费| 一本久久a久久精品亚洲| 国产一级特黄毛片| 一区二区在线观看免费视频播放| 国产亚洲色婷婷久久| 老司机免费视频一区二区三区| 久久精品在线免费视频| 日韩av在线播放网址| 青娱乐一区二区| 亚洲精品蜜桃乱晃| 免费日韩电影在线观看| 欧美91在线| 国产在线播放不卡| 黄网站在线观| 永久免费精品影视网站| 欧美精品少妇| 亚洲欧美日韩直播| 你懂的免费在线观看| 91精品欧美一区二区三区综合在 | 色综合色狠狠综合色| 久久露脸国语精品国产91| 亚洲电影在线播放| 国产无遮挡免费视频| 亚洲图片欧美一区| 在线视频第一页| 国产亚洲一区字幕| 国产伦理片在线观看| 国产日产欧产精品推荐色| caopeng视频| 欧美激情在线看| 日韩一区二区三区四区视频| 成人免费在线播放视频| 欧美色图亚洲视频| 亚洲精品成人悠悠色影视| 欧美成人精品激情在线视频| 一区二区三区高清不卡| 国产网站在线看| 欧美日韩激情小视频| 国产第一页浮力| 一区二区三区中文在线| 一级免费在线观看| 色婷婷久久久综合中文字幕| 国产一二三四在线| 欧美日韩国产在线看| 波多野结衣视频观看| 欧美日韩黄色影视| 性欧美18一19性猛交| 亚洲精品美女视频| 国产高清一级毛片在线不卡| 久久天天躁狠狠躁老女人| 欧美videos另类精品| 2019av中文字幕| 狂野欧美性猛交xxxx| 亚洲最大福利网| 日韩一级电影| 正义之心1992免费观看全集完整版| 伊人春色精品| 一区二区三区四区久久| 在线精品在线| 天天碰免费视频| 国产电影一区二区三区| 成人免费播放视频| 26uuuu精品一区二区| 日本伦理一区二区三区| 亚洲午夜精品在线| 精品一区二区无码| 欧美成人一级视频| 精品人妻少妇AV无码专区| 亚洲精品中文字幕女同| 精品51国产黑色丝袜高跟鞋| 97精品视频在线观看| 日本午夜精品久久久久| 精品乱码一区二区三区| 国产精品91一区二区三区| 亚洲熟妇av日韩熟妇在线| 久久精品99国产精品| 95视频在线观看| 91丨九色丨蝌蚪富婆spa| 国产白丝一区二区三区| 欧美日韩亚洲一区二区三区| 一本一道无码中文字幕精品热| 日韩欧美国产网站| www.com欧美| 伊人久久久久久久久久| 99riav视频在线观看| 91牛牛免费视频| 都市激情亚洲欧美| 亚洲一二三区精品| 午夜电影亚洲| 亚洲va综合va国产va中文| www日韩大片| 国产精品theporn动漫| 538prom精品视频线放| 九一国产在线| 91av免费观看91av精品在线| 亚洲经典视频| 一级全黄肉体裸体全过程| 一区在线视频观看| 中文字幕一区二区在线观看视频| 国产.欧美.日韩| 天天色影综合网| 欧美日韩国产综合一区二区 | 先锋影音在线资源站91| 国产精品欧美久久久| 精品午夜视频| 精品卡一卡二| 亚洲茄子视频| 国产a级片视频| 一区二区三区在线观看国产| 国产精品玖玖玖| 北条麻妃久久精品| 欧美亚洲二区| 综合网五月天| 亚洲视频成人| 亚洲啪av永久无码精品放毛片 | 色综合久久88色综合天天看泰| 麻豆蜜桃在线观看| 国产尤物99| 在线综合欧美| mm131美女视频| 日韩人体视频一二区| 你懂得网站在线| 日韩美女视频中文字幕| 国产va免费精品观看精品视频| 8x8x华人在线| 国产福利一区二区三区| 熟女少妇内射日韩亚洲| 色婷婷久久久综合中文字幕| 亚洲第一精品网站| 欧美国产视频日韩| 免费国产在线视频| 一区二区三区四区视频精品免费| 国精产品久拍自产在线网站| 欧美日韩三级视频| 久久综合网导航| 99在线高清视频在线播放| 黄色欧美日韩| 少妇按摩一区二区三区| 欧美在线视频你懂得| 男人在线资源站| http;//www.99re视频| 欧美一区二区性| 中文字幕日韩综合| 一区二区三区精密机械公司| 蜜桃av中文字幕| 欧美亚洲国产日韩2020| 亚洲一区二区三区中文字幕在线观看 | 国产一区一区| 大荫蒂性生交片| 26uuu另类欧美| 一级片免费网站| 久久久久久久一区二区| 亚洲国产欧美日韩在线观看第一区 | 亚洲破处大片| 在线观看免费视频黄| 色综合天天综合给合国产| 免费看美女视频在线网站| 成人黄色片视频网站| 欧美在线三区| 在线观看av中文字幕| 欧美色综合网站| 久色国产在线| 日韩欧美99| 国产福利一区在线| 成人公开免费视频| 欧美成人激情视频免费观看| 亚洲人成网www| 欧美性猛交久久久乱大交小说| 久久久久9999亚洲精品| 国产精品自拍电影| 久久av.com| 国产成人三级| 黄色激情在线观看| 欧美日韩视频在线观看一区二区三区| 成年人视频免费在线观看| 成人欧美视频在线| 蜜臀国产一区二区三区在线播放| 综合 欧美 亚洲日本| 亚洲国产精品人人爽夜夜爽| 曰本一区二区|