精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Meta發布首個「非參數化」掩碼語言模型NPM:吊打500倍參數量的GPT-3

人工智能 深度學習
Meta發布首個非參數化掩碼語言模型NPM:那年雙手插兜,不知道什么叫做out of vocabulary。

雖然大型語言模型在NLP領域展現出的強大性能十分驚人,但其帶來的負面代價也很嚴重,比如訓練過于昂貴,難以更新等。,而且很難處理長尾知識。 

并且語言模型通常采用在預測層采用一個包含有限詞匯量的softmax層,基本上不會輸出少見的單詞或短語,極大限制了模型的表達能力。

為了解決模型的長尾問題,最近來自華盛頓大學、Meta AI和艾倫人工智能研究所的學者聯合提出了首個「非參數化掩碼語言模型」(NonParametric Masked language model, NPM),通過參考語料庫中每個短語的非參數化分布來代替softmax輸出。

圖片

論文鏈接:https://arxiv.org/abs/2212.01349

代碼鏈接:https://github.com/facebookresearch/NPM

NPM可以通過對比目標(contrastive objective)和批內近似于檢索完整語料庫的方式進行有效訓練。

研究人員對9個封閉式任務和7個開放式任務進行了zero-shot評估,包括強調需要預測新事實或罕見短語的時空轉換和詞級翻譯任務。

結果發現,無論是否采用檢索和生成的方法,NPM都明顯優于較大的參數模型,比如參數量高500倍的GPT-3和37倍的OPT 13B性能還強不少,并且NPM在處理罕見模式(詞義或事實)和預測罕見或幾乎未見過的詞(如非拉丁文字)方面尤其出色。

首個非參數化語言模型

雖然結合現有的一些檢索和生成(retrieve-and-generate)的相關工作可以緩解該問題,但這些模型的最終預測部分仍然需要一個softmax層來預測token,沒有從根本上解決長尾問題。

NPM由一個編碼器和一個參考語料庫組成,編碼器將文本映射成一個固定大小的向量,然后NPM從中檢索出一個短語并填入[MASK]。

圖片

可以看到,NPM選擇在短語上得到的非參數化分布,而沒有使用一個固定的輸出詞匯softmax作為輸出。

但訓練非參數化模型也帶來了兩個關鍵的問題:

1. 在訓練過程中檢索完整的語料庫是非常耗時耗力的,研究人員通過使用完整語料庫檢索的批內近似值來解決;

2. 在沒有解碼器的情況下學習預測任意長度的短語是很困難的,研究人員通過擴展span masking和短語級別的對比目標來解決。

總之,NPM完全刪除了輸出詞匯的softmax,通過預測任意數量的n-gram,實現了有效的無界輸出空間。

由此產生的模型可以預測「極其罕見」甚至是「完全未見過」的單詞(如韓語單詞),并可以有效地支撐無限的詞匯量,而現有的模型都無法做到這一點。

NPM方法

NPM的關鍵思想是使用編碼器將語料庫中的所有短語映射到一個密集的向量空間中。在推理時,當給定一個帶有[MASK]的查詢后,使用編碼器從語料庫中找到最近的短語并填入[MASK]。

純編碼器(Encoder-only)模型是一個很有競爭力的表示模型,但現有的純編碼模型無法進行token數量未知的預測,使得它們的使用情況在沒有微調的情況下受到限制。

NPM通過檢索一個短語來填補[MASK]中的任意數量的token,從而解決了這個問題。

推理

編碼器將參考語料庫C中的每個不同的短語都映射到一個密集的向量空間中。

在測試時,編碼器將被masked的查詢映射到相同的向量空間中,并從C中檢索出短語來填充[MASK]。

在這里,C不一定要和訓練語料庫一樣,在測試時可以被替換或擴展,而不需要重新訓練編碼器。

在實踐中,語料庫中存在大量的短語,對所有的短語進行索引是很昂貴的。

比如我們考慮最多有 l 個token的短語(l≈20),就需要索引 l×|C| 數量的向量,這可能會很耗時。

圖片

研究人員對C中每個不同的token進行索引,從而將索引的大小從l×|C|減少到 |C|,然后在測試時,通過對開頭和結尾分別進行k近鄰搜索,對所有短語的非參數分布進行近似。

比如由4個BPE token組成的短語Thessaloniki用c1和c4的連接來表示,分別對應于該短語的開始(The)和結束(iki)。

然后用同一向量空間中的兩個向量q_start和q_end來表示一個查詢,然后用每個向量來檢索似是而非的短語的開始和結束,然后再進行聚合。

這樣做的前提是開始和結尾的表示足夠好,即q起點足夠接近c1,q終點足夠接近c4,而這一點在訓練過程中已經得到確保了。

訓練

NPM是在無標簽的文本數據上訓練的,以確保編碼器將文本映射到一個良好的密集向量空間。

訓練NPM主要有兩個難題:1)完整的語料庫檢索會使訓練非常耗時;2)用任意長度的短語而不非token來填充[MASK]。

1. 掩碼Masking

片段掩碼(span masking)就是對長度從幾何分布中取樣的連續token進行mask。

研究人員對此進行擴展:

1)如果某些片段在batch中的其他序列中共同出現,再對其進行屏蔽,以保證在訓練期間該批次內的正例(in-batch positives)。

圖片

比如,屏蔽的片段2010、the Seattle Seahawks和to the都在另一個序列中共同出現。

但對于「game ,」這個bigram來說就無法一起被mask,雖然它們也都出現在兩個序列中,但它們并沒有在一起共現。

2)不是用[MASK]來替換片段中的每個token,而是用兩個特殊的token [MASKs][MASKe]來替換整個片段。

比如上面的例子中,不論被mask的片段長度如何,都被替換成[MASKs][MASKe],從而可以獲得每個片段的起點和終點向量,更方便推理。

2. 訓練目標

圖片

假設被mask的片段是the Seattle Seahawks,在測試時,模型應該從參考語料庫的其他序列中檢索出the Seattle Seahawks這一短語。

而在推理階段,模型從[MASKs]和[MASKe]中獲得向量,并利用它們分別從語料庫中檢索出短語的開始和結束。

因此,訓練的目標應該鼓勵[MASKs]的向量更接近于the Seattle Seahawks中的the,而與其他token相距較遠,并且不應該是任意一個短語中的the,比如become the first中。

通過將完整的語料庫近似為batch中的其他序列來訓練模型來做到這一點,具體來說,訓練模型從同一batch的其他序列中檢索出the Seattle Seahawks這一片段的起點和終點。

需要注意的是,該mask策略確保每個被遮蔽的跨度在一個batch中都有一個共同出現的片段。

實驗部分

從結果上看,NPM在zero-shot設置下比其他基線模型的性能都要強。

圖片

在參數化模型中,RoBERTa取得了最好的性能,出人意料地超過了包括GPT-3等在內的模型,可能是因為純編碼器模型的雙向性起到了至關重要的作用,這也表明,因果語言模型可能不是一個合適的分類選擇。

kNN-LM方法在參數模型中加入了非參數成分,其性能優于其他所有基線。盡管如此,僅僅依靠檢索(kNN)在GPT-2中的表現很差,這表明僅在推理時使用kNN是有限的。

NPM SINGLE和NPM的表現都明顯優于所有基線,在所有數據集上都取得了一致的優越性能。這表明,即使對于不明確需要外部知識的任務,非參數模型也非常有競爭力。

定性分析時采用RoBERTa和NPM在情感分析任務時的預測結果。第一個例子用便宜表示不貴,第二個例子用便宜表示質量很差。

圖片

RoBERTa對這兩個例子的預測都是正向的,而NPM通過檢索在與輸入相同的語境中使用cheap的語境,做出了正確的預測。

還可以發現,NPM輸出的表征能帶來更好的詞義消歧。例如,RoBERTa在cheap(廉價)和cheap(質量很差)之間分配了一個很高的相似性分數。

另一方面,NPM成功地在cheap和cheap之間分配了一個低的相似性分數,也表明該非參數訓練與對比性目標是有效的,可以更好地提高表征學習,而kNN推理這類沒有訓練的算法是完全做不到的。

參考資料:https://arxiv.org/abs/2212.01349

責任編輯:武曉燕 來源: 新智元
相關推薦

2021-07-13 17:38:49

算法語言模型GPT-4

2021-08-12 16:27:04

模型人工智能深度學習

2022-08-18 15:13:37

模型參數

2022-03-24 10:35:38

人工智能模型代碼

2023-02-25 21:45:55

模型AI

2021-12-10 15:46:18

谷歌模型人工智能

2022-01-05 10:33:56

開發者技能DeepMind

2021-09-30 11:20:01

AI 數據人工智能

2022-05-05 08:25:22

模型OpenAI代碼

2022-03-14 09:33:56

神經網絡模型人工智能

2022-05-05 09:00:00

AI模型數據

2021-03-23 15:21:00

人工智能機器學習技術

2024-04-19 10:32:08

2022-05-07 13:04:34

Meta語言模型開源

2025-03-03 08:00:00

OpenAI模型AI

2024-05-20 08:50:00

模型神經網絡

2021-09-08 17:23:33

谷歌模型開發

2023-02-25 16:14:36

AIMeta語言模型

2023-09-11 13:28:00

AI模型

2023-01-06 15:07:03

點贊
收藏

51CTO技術棧公眾號

国产成人精品一区二区三区| 日韩欧美国产午夜精品| 五码日韩精品一区二区三区视频| 亚洲综合一区中| 欧美在线免费| 日韩av在线不卡| 超碰在线播放91| 图片区小说区亚洲| 国产婷婷一区二区| 亚洲精品欧美一区二区三区| 国产精品一区二区6| 色天天久久综合婷婷女18| 日韩视频在线一区二区| 成人黄色片视频| 中文字幕在线三区| 日本一区二区三级电影在线观看 | 精品三区视频| 亚洲大片在线观看| 夜夜爽99久久国产综合精品女不卡| 超碰在线人人干| 全部av―极品视觉盛宴亚洲| 久久人人97超碰精品888| 四虎永久免费地址| 欧美人与牛zoz0性行为| 欧美成人国产一区二区| 国产九九热视频| 亚洲精品福利电影| 亚洲一级片在线观看| 亚洲精品不卡| 欧美性孕妇孕交| 福利一区福利二区| 成人性生交大片免费观看嘿嘿视频| 性无码专区无码| 国内视频精品| 久久亚洲精品一区| 国产黄a三级三级| 国产探花在线精品| 亚洲精品之草原avav久久| 野战少妇38p| 欧美日韩国产一区二区在线观看| 欧美三级中文字| 日韩欧美黄色大片| 欧美大胆成人| 欧美日韩亚洲精品一区二区三区 | 少妇太紧太爽又黄又硬又爽小说 | 国产麻豆一精品一av一免费| 国产精品成人v| 日韩免费av网站| 爽好多水快深点欧美视频| 97在线看福利| 黄色小说在线观看视频| 欧美日韩少妇| 欧美精品电影在线| 天天操天天射天天爽| 国产精品v日韩精品v欧美精品网站| 久久精品精品电影网| 战狼4完整免费观看在线播放版| 黑人操亚洲人| 国产亚洲欧洲高清| 九九热久久免费视频| 日韩国产一区| 日日摸夜夜添一区| 欧美88888| 亚洲电影在线一区二区三区| 日韩视频在线观看免费| 青青草成人免费| 亚洲国产影院| 欧洲成人免费aa| 一二三区免费视频| 美女在线视频一区| 96sao精品视频在线观看| 精品国产av 无码一区二区三区| 国产精品亚洲午夜一区二区三区| 9a蜜桃久久久久久免费| 日本黄色大片视频| 高清视频一区二区| 久久综合久久久| h网站在线免费观看| 亚洲婷婷在线视频| 成年人网站国产| 欧美激情喷水| 91精品国产综合久久精品麻豆| 丰满人妻一区二区三区大胸| 欧美色图婷婷| 尤物tv国产一区| 欧美黑人性猛交xxx| 精品999成人| 日韩免费黄色av| 国产老女人乱淫免费| 成人精品国产福利| 性欧美videosex高清少妇| 黄色网页在线观看| 亚洲成人av免费| 国内自拍视频网| 777久久精品| 亚洲一区第一页| 麻豆视频在线观看| 日韩精品福利网| 亚洲影院在线看| 日本护士...精品国| 亚洲欧美日韩中文字幕一区二区三区| 男人插女人视频在线观看| 视频在线日韩| 精品国产在天天线2019| 女人裸体性做爰全过| 亚洲欧洲一区| 中文视频一区| 亚洲美女性视频| 日本黄色免费片| 午夜亚洲视频| 国产91视觉| 亚洲欧美视频一区二区| 岛国av一区二区三区| 黄色a级三级三级三级| 国产日产精品一区二区三区四区的观看方式| 丝袜美腿精品国产二区| 五月天婷婷久久| 国产成人超碰人人澡人人澡| 一本一本久久a久久精品综合妖精| 2021天堂中文幕一二区在线观| 欧美军同video69gay| 亚洲一级中文字幕| 影音先锋亚洲精品| 91在线观看网站| 一区二区高清不卡| 欧美亚洲精品一区| 一区二区黄色片| 欧美一区=区| 黑人另类av| 大黄网站在线观看| 欧美一区二区女人| 国产农村妇女精品一区| 久久综合五月| 欧美福利精品| 绿色成人影院| 精品处破学生在线二十三| 9999热视频| 激情文学综合插| 亚洲bbw性色大片| 日本欧美韩国| 亚洲欧美激情在线视频| 久久久成人免费视频| 91在线看国产| 国产免费毛卡片| 精品在线观看入口| 国产成人精品电影久久久| 日韩资源在线| 色婷婷精品久久二区二区蜜臀av | 国产精品乱人伦| 天天爱天天操天天干| 欧美中文字幕一区二区| 国产精品 欧美在线| 狠狠狠综合7777久夜色撩人| 一本久久a久久精品亚洲| 三级网站在线免费观看| 日韩av二区在线播放| 五月天亚洲综合情| 另类一区二区三区| 久久精品人人做人人爽| 国产成人精品av在线观| 亚洲综合一区二区| 2一3sex性hd| 午夜亚洲一区| 一本久道久久综合| 日韩精品视频在线看| 欧美精品videosex牲欧美| 欧美一区二区公司| 色网站国产精品| 国精产品一区一区二区三区mba| 国产伦精一区二区三区| youjizz.com在线观看| 巨人精品**| 91成人在线视频| 北岛玲日韩精品一区二区三区| 欧美日本在线看| 久久久久久久久久久网 | 日韩你懂的在线观看| 中文在线观看免费网站| 久久精品一区二区三区四区| 亚洲黄色片免费| 亚洲国产黄色| 亚欧精品在线| xxxxxhd亚洲人hd| 日本中文字幕不卡免费| 国产在线高潮| 成人精品免费视频| 51午夜精品视频| 午夜小视频在线| 精品国产乱码久久久久久1区2区| 中日韩黄色大片| 自拍偷拍国产亚洲| 亚洲精品在线视频免费观看| 日韩国产在线观看一区| 久青草视频在线播放| 国产真实有声精品录音| 91久久爱成人| av在线播放一区| 日韩中文字幕免费| 天天操天天插天天射| 欧美日韩情趣电影| 日日噜噜噜噜人人爽亚洲精品| 亚洲视频免费观看| 久久久久久久毛片| heyzo一本久久综合| 中文字幕第38页| 亚洲免费一区二区| 三级在线免费观看| 青青草国产免费一区二区下载| 国产精品日韩高清| 亚洲天堂网站| 国产精品一区二区久久| 日韩电影免费看| 欧美另类暴力丝袜| 永久免费av在线| 亚洲精品之草原avav久久| 欧洲成人在线观看| 四虎在线观看| 精品福利一二区| av手机免费看| 欧美蜜桃一区二区三区| 黄色在线视频网址| 亚洲第一成年网| 毛片a片免费观看| 成人免费在线视频观看| 国产精品天天干| 91香蕉视频在线| 制服丝袜在线第一页| 黑人巨大精品欧美黑白配亚洲| 中文字幕欧美人妻精品一区| 午夜亚洲伦理| 春日野结衣av| 亚洲在线日韩| www.99热这里只有精品| 精久久久久久| 男人天堂a在线| 国产精品hd| 福利在线小视频| 亚洲91精品| 伊甸园精品99久久久久久| 日韩一区欧美| 亚洲精品欧美精品| 日韩欧美不卡| 亚洲一区bb| 日韩理论电影院| 中文字幕一区二区三区在线乱码 | 欧美交换配乱吟粗大25p| 国产精品久久久久久久久妇女| 亚洲一区二区在| 国产高清欧美| 欧美 国产 精品| 欧美精品首页| 成年女人18级毛片毛片免费| 狠狠入ady亚洲精品| 东北少妇不带套对白| 日韩午夜在线| 黄色片视频在线播放| 爽好久久久欧美精品| 欧美成人福利在线观看| 国产在线精品一区二区不卡了| 日韩av影视大全| 国产91综合网| 亚洲男人在线天堂| 久久九九全国免费| 少妇视频一区二区| 一区二区三区欧美在线观看| 精品一区二区三区人妻| 欧美日韩午夜激情| 中国一级特黄视频| 欧美一区二区性放荡片| 性生交大片免费看女人按摩| 亚洲国产三级网| 999国产在线视频| 欧美wwwxxxx| 黄色污网站在线观看| 国产成人91久久精品| 亚洲18在线| 国产伦精品一区二区三| 美女精品一区最新中文字幕一区二区三区| 日韩精品伦理第一区| 中文无码久久精品| 妺妺窝人体色www在线小说| 日韩国产一区二| 色姑娘综合天天| 久久新电视剧免费观看| 青青操在线播放| 午夜精品久久久久久久99樱桃| 中文字幕一区二区人妻视频| 91精品午夜视频| 欧美高清成人| 久久综合色影院| 一区二区三区短视频| 亚洲一区二区三区777| 全国精品免费看| 亚洲精品偷拍视频| 久久久久免费| 51自拍视频在线观看| 久久婷婷色综合| 九九热视频精品| 欧美丝袜第三区| 欧美在线精品一区二区三区| 综合网日日天干夜夜久久| 9lporm自拍视频区在线| 国产精品麻豆va在线播放| 久久男人av| 日韩中文字幕亚洲精品欧美| 日韩电影在线免费看| 图片区偷拍区小说区| 亚洲欧洲日韩在线| 国产性生活视频| 亚洲激情第一页| 性欧美video高清bbw| 国产精品视频免费观看www| 欧美激情15p| 中文字幕人妻熟女人妻洋洋| 视频一区在线播放| 国产成人精品综合久久久久99 | 午夜视频网站在线观看| 欧美精品一区二区蜜臀亚洲| 国产网友自拍视频导航网站在线观看| 国产99视频精品免视看7| 韩国女主播一区二区三区| 在线观看污视频| 精品在线免费观看| 国产精品av久久久久久无| 欧美日韩日本国产| 天天操天天干天天插| 九九久久久久久久久激情| 亚洲精品乱码日韩| 日韩伦理一区二区三区av在线| 国产亚洲精品自拍| 成人免费毛片日本片视频| 亚洲福中文字幕伊人影院| 亚洲成人第一区| 九九热最新视频//这里只有精品| 91麻豆精品| 国产日产欧美一区二区| 国内国产精品久久| 疯狂撞击丝袜人妻| 这里只有精品视频在线观看| 日本高清在线观看wwwww色| 国产精品视频一区国模私拍| 国产一区二区电影在线观看| aaa毛片在线观看| 国产喂奶挤奶一区二区三区| aaa人片在线| 亚洲精品一区中文字幕乱码| 一区一区三区| 五月婷婷综合色| 毛片一区二区三区| 国产67194| 日韩精品中文字幕一区| 蜜臀av在线| 久久精品日产第一区二区三区| 在线视频精品| 先锋影音av在线| 欧美日韩电影在线播放| 在线中文字幕第一页| 成人h在线播放| 亚洲综合二区| 中文字幕伦理片| 911精品产国品一二三产区| 成人在线app| 国产一区二区三区黄| 久久婷婷丁香| 欧美另类videoxo高潮| 日韩欧美一区在线| 国产乱码精品一区二三赶尸艳谈| 久久99精品国产99久久| 久久九九国产| 天天做夜夜爱爱爱| 精品国产乱码久久| 国产精品高清乱码在线观看| 亚洲综合网中心| 不卡av在线免费观看| 黄色片中文字幕| 麻豆国产va免费精品高清在线| 给我免费播放日韩视频| 亚洲精品无码久久久久久| 国产精品久久久久久久久免费丝袜| 国产精品久久婷婷| 97在线观看视频| 久久亚洲国产| 亚洲国产第一区| 欧美群妇大交群中文字幕| 福利网站在线观看| 亚洲国产精品综合| 成人黄色777网| 中文字幕+乱码+中文乱码www| 久久久久久国产免费| 欧美日韩有码| 老熟妇精品一区二区三区| 欧美午夜不卡视频| av在线小说| 宅男噜噜99国产精品观看免费| 成人精品免费视频| 国产日产亚洲系列最新| 日韩免费中文字幕| 好看的av在线不卡观看| 特黄一区二区三区| 日韩精品欧美国产精品忘忧草|