精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

陳丹琦組掩蔽語言模型研究:15%掩蔽率不是最佳,40%站得住腳嗎?

人工智能 新聞
自BERT以來,大多數人堅持的模型訓練15% mask rate慣例被打破了?

前段時間,斯隆基金會公布了2022 年度斯隆研究獎的獲獎者,陳丹琦、方飛、顧全全、李博等多位研究者獲得了計算機科學領域的獎項。

在獲獎后不久,陳丹琦所在的團隊就公布了一項新研究。但和陳丹琦之前廣受贊譽的各項工作不同,這一新作受到了諸多質疑。

這個工作是關于掩蔽語言建模( masked language modeling,MLM)的。掩蔽語言模型通常使用15%的掩蔽率,因為大家發現,更高的掩蔽率將不能提供足夠的上下文來學習良好的表示,而更低的掩蔽率將大幅提高訓練成本。但陳丹琦等人卻發現,如果將掩蔽率提高到40%,性能可以超過15%的基線;如果提高到80%,大部分性能仍能得以保留,這是在下游任務上進行微調測得的結果。

由于和不少人自身實驗的結果并不符合,而且沒有開源代碼,所以這一研究在推特、知乎等平臺上引起了很大的爭議。

有人認為,這就是一個調參的結果,沒有理論依據,「黑盒的層面很多」,能不能復現也不好說。但也有人認為,如果嚴格按照論文的設置,論文的結果能夠復現,就相當于「有人事先把最優參數調出來了」,這也沒什么不好。而且,這篇論文還能「啟發大家重新反思MLM的使用」,所以算得上是一個有價值的工作。

知乎鏈接:https://www.zhihu.com/question/517319014?utm_source

接下來,我們就一起來看下這項工作。

這篇文章寫了什么

幾個月前,何愷明的Masked Autoencoders成為了計算機視覺的熱門,其遮蔽80%還能腦補原圖的重建能力驚為天人。何愷明等人在其論文中展望了預訓練大模型在CV領域的前景,而在NLP領域里,人們訓練算法通常使用的遮蔽比例是15%。在陳丹琦的新研究中,這一數字被顯著提高了。

論文鏈接:https://arxiv.org/abs/2202.08005

預訓練語言模型已經改變了自然語言處理領域的格局。大型語言模型經過巨量文本數據的訓練,可獲得豐富多樣的語言表示能力。與總是預測序列中下一個token的自回歸模型相比,像 BERT 這樣的掩蔽語言模型(MLM)會根據上下文預測輸入token的掩蔽子集,由于具有雙向性質,此方法效果通常更佳。

此種方法是把模型限制為只掩蔽一小部分token內容開始進行學習的,通常為每序列15%。15%的數字反映這樣一個假設——若掩蔽太多文本,則模型無法很好地學習表示,這一思路被BERT之后的研究普遍采用。同時,僅對 15% 的序列進行預測已被視為對 MLM 進行有效預訓練的限制。

在普林斯頓大學陳丹琦等人的研究中,作者發現了與此前結論完全不同的情況:在有效的預訓練方案下,他們可以掩蔽 40-50% 的輸入文本,并獲得比默認的 15% 更好的下游性能。

下表展示了掩蔽 80%、40%和15% 的情況下,預訓練模型的下游性能。在掩蔽率為80%的條件下,大多數上下文內容已變得不可見,但相比15%掩蔽,模型仍能學習到接近的預訓練表示效果。這挑戰了人們關于掩蔽率的直覺,并提出了模型如何從高掩蔽率中受益的問題。

表1:不同掩蔽率下的掩蔽示例、驗證困惑度和下游任務性能。在這里,所有模型都是有效預訓練條件下訓練的大模型。

沿著這一方向,作者建議將掩蔽率分解為兩個因素:損壞率(corruption rate,有多少上下文被掩蔽)和預測率(prediction rate,模型預測的token有多少)。在 MLM 中,損壞率和預測率都與掩蔽率相同。然而,這兩個因素具有相反的效果:雖然較高的預測率會產生更多的訓練信號并有利于優化,但較高的損壞率會使學習問題在較少上下文的情況下更具挑戰性。

為獨立研究這兩個因素,作者設計了消融實驗來分離損壞和預測。實驗證明,模型可受益于更高的預測率,更高的損壞率則不然。更高的預測率所帶來的好處能否掩蓋更高的損壞率所帶來的負面影響,決定了模型能否在更高的掩蔽率下表現得更好。研究者還發現,擁有處理更高損壞率的更大的模型表現出了更高的最佳掩蔽率。

受這一結果啟發,作者在復雜情況下考慮了更高的掩蔽率,例如span掩蔽和 PMI 掩蔽。當以 15% 的掩蔽率進行評估時,這些方法被證明優于簡單的均勻掩蔽(uniform masking),但均勻掩蔽在其各自的最佳掩蔽率下與復雜的掩蔽基線相比具有競爭力。本文作者表示,他們提出的新的預測率-損壞率框架也為 BERT 基于原始或隨機token(80-10-10 策略)的預測實踐提供了新的思路——如果沒有它,模型通常會表現得更好。

作者在討論中表示,在 MLM 中采用更高的掩蔽率會帶來更好的性能,尤其是在資源有限的環境中。從輸入中移除掩蔽token,或解耦損壞率和預測率,有望進一步加速預訓練。

具體來說,這項研究的貢獻包括:

  • 研究證明,訓練具有較高掩蔽率的掩蔽語言模型是可以成功的。例如,具有高效預訓練方法的大模型在掩蔽率為40%的情況下比15%的情況下表現更好;
  • 研究者建議將掩蔽率分解為損壞率和預測率,這兩個相反的要素分別影響任務難度和訓練信號,研究者使用該框架表明,較大的模型有更高的最優掩蔽率,并且只使用[ MASK ]token掩蔽優于80-10-10策略;
  • 研究證明,在高掩蔽率下,與span掩蔽和PMI掩蔽等更高級的掩蔽方案相比,均勻掩蔽更具競爭力。

掩蔽語言模型通常使用15%的掩蔽率,研究者一般認為更高的掩蔽率會導致用來學習良好表征的上下文不足,而更低的掩蔽率則會導致訓練成本太高。

在這項研究中,研究者發現高達40%的掩蔽率可以超過15%的baseline,即使是80%的掩蔽率也可以保持大部分性能,這可以通過對下游任務進行微調來衡量。

實驗結果

在消融實驗中研究者發現,增加掩蔽率有兩方面影響:1、更高比例的輸入token被損壞,減少了上下文的大小并創建了一個更困難的任務;2、模型會執行更多的預測,這有利于訓練。研究者觀察到,較大的模型特別適合更高的掩蔽率,因為大模型本身具備更高的能力來執行困難任務。進一步地,研究者將該發現與復雜的掩蔽方案結合起來,比如span掩蔽和PMI掩蔽,以及BERT的80-10-10策略,并發現使用[MASK]替代的簡單均勻掩蔽在更高的掩蔽率下具備競爭力。

圖1:掩蔽率對具有高效預訓練方案的大模型的影響。研究者發現,在大多數任務中,更高的掩蔽率比15%的掩蔽率表現更好,40%是最佳的掩蔽率。

表2:大模型、高效預訓練方法的條件下,15% 或40% 掩蔽率在 GLUE 基準上的測試結果對比。

圖2:在掩蔽率為15%和40%的情況下,使用高效的預訓練方法訓練的大模型的下游任務性能。

表3:損壞率 vs. 預測率。以40%的掩蔽作為基線,分離m_corr和m_pred,并分別對它們進行操作。趨勢是明確的:更高的預測率是有益的,但更高的損壞率是有害的。

圖3:掩蔽率對不同大小的模型的影響。可以發現,較大的模型擁有較大的最佳掩蔽率。

未來展望

研究者進一步討論了其他語言模型中的掩蔽率問題,除MLM之外,還有其他被廣泛用于NLP任務的預訓練方案,包括自回歸語言模型(Radford et al., 2018; Brown et al., 2020) 和sequence-to-sequence語言模型(Raffel et al., 2020; Lewis et al., 2020)。類似地,sequence-to-sequence語言模型以一定的掩蔽率損壞文本,并用自回歸的方式預測掩蔽文本。T5(Raffel et al., 2020)也采用了15%的掩蔽率。研究者準備擴大研究,比如研究文本到文本模型,并探討掩蔽率和不同類型解碼器之間的相互作用。
更多內容請參考原論文。


責任編輯:張燕妮 來源: 機器之心Pro
相關推薦

2022-02-17 14:52:10

模型AI谷歌

2025-08-29 14:06:40

2022-07-26 09:56:48

模型AI

2024-12-12 16:43:44

2023-10-12 12:13:16

AI訓練

2023-08-20 22:51:06

2023-08-17 15:04:01

2025-01-08 13:05:56

2025-06-25 09:15:38

AI模型LLM

2025-02-13 12:23:28

2024-05-27 08:40:00

2024-10-08 14:48:24

2025-09-28 15:35:32

AI模型強化學習

2021-05-07 09:34:20

量子芯片計算機

2023-10-25 09:19:00

AI訓練

2025-01-16 09:00:00

2021-05-20 17:04:23

AI

2024-07-18 12:58:03

2023-07-11 10:14:52

2025-01-07 12:55:00

訓練數據模型
點贊
收藏

51CTO技術棧公眾號

精品蜜桃在线看| 国产伦精品一区二区三区免费 | 中文字幕在线播放av| 久久av资源| 在线看不卡av| 中文字幕の友人北条麻妃| 免费国产精品视频| 日韩制服丝袜av| 久久久精品美女| 中文字幕在线播放视频| 99亚洲伊人久久精品影院| 亚洲免费观看高清完整版在线观看熊 | 欧美日韩高清免费| 国产女人爽到高潮a毛片| 99亚洲视频| 色偷偷av一区二区三区乱| 国产精九九网站漫画| 亚洲精品日韩成人| 日本视频www色| 女主播福利一区| 亚洲欧美日韩网| 最好看的中文字幕| av在线日韩| 亚洲一区中文在线| 日本成人黄色| 亚洲精品国产精品国| 日韩国产欧美三级| 午夜精品久久久久久久久久久久 | 国产情侣一区二区| 久久中文欧美| 午夜剧场成人观在线视频免费观看| 极品蜜桃臀肥臀-x88av| 欧美成人基地| 日韩欧美国产不卡| 天天操狠狠操夜夜操| av高清不卡| 亚洲成av人影院| 国产麻豆电影在线观看| 九九九伊在人线综合| 国产很黄免费观看久久| 国产一区玩具在线观看| 精品成人无码久久久久久| 亚洲伦理精品| 欧美国产精品va在线观看| 日本猛少妇色xxxxx免费网站| 日本韩国欧美超级黄在线观看| 日韩三级高清在线| 在线播放黄色av| 日韩成人精品一区二区三区| 色欧美片视频在线观看在线视频| 伊人成色综合网| 97在线超碰| 亚洲成人在线观看视频| 无颜之月在线看| 中文字幕中文字幕在线十八区| 国产精品久久久久久久久晋中| 日韩久久不卡| 国产精品久久久久久久龚玥菲| 2014亚洲片线观看视频免费| 久久精品ww人人做人人爽| 性xxxx18| 久久九九全国免费| 日本三级中国三级99人妇网站 | 精品国产欧美一区二区三区成人| 69精品无码成人久久久久久| 精品国产精品久久一区免费式| 亚洲欧美国产一本综合首页| wwwwxxxx国产| 极品美女一区二区三区| 在线视频日本亚洲性| 美国美女黄色片| 亚洲va在线| 欧美激情精品久久久久久久变态| 麻豆一区二区三区精品视频| 激情五月***国产精品| 性欧美暴力猛交69hd| 欧美a∨亚洲欧美亚洲| 久久国产日韩| 国产精品一区av| 99热这里只有精| 成人激情午夜影院| 欧美污视频久久久| 91精品专区| 一区二区三区欧美在线观看| 日韩日韩日韩日韩日韩| 校园春色亚洲色图| 在线播放中文一区| 国产精品久久久久久亚洲色| 九九久久成人| 久久精品国产一区| 日韩欧美三级在线观看| 日本中文字幕一区二区视频| 成人性生交大片免费观看嘿嘿视频| 亚洲国产精品18久久久久久| 91小视频免费观看| 在线免费观看成人网| 欧美男男video| 色国产精品一区在线观看| 久久成年人网站| 全国精品免费看| 日韩中文在线视频| 国产精品成人aaaa在线| 日韩成人精品在线观看| 91丝袜脚交足在线播放| 久久久久久久久亚洲精品| 亚洲免费观看高清| 国产视频在线视频| 成人动漫视频| 色综合伊人色综合网站| 99热国产在线观看| 国产资源在线一区| 欧美午夜精品久久久久免费视| 成人福利网站| 在线一区二区三区| 久久久高清视频| 久久久久久美女精品| 日韩av手机在线| www黄色网址| 国产精品色眯眯| 国产精品无码av在线播放| 亚洲精品成人一区| 亚洲天堂男人天堂| 日韩精品手机在线| 国产成人综合在线| 在线观看成人一级片| 日本三级一区| 亚洲成色777777女色窝| 婷婷久久综合网| 免费久久精品视频| 久久伊人一区| jizz一区二区三区| 欧美一区中文字幕| 强制高潮抽搐sm调教高h| 久久午夜精品| 久久精品国产精品国产精品污 | 欧美一级高清免费| 老牛影视av牛牛影视av| 亚洲三级小视频| 日本美女高潮视频| 精品国产一区一区二区三亚瑟| 精品三级在线观看视频| 一个色在线综合| 日本不卡一区在线| 国产成人久久| 欧美中文在线视频| 手机看片福利永久| 亚洲国产色一区| 91亚洲一区二区| 久久久久亚洲| 成人网在线观看| 日本不卡在线| 欧美精品一二三| www.xx日本| 卡一卡二国产精品| 亚洲最大免费| 亚洲狼人综合| 久久好看免费视频| 亚洲最大成人在线视频| 国产精品久久久久一区二区三区共| 一本久道综合色婷婷五月| 小说区图片区色综合区| 欧美专区中文字幕| 国产主播福利在线| 在线免费av一区| 一级特黄曰皮片视频| 美女国产一区二区| 手机成人av在线| 欧美日韩黄色| 久久久久久久久久久国产| wwwav网站| 午夜精品一区二区三区三上悠亚| 中文字幕在线播放视频| 首页亚洲欧美制服丝腿| 神马影院午夜我不卡| 国产欧美自拍| 欧美成人午夜视频| 日本国产在线观看| 色www精品视频在线观看| 91麻豆制片厂| 国产精品99久| 日韩av资源在线| 99久久精品费精品国产风间由美 | 永久免费网站视频在线观看| 日韩一区二区三区精品视频第3页| 久久久久久美女| 精品久久久久一区二区三区| 欧美绝品在线观看成人午夜影视| 久久久一二三区| 久久亚洲一区二区三区明星换脸| 午夜激情av在线| 亚洲香蕉网站| 日本视频一区在线观看| 高清一区二区三区av| 国语自产偷拍精品视频偷| 国产综合在线观看| 日韩欧美一区二区三区在线| 亚洲国产成人无码av在线| 中文字幕一区在线观看视频| 无码人妻精品一区二区三区99不卡| 久久夜色精品| 国产在线xxxx| 成人91在线| 国产精品香蕉视屏| 国产精品第一国产精品| 97在线视频精品| www.欧美日本韩国| 亚洲人成欧美中文字幕| www.黄色一片| 欧美私模裸体表演在线观看| 国产真实的和子乱拍在线观看| 久久精品日韩一区二区三区| 免费看91视频| 美国一区二区三区在线播放| 少妇高潮喷水在线观看| 88国产精品视频一区二区三区| 看高清中日韩色视频| 日韩激情综合| 国产精品偷伦一区二区| 色偷偷偷在线视频播放| 欧美片一区二区三区| 2021av在线| 精品亚洲aⅴ在线观看| 性欧美videos另类hd| 欧美伦理视频网站| 国产精品乱码一区二区视频| 午夜一区二区三区视频| 欧美日韩在线视频免费| 国产精品理论在线观看| 一区二区三区久久久久| 91麻豆国产香蕉久久精品| 一级黄色片毛片| 国产精品99久久久久久有的能看 | 大美女一区二区三区| 天天操狠狠操夜夜操| 日本亚洲免费观看| 日韩亚洲在线视频| 视频在线观看国产精品| 国产网站免费在线观看| av不卡在线看| 欧美一区二区中文字幕| 99国产精品私拍| 男人日女人视频网站| 韩国在线一区| 久久精品xxx| 亚洲五月婷婷| www插插插无码免费视频网站| 91精品一区国产高清在线gif| 亚洲日本精品一区| 四虎成人av| 亚洲免费视频播放| 欧美久久99| 久久久久久www| 亚洲精选在线| 久久综合色视频| 六月天综合网| 91蝌蚪视频在线观看| 日韩av中文字幕一区二区| 天天碰免费视频| 免费黄网站欧美| 福利片一区二区三区| 国产精品一二三四五| 国产精九九网站漫画| 91在线看国产| 亚洲一区二区三区日韩| 中文字幕一区在线| 久热这里有精品| 亚洲成人在线网站| 最新中文字幕一区| 欧美在线观看18| 国产又粗又黄又爽的视频| 91精品国产色综合久久ai换脸| 国产日产亚洲系列最新| 精品国产免费久久| 久青草国产在线| www.亚洲天堂| 草美女在线观看| 日韩美女免费视频| 午夜不卡一区| 国产伦视频一区二区三区| 免费毛片在线不卡| 亚洲一区三区电影在线观看| 欧美成人日韩| 欧美三级一级片| 美女一区二区三区| 国产免费a级片| 国产日韩欧美一区二区三区乱码| 美国一级片在线观看| 亚洲国产欧美日韩另类综合| 日韩黄色片网站| 欧美zozozo| 国产免费视频在线| 久久91精品国产91久久跳| 免费观看欧美大片| 91嫩草在线视频| 日韩a级大片| 在线成人性视频| 亚洲一区二区免费看| 日本中文字幕观看| 久久老女人爱爱| 欧美成欧美va| 欧美在线色视频| 国精产品一品二品国精品69xx | 极品尤物一区二区三区| 日本a级不卡| 欧美视频在线播放一区| 国内精品免费**视频| 日本一区二区三区网站| 亚洲女女做受ⅹxx高潮| 在线免费观看av网址| 亚洲大胆人体视频| 欧美成人高清在线| 日本免费久久高清视频| 99亚洲乱人伦aⅴ精品| 亚洲国产日韩美| 免费亚洲一区| 第一页在线视频| 亚洲日本va在线观看| 国产中文字幕视频| 精品奇米国产一区二区三区| 久久日韩视频| 国产精品久久久久久av福利软件| 国产一级成人av| 黄色小视频大全| 久久国产生活片100| 91成人在线免费视频| 欧美性猛xxx| 天堂国产一区二区三区| 久久99视频精品| 日韩欧美另类中文字幕| 中文字幕久久综合| 美女诱惑一区二区| 欧美黄色激情视频| 日韩欧美在线中文字幕| 天天躁日日躁狠狠躁伊人| 欧美激情va永久在线播放| 成人污污www网站免费丝瓜| 亚洲精品永久www嫩草| 日韩主播视频在线| 久久久久久国产精品无码| 偷拍一区二区三区四区| 黄色美女一级片| 欧美激情一区二区三区在线视频观看 | 日韩高清在线一区二区| 中文字幕日韩av资源站| 亚洲天堂手机在线| 日韩在线观看免费高清| 日韩一级特黄| 四虎精品欧美一区二区免费| 国产酒店精品激情| 69av.com| 亚洲国产日韩精品在线| 美女视频在线免费| 久热这里只精品99re8久| 丝袜诱惑亚洲看片| 97在线观看免费视频| 欧美日韩黄视频| 成人免费在线| 国产精品久久九九| 中国女人久久久| 男人舔女人下部高潮全视频| 欧美视频第二页| 爆操欧美美女| 国产精品国色综合久久| 99综合精品| 欧美熟妇激情一区二区三区| 欧美日韩在线播放三区| 黄色在线论坛| 国产免费一区二区三区| 亚洲一区成人| 九一在线免费观看| 欧美一级一级性生活免费录像| 国产区美女在线| 免费观看国产成人| 蜜乳av一区二区三区| 国产精品久久久久久久精| 亚洲第一精品福利| 蜜桃成人精品| 中文字幕免费高| 99久久综合精品| 中文字幕在线视频第一页| 美女少妇精品视频| 人人香蕉久久| 男生操女生视频在线观看 | 在线观看日韩视频| 欧美日韩黄网站| 蜜臀av午夜一区二区三区| 国产精品久久久久久亚洲伦| 成 人 黄 色 片 在线播放| 69精品小视频| 久久综合88| 精品国产av色一区二区深夜久久 | 性欧美视频videos6一9| jvid福利在线一区二区| 亚洲成人福利视频| 欧美羞羞免费网站| 超级碰碰不卡在线视频| 在线观看一区二区三区三州| 99久久99久久免费精品蜜臀| 亚洲天堂中文网| 欧美一级在线亚洲天堂|