精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

重回榜首的BERT改進版開源了,千塊V100、160GB純文本的大模型

新聞 開源
前段時間 Facebook 創建的改進版 BERT——RoBERTa,打敗 XLNet 登上了 GLUE 排行榜榜首。

 前段時間 Facebook 創建的改進版 BERT——RoBERTa,打敗 XLNet 登上了 GLUE 排行榜榜首。近日,Facebook 公開了該模型的研究細節,并開源了模型代碼。

BERT 自誕生以來就展現出了卓越的性能,GLUE 排行榜上前幾名的模型一度也大多使用 BERT。然而,XLNet 的橫空出世,

打破了 BERT 的紀錄

。不過,不久之后,劇情再次出現反轉,Facebook 創建的改進版 BERT——RoBERTa,登上了 GLUE 排行榜榜首。

重回榜首的BERT改進版開源了,千塊V100、160GB純文本的大模型

圖源:https://gluebenchmark.com/leaderboard/

Facebook 的研究人員表示,如果訓練得更久一點、數據再大一點,

BERT 就能重返SOTA

。

那么 RoBERTa 到底訓練了多長時間,使用了多少數據呢?近日,Facebook 研究人員公開了研究細節。

論文地址:https://arxiv.org/pdf/1907.11692.pdf

GitHub 地址:https://github.com/pytorch/fairseq/tree/master/examples/roberta

RoBERTa 到底有多大

之前 XLNet 團隊就對標準的 BERT 和 XLNet

做過一次公平的對比

,他們測試了在相同參數水平、預訓練數據、超參配置等情況下兩者的效果。當然,XLNet 通過修改架構與任務,它的效果是全面超過標準 BERT 的。但如果 BERT 要再次超越 XLNet,那么數據和算力都需要更多。

算力

據介紹,Facebook 研究人員在多臺 DGX-1 計算機上使用混合精度浮點運算,每臺計算機具備 8 個 32GB Nvidia V100 GPU,這些 GPU 通過 Infiniband 連接。

但研究者并沒有具體說 RoBERTa 使用了多少張 V100 GPU 訓練了多長時間,我們只能了解到他們訓練 Large 模型用 1024 塊 V100 訓練了一天,這樣以谷歌云的價格來算需要 6.094 萬美元。如下是原論文所述:

We pretrain for 100K steps over a comparable BOOKCORPUS plus WIKIPEDIA dataset as was used in Devlin et al. (2019). We pretrain our model using 1024 V100 GPUs for approximately one day.

因為 XLNet 的 TPU 訓練價格也是 6 萬美元,而且直觀上用 GPU 訓練會比 TPU 貴,所以我們根據上面的描述猜測 6.094 萬美元是在 BOOKCORPUS 加 WIKIPEDIA 數據集上訓練的成本。此外,XLNet 數據集擴充十倍,它的 TPU 訓練成本也增加了 5 倍,也許 RoBERTa 也遵循同樣的規則?

數據

BERT 模型預訓練的關鍵是大量文本數據。Facebook 研究人員收集了大量數據集,他們考慮了五個不同大小、不同領域的英語語料庫,共有 160GB 純文本,而 XLNet 使用的數據量是 126GB。這些語料庫分別是:

  • BOOKCORPUS (Zhu et al., 2015) 和英語維基百科:這是 BERT 訓練時所用的原始數據 (16GB);
  • CC-NEWS:Facebook 研究人員從 CommonCrawl News 數據集的英語部分收集到的數據,包含 2016 年 9 月到 2019 年 2 月的 6300 萬英語新聞文章(過濾后有 76GB 大?。?;
  • OPENWEBTEXT (Gokaslan and Cohen, 2019):Radford et al. (2019) 中介紹的 WebText 語料庫的開源克隆版本。其中包含爬取自 Reddit 網站共享鏈接的網頁內容 (38GB);
  • STORIES:Trinh and Le (2018) 中提到的數據集,包含 CommonCrawl 數據的子集,該數據集經過過濾以匹配 Winograd schemas 的故事性風格 (31GB)。

這樣的數據量已經非常大了,它是原來 BERT 數據量的十多倍。但正如 XLNet 作者楊植麟所言,數據量大并不一定能帶來好處,我們還需要在數量與質量之間做權衡。也許十倍量級的數據增加,可能還不如幾倍高質量數據帶來的提升大。

RoBERTa 到底是什么

Facebook 對 BERT 預訓練模型進行了復現研究,對調參和訓練數據規模的影響進行了評估,發現 BERT 訓練嚴重不足。于是他們提出了 BERT 的改進版——RoBERTa,它可以匹敵甚至超過所有 post-BERT 方法的性能。

這些改進包括:

  • 模型訓練時間更長,batch 規模更大,數據更多;
  • 移除「下一句預測」這一訓練目標;
  • 在更長的序列上訓練;
  • 動態改變應用于訓練數據上的掩碼模式。

Facebook 研究人員還收集了一個新型大數據集 CC-NEWS,以更好地控制訓練數據集規模的影響。CC-NEWS 數據集的規模與其他私人使用數據集差不多。

總之,Facebook 研究人員關于 RoBERTa 的研究貢獻可以總結如下:

  • 展示了一組重要的 BERT 設計選擇、訓練策略,介紹了一些可使下游任務性能更優的替代方法;
  • 使用新型數據集 CCNEWS,并確認使用更多數據進行預訓練可以進一步提升模型在下游任務上的性能;
  • 訓練方面的改進證明,在正確的設計選擇下,掩碼語言模型預訓練的性能堪比其他近期方法。

RoBERTa 都改了些啥

對于原版 BERT,直接用它來做極大數據的預訓練并不能 Work,我們還需要一些特殊的技巧來提升模型的魯棒性,這也就是 Facebook 研究者主要嘗試的。如下研究人員在論文中揭示并量化了 BERT 要進行哪些改進才能真正變得穩健。

1. 靜態 vs. 動態掩碼

BERT 依賴隨機掩碼和預測 token。原版的 BERT 實現在數據預處理期間執行一次掩碼,得到一個靜態掩碼。Facebook 研究者將該策略與動態掩碼進行比較,動態掩碼即,每次向模型輸入一個序列時都會生成掩碼模式。在預訓練進行更多步或使用更大的數據集時,這點變得尤其重要。

重回榜首的BERT改進版開源了,千塊V100、160GB純文本的大模型

表 1: BERT_BASE 的靜態和動態掩碼比較。

2. 模型輸入格式和下一句預測

在原版的 BERT 預訓練步驟中,模型觀察到兩個連接在一起的文檔片段,這兩個片段要么是從相同的文檔中連續采樣,要么采樣自一個文檔的連續部分或不同文檔。為了更好地理解這種結構,研究者比較了幾種訓練格式:

  • SEGMENT-PAIR+NSP:這種方式和 BERT 中用到的原始輸入格式相同,NSP 是 Next Sentence Prediction(下一句預測)結構的縮寫。
  • SENTENCE-PAIR+NSP:每個輸入包含一對自然語言句子,采樣自一個文檔的連續部分或不同文檔。
  • FULL-SENTENCES:每個輸入都包含從一或多個文檔中連續采樣的完整句子,以保證總長度至多 512 token。
  • DOC-SENTENCES:這種輸入的構造與 FULL-SENTENCES 類似,只是它們可能不會跨過文檔邊界。
重回榜首的BERT改進版開源了,千塊V100、160GB純文本的大模型

表 2:在 BOOKCORPUS 和 WIKIPEDIA 上預訓練的基礎模型的開發集結果。所有的模型都訓練 1M 步,batch 大小為 256 個序列。

3. 大批量訓練

神經機器翻譯領域之前的工作表明,在學習率適當提高時,以非常大的 mini-batch 進行訓練可以同時提升優化速度和終端任務性能。最近的研究表明,BERT 也能適應大批量訓練。

重回榜首的BERT改進版開源了,千塊V100、160GB純文本的大模型

表 3:在 BOOKCORPUS 和 WIKIPEDIA 上用不同的 batch 大小(bsz)訓練的基礎模型在留出訓練數據(ppl)和開發集上的困惑度。

4. 文本編碼

Byte-Pair Encoding(BPE)是字符級和詞級別表征的混合,支持處理自然語言語料庫中的眾多常見詞匯。

原版的 BERT 實現使用字符級別的 BPE 詞匯,大小為 30K,是在利用啟發式分詞規則對輸入進行預處理之后學得的。Facebook 研究者沒有采用這種方式,而是考慮用更大的 byte 級別 BPE 詞匯表來訓練 BERT,這一詞匯表包含 50K 的 subword 單元,且沒有對輸入作任何額外的預處理或分詞。這種做法分別為 BERTBASE 和 BERTLARGE 增加了 15M 和 20M 的額外參數量。

實驗結果

Facebook 研究人員綜合所有這些改進,并評估了其影響。結合所有改進后的方法叫作 RoBERTa(Robustly optimized BERT approach)。

為了厘清這些改進與其他建模選擇之前的重要性區別,研究人員首先基于 BERT LARGE 架構訓練 RoBERTa,并做了一系列對照試驗以確定效果。

重回榜首的BERT改進版開源了,千塊V100、160GB純文本的大模型

表 4:隨著訓練數據的增大(文本數量從 16GB → 160GB)、訓練步長的增加(100K → 300K → 500K 訓練步),RoBERTa 在開發集上的結果。在對照試驗中,表格中每一行都累積了前幾行的改進。

對于 GLUE,研究人員考慮了兩種微調設置。在第一種設置中(單任務、開發集),研究人員分別針對每一項 GLUE 任務微調 RoBERTa,僅使用對應任務的訓練數據。在第二種設置中(集成,測試集),研究人員通過 GLUE 排行榜對比 RoBERTa 和其他方法。

重回榜首的BERT改進版開源了,千塊V100、160GB純文本的大模型

表 5:多個模型在 GLUE 上的結果。所有結果都基于 24 層的模型架構。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2009-01-12 09:42:11

固態硬盤SSD2.5寸固態盤

2023-03-08 15:54:49

2018-06-04 14:53:21

Tesla V100NVIDIA計算平臺

2020-07-30 14:05:53

谷歌華為芯片

2022-09-06 08:31:09

線程池工具系統

2023-09-26 08:39:28

限流方式滑動窗口計數器

2023-02-06 18:10:22

模型算法

2023-10-31 13:01:00

2011-04-20 14:16:02

愛普生V100掃描儀

2011-04-20 13:59:28

愛普生V100掃描儀

2012-07-31 13:31:34

Windows 8鼠標鍵盤

2012-07-31 09:47:22

微軟Windows 8

2025-02-28 12:32:42

2017-12-29 12:14:12

易觀千帆

2023-12-01 12:31:22

AI模型

2022-02-15 16:32:13

惡意軟件網絡安全漏洞

2022-01-25 08:52:26

微軟Edge瀏覽器

2023-11-03 07:47:12

機器資源大模型:

2021-08-30 09:25:25

Bert模型PyTorch語言
點贊
收藏

51CTO技術棧公眾號

欧美人狂配大交3d怪物一区 | 缅甸午夜性猛交xxxx| www日本高清| 一本不卡影院| 日韩中文字幕在线免费观看| 国产在线观看免费播放| 欧美色999| 亚洲午夜精品17c| 日本一区二区三区www| 99国产精品久久久久久久成人| 日韩午夜在线| 播播国产欧美激情| 午夜一区二区三区免费| 国产va免费精品观看精品| 精品国产91乱高清在线观看| 一区二区视频在线免费| 手机看片福利在线观看| 韩国精品久久久| 青青草原成人在线视频| 劲爆欧美第一页| 久久精品播放| 亚洲色图18p| 一级黄色电影片| 免费一级欧美在线观看视频| 欧美午夜影院在线视频| 欧美另类videosbestsex日本| 国产高清免费av在线| 成人国产精品视频| 91情侣在线视频| 一级黄色片免费| 日韩国产欧美在线观看| 91精品国产99| 久久精品无码人妻| 这里只有精品在线| 久久精品福利视频| 免费看黄色三级| 九热爱视频精品视频| 日韩av有码在线| 少妇激情一区二区三区视频| 日本免费精品| 日韩欧美电影在线| 美女日批在线观看| 日韩免费一级| 日韩欧美国产一区二区三区| 五月天六月丁香| 国产精品日韩精品在线播放| 欧美日韩精品一区二区三区蜜桃| 亚洲福利精品视频| 电影一区电影二区| 欧美亚一区二区| 国产精品入口免费软件| 91大神在线观看线路一区| 色欧美片视频在线观看| 男人天堂成人在线| 国产成人免费9x9x人网站视频| 欧美性精品220| 亚洲熟妇av一区二区三区| 新片速递亚洲合集欧美合集| 欧洲激情一区二区| 欧美三级理论片| 国产精品99精品一区二区三区∴| 欧美性xxxxxxxx| 欧美在线aaa| 亚洲色图图片| 精品盗摄一区二区三区| 国产a级黄色片| 天堂日韩电影| 中文字幕av一区二区| 亚洲精品一区二区三区在线播放| 围产精品久久久久久久| 色综合色综合网色综合| 日本一二三区视频| 国产精品五区| 国产精品美乳一区二区免费 | 免费观看在线综合| 成人精品福利视频| 亚洲精品18在线观看| 97久久精品人人爽人人爽蜜臀| 精品国产乱码久久久久久丨区2区| 视频三区在线观看| 国产精品久久久久久久久动漫| 国产精品无码乱伦| av中文字幕在线看| 欧美性淫爽ww久久久久无| 国产成人在线综合| 久久aimee| 国产一区二区三区直播精品电影| 五月天色婷婷丁香| 国产精品资源| 成人激情视频网| 无套内谢的新婚少妇国语播放| 久久久久久免费毛片精品| 色中文字幕在线观看| jizzjizz中国精品麻豆| 在线看国产一区二区| www.偷拍.com| 精品国产乱码久久久久久1区2匹| 欧美成年人视频网站欧美| 国产精品人人人人| 国产精一区二区三区| 蜜桃久久精品乱码一区二区| 黄色网址在线免费| 一本一道综合狠狠老| 亚洲成人av免费观看| 综合色就爱涩涩涩综合婷婷| 久久综合久久88| 免费的毛片视频| 国产成人日日夜夜| 亚洲人一区二区| 欧美13videosex性极品| 日韩一级成人av| 国产主播av在线| 亚洲综合激情| 国产高清不卡av| 超碰caoporn久久| 欧美丝袜自拍制服另类| 在线观看av中文字幕| 亚洲精品a级片| 国产精品入口日韩视频大尺度| 五月色婷婷综合| 亚洲五月六月丁香激情| 99九九精品视频| 成人情趣视频| 国产999在线观看| 性xxxx18| 午夜av一区二区三区| 苍井空张开腿实干12次| 久久一区二区三区喷水| 国产精品成人v| 日本大片在线观看| 午夜精品久久久久久久99水蜜桃| 在线观看一区二区三区视频| 99久久99久久精品国产片果冰| 国产不卡av在线| 免费在线一级视频| 欧美日韩一区二区在线| 青青草视频播放| 999亚洲国产精| 国产日韩欧美一区二区| 不卡的av影片| 亚洲成人久久电影| 欧美一级视频免费观看| jvid福利写真一区二区三区| 精品成在人线av无码免费看| 亚洲性视频在线| 欧美激情啊啊啊| 丰满少妇一级片| 亚洲成人免费视| 日本少妇xxxx| 国产九九精品| 天天综合狠狠精品| 亚洲欧美一级| 欧美国产日韩一区二区在线观看| 性色av蜜臀av| 亚洲风情在线资源站| 亚洲熟女一区二区| 成人亚洲精品| 精品久久在线播放| 亚洲一级av无码毛片精品| 欧美色图麻豆| 国产精品国产亚洲精品看不卡15 | 久久综合色影院| 国产精品久久久久久久久久久久久久久久久久| 中文字幕免费不卡在线| 做a视频在线观看| 欧美日韩另类一区| 国产精品久久久久9999小说| 欧美美乳视频| 国产区亚洲区欧美区| 韩国av网站在线| 日韩精品影音先锋| 日韩av一区二区在线播放| 99精品视频一区| 天堂在线资源视频| 国产精品久久久久久影院8一贰佰 国产精品久久久久久麻豆一区软件 | 四虎8848精品成人免费网站| 成人h视频在线| 久久免费电影| 亚洲美腿欧美激情另类| 亚洲天堂免费av| 亚洲香肠在线观看| 日本一级免费视频| 国产老女人精品毛片久久| 女人和拘做爰正片视频| 日韩欧美电影| 国产精品久久久久久久天堂第1集 国产精品久久久久久久免费大片 国产精品久久久久久久久婷婷 | 制服丝袜中文字幕亚洲| 免费人成在线观看| 久久嫩草精品久久久精品一| 在线观看免费不卡av| 在线精品一区二区| 日韩一区不卡| 这里视频有精品| 国产精品久久久久久久久免费看| av网址在线看| 亚洲欧洲国产精品| 亚洲va久久久噜噜噜无码久久| 色欧美88888久久久久久影院| 99久久婷婷国产综合| 久久婷婷色综合| 亚洲熟女乱综合一区二区| 视频精品一区二区| 男人添女人下部视频免费| 国际精品欧美精品| 国产欧美日韩伦理| 日韩第二十一页| 国产ts一区二区| 第一av在线| 精品国产依人香蕉在线精品| 青青国产在线| 精品国产区一区| 国产精品永久久久久久久久久| 黑人极品videos精品欧美裸| 97成人资源站| 国产精品久久久久久久久动漫| 野外性满足hd| 大桥未久av一区二区三区中文| 欧美日韩一区二区三区69堂| 久久都是精品| 日本福利视频在线| 欧美婷婷在线| 男人的天堂视频在线| 久久要要av| 日韩在线三级| 国产亚洲一区二区三区不卡| 精品一区久久久| av成人app永久免费| 亚洲伊人第一页| 2019中文亚洲字幕| 国产精品视频在线观看| 欧美韩国亚洲| 国产精品video| 日本免费一区二区三区四区| 2021久久精品国产99国产精品| heyzo高清国产精品| 欧美激情网友自拍| 日韩经典av| 久精品免费视频| 少女频道在线观看高清| 美女撒尿一区二区三区| 哥也色在线视频| 操日韩av在线电影| 91精选在线| 欧美国产乱视频| 波多野结衣在线观看| 久久久久久久电影一区| av最新在线| 91av在线免费观看| 欧美特大特白屁股xxxx| 国产成人一区二区三区小说| 六月婷婷综合| 国产欧美亚洲精品| 经典三级久久| 国产精品一区二区三区在线| 激情小说亚洲图片| 久久综合九色综合网站| 国产精品美女久久久久久不卡| 日韩电影在线播放| 91亚洲人成网污www| 欧美黄色免费网址| 亚洲国产精品一区| 日本成人在线免费视频| 日本va欧美va精品发布| 在线播放黄色av| 成人精品视频.| 在线免费观看黄色小视频| 国产欧美一区二区三区鸳鸯浴| 亚洲欧美另类日本| 亚洲国产精品一区二区www在线| 国产精品一区二区6| 91成人免费网站| av无码精品一区二区三区宅噜噜| 亚洲精品在线观看视频| 久久久pmvav| 日韩视频免费在线观看| 日韩成人伦理| 国产福利视频一区| 日韩欧美中文字幕在线视频| 久久国产精品 国产精品| 日韩av免费大片| av动漫在线免费观看| 免费在线播放第一区高清av| 国产欧美激情视频| 91香蕉视频污在线| 日本中文在线视频| 狠狠干狠狠久久| 国产精品九九九九| 日韩精品www| 黄av在线免费观看| 欧美一级淫片aaaaaaa视频| 日韩深夜福利网站| 久久久久久久久久久久久久一区| 爽成人777777婷婷| 免费在线a视频| 国产精品911| 国产在线综合视频| 天天影视色香欲综合网老头| 亚洲一区二区天堂| 日韩精品视频在线观看免费| 最新超碰在线| 国产精品毛片a∨一区二区三区|国| 日本一区二区乱| 亚洲毛片aa| 欧美一级视频| 亚洲少妇一区二区三区| 中文字幕在线视频一区| 国产91精品看黄网站在线观看| 精品国产露脸精彩对白| 免费a级在线播放| 国产精品69久久久久| 丁香5月婷婷久久| 欧美与动交zoz0z| 青青青伊人色综合久久| 欧美黑人欧美精品刺激| 亚洲综合一区二区精品导航| 91麻豆一区二区| 亚洲精品永久免费| h片在线观看视频免费| 99中文视频在线| 一级欧洲+日本+国产| 亚洲免费av一区| 国产精品色眯眯| 久久久久久久久久一级| 精品亚洲一区二区三区| 嗯~啊~轻一点视频日本在线观看| 91传媒免费看| 亚洲精品一二三区区别| 亚洲午夜精品一区| 国产精品国产三级国产| 中文字幕久久网| 亚洲最新av网址| 国产一区一一区高清不卡| 欧美日韩电影一区二区三区| 在线亚洲欧美| 成人手机在线免费视频| 亚洲v精品v日韩v欧美v专区| 国产成人自拍一区| 欧美日韩国产二区| 一区二区日韩| 国产精品国三级国产av| 成人高清视频在线| 日韩欧美大片在线观看| 亚洲国产精品va在线看黑人动漫 | 亚洲午夜久久久久中文字幕久| 精品国产亚洲av麻豆| 欧美成人午夜激情| 日韩三级av高清片| 人人妻人人做人人爽| 99国产麻豆精品| 人妻 日韩精品 中文字幕| 亚洲女成人图区| av成人亚洲| 午夜啪啪福利视频| 成人夜色视频网站在线观看| 日本少妇裸体做爰| 精品亚洲aⅴ在线观看| 免费观看一级欧美片| 天天久久人人| 91九色porn在线资源| 亚洲综合一区二区三区| 精品人妻无码一区二区| 欧美激情精品久久久| 欧洲亚洲一区二区三区| 亚洲爆乳无码专区| 国产精品久久久久影院色老大| 国产精品久久久久久免费免熟| 欧美疯狂xxxx大交乱88av| 久久影视三级福利片| 欧美精品无码一区二区三区| 中文字幕亚洲在| 狠狠综合久久av一区二区| 庆余年2免费日韩剧观看大牛| 成人毛片免费看| 欧美午夜精品一区二区| 精品高清美女精品国产区| 国产精品一区在线看| 91精品视频在线| 亚洲神马久久| 日韩欧美在线视频播放| 亚洲成人精品视频| 精品肉辣文txt下载| 天堂8在线天堂资源bt| 久久久99久久| 99久久久国产精品无码免费| 欧美亚洲一级片| 一区二区三区在线| 久久久久国产精品区片区无码| 欧美日韩高清不卡| av免费在线视| 天天综合中文字幕| 99re在线精品| 国产按摩一区二区三区| 欧美一性一乱一交一视频| 影音先锋日韩精品| 无码一区二区三区在线| 日韩精品一区二区三区老鸭窝| 日韩一级二级| 日韩一级性生活片| 中文字幕在线一区| 好男人免费精品视频|