精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Google開源ToTTo數(shù)據(jù)集,你的模型還「撐」得住嗎?

新聞 開源
近日,Google研究人員提出一個(gè)大型從表轉(zhuǎn)換到文本的英文數(shù)據(jù)集,已經(jīng)在Git上開源。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 近日,Google研究人員提出一個(gè)大型從表轉(zhuǎn)換到文本的英文數(shù)據(jù)集,已經(jīng)在Git上開源。該數(shù)據(jù)集不僅提供了一個(gè)可以受控的句子生成任務(wù),還提供了一個(gè)基于迭代語句修訂的數(shù)據(jù)注釋過程。實(shí)驗(yàn)結(jié)果證明,ToTTo可以作為有用且高效的數(shù)據(jù)集,用來幫助其他研究者建模研究,以及開發(fā)可以更好地檢測模型改進(jìn)的評(píng)估指標(biāo)。

在過去的幾年里,自然語言生成(用于文本摘要等任務(wù))的研究取得了巨大的進(jìn)展。

然而,盡管達(dá)到了高水平的流暢性,神經(jīng)系統(tǒng)仍然容易產(chǎn)生「幻覺」(即產(chǎn)生的文本盡管可以被理解,但是含義并不忠實(shí)于源文本),這使得這些系統(tǒng)不能用于許多需要高準(zhǔn)確性的應(yīng)用。

我們可以舉例說明這個(gè)問題:

這是一個(gè)來自Wikibio數(shù)據(jù)集的例子,其中,負(fù)責(zé)總結(jié)比利時(shí)足球運(yùn)動(dòng)員Constant Vanden Stock的維基信息框條目的神經(jīng)基線模型,在經(jīng)過分析之后,錯(cuò)誤地得出了他是一個(gè)美國花樣滑冰運(yùn)動(dòng)員的結(jié)論,如下圖:

雖然評(píng)估生成的文本與源內(nèi)容的真實(shí)性相比,可能會(huì)具有一定的不一致。

但當(dāng)源內(nèi)容是結(jié)構(gòu)化的(例如,以表格格式)時(shí),在含義上保持一致往往會(huì)更容易。

此外,結(jié)構(gòu)化數(shù)據(jù)還可以測試模型的推理和數(shù)值推理能力。

這么聽上去,結(jié)構(gòu)化數(shù)據(jù)是蠻好的,對(duì)不對(duì)?

然而,現(xiàn)有的大規(guī)模結(jié)構(gòu)化數(shù)據(jù)集往往有噪聲(即引用的句子不能從表格數(shù)據(jù)中完全推斷出來),這使得研究人員在模型開發(fā)中對(duì)「幻覺」的測量并不可靠。

針對(duì)這一問題,Google的研究人員提出了他們的解決方案:

在《ToTTo:一個(gè)受控的表到文本生成數(shù)據(jù)集》(ToTTo: A Controlled Table-to-Text Generation Dataset)中,研究人員提出了一個(gè)開放域的表到文本生成數(shù)據(jù)集。

該數(shù)據(jù)集是由一種新的注釋過程(通過句子修改)以及一個(gè)可用于評(píng)估模型「幻覺」的受控文本生成任務(wù)生成的。

在接下來的介紹中,我們將「表到文本」稱為ToTTo。

ToTTo包含121,000個(gè)訓(xùn)練示例,以及7,500個(gè)用于開發(fā)和測試的示例。

由于標(biāo)注的準(zhǔn)確性,該數(shù)據(jù)集適合作為研究高精度文本生成的具有挑戰(zhàn)性的benchmark。

此外,數(shù)據(jù)集和代碼已經(jīng)在Google的GitHub repo上開源:

Git地址:https://github.com/google-research-datasets/totto

論文地址:https://arxiv.org/pdf/2004.14373.pdf

引入受控任務(wù),維基百科表成輸入來源

ToTTo引入了一個(gè)受控的生成任務(wù)——

在該任務(wù)中,源材料是帶有一組選定單元格的給定維基百科表,而生成的則是一個(gè)總結(jié)表上下文中單元格內(nèi)容的單句描述。

下圖中的示例,展示了該任務(wù)中包含的一些挑戰(zhàn),例如數(shù)值推理、大量的開放域詞匯表和多種表結(jié)構(gòu)等等:

在ToTTo數(shù)據(jù)集中,輸入是源表和高亮顯示的單元格集(上圖左側(cè)),而目標(biāo)是生成一個(gè)句子描述,例如“Target Sentence”(上圖右側(cè))。

在這里需要注意的是,生成目標(biāo)句子需要數(shù)值推理能力和對(duì)NFL領(lǐng)域的理解。

注釋器可實(shí)現(xiàn)分階段修訂,目標(biāo)句簡潔自然有趣

接下來,研究人員要設(shè)計(jì)一個(gè)注釋過程,這個(gè)注釋過程可以使得從表格數(shù)據(jù)中獲得語法自然又干凈簡潔的目標(biāo)句子,而這,無疑是一個(gè)重大的挑戰(zhàn)。

為什么呢?

一個(gè)方面來說,許多像Wikibio和RotoWire這樣的數(shù)據(jù)集,會(huì)將自然產(chǎn)生的文本啟發(fā)式地與表配對(duì),然而,這是一個(gè)「嘈雜」的過程,因?yàn)樵谶@個(gè)過程中,我們很難弄清楚「幻覺」主要是由數(shù)據(jù)噪聲還是模型缺陷引起的。

從另一方面來說,研究者確實(shí)可以讓注釋器從頭開始編寫忠于表的目標(biāo)句子,但是不好的一點(diǎn)是,最終的目標(biāo)句子在結(jié)構(gòu)和風(fēng)格方面往往缺乏多樣性。

相比之下,ToTTo是使用一種新的數(shù)據(jù)注釋策略構(gòu)建的——

在這個(gè)方法下,注釋器可以分階段修改現(xiàn)有的維基百科句子。

如此以來,目標(biāo)句可以具有簡潔干凈、自然的特點(diǎn),并且還能包含有趣和多樣的語言特性。

具體過程是這樣的:

數(shù)據(jù)收集和注釋過程會(huì)從Wikipedia收集表開始,其中「給定表」會(huì)與根據(jù)啟發(fā)式從支持頁面上下文收集的「摘要句」配對(duì)。

這個(gè)摘要句可能包含沒有表格支持的信息,也可能包含只有表格中有先行詞的代詞,而不是句子本身。

然后,注釋器突出顯示表中支持該句子的單元格,并刪除表不支持的句子中的短語。

此外,注釋器還將句子去語境化,使其獨(dú)立成文(例如,在必要的時(shí)候使用正確的代詞),具有正確的語法。

實(shí)驗(yàn)結(jié)果表明,注釋器對(duì)上述任務(wù)的一致性很高:

單元格高亮顯示的Fleiss Kappa為0.856,最終目標(biāo)句子的BLEU為67.0。

結(jié)果分析涉及話題極其廣泛,「體育和國家」占比最大

Google的研究人員對(duì)ToTTo數(shù)據(jù)集進(jìn)行了超過44個(gè)類別的主題分析,例如體育和國家主題。

每個(gè)主題都包含一系列細(xì)粒度的主題,例如體育的足球/奧林匹克和國家的人口/建筑,這些共占數(shù)據(jù)集的56.4%。

另外44%的話題范圍更廣,包括表演藝術(shù)、交通和娛樂。

此外,研究人員對(duì)隨機(jī)選取的100多個(gè)實(shí)例數(shù)據(jù)集中的不同類型的語言現(xiàn)象進(jìn)行了人工分析。

下表總結(jié)了需要參考頁面和章節(jié)標(biāo)題的部分例子,以及數(shù)據(jù)集中可能對(duì)當(dāng)前系統(tǒng)構(gòu)成新挑戰(zhàn)的一些語言現(xiàn)象:

全新角度測試諸多先進(jìn)模型,BERT-to-BERT最能還原原文含義

研究人員從文獻(xiàn)中提供了三個(gè)最先進(jìn)模型(BERT-to-BERT、指針生成器和Puduppully 2019模型),使用了兩個(gè)評(píng)估指標(biāo),即BLEU和PARENT。

除了報(bào)告整個(gè)測試集的分?jǐn)?shù)外,研究人員還在一個(gè)由域外示例組成的更具挑戰(zhàn)性的子集上評(píng)估了每個(gè)模型。

實(shí)驗(yàn)結(jié)果如下表所示:

我們可以發(fā)現(xiàn),BERT-to-BERT模型在「親近原文本」方面表現(xiàn)最好。

此外,所有模型在挑戰(zhàn)集上的性能都相當(dāng)?shù)停@表明了域外泛化任務(wù)還是具有很強(qiáng)的挑戰(zhàn)性。

雖然自動(dòng)指標(biāo)可以提供一些性能信息,但目前還不足以評(píng)估文本生成系統(tǒng)中的「幻覺」現(xiàn)象。

為了更好地理解「幻覺」,研究人員假設(shè)差異表明「幻覺」,并手動(dòng)評(píng)估了最高表現(xiàn)基線,以確定目的句子對(duì)源表內(nèi)容的忠實(shí)程度。

結(jié)果顯示,最高表現(xiàn)基線下,出現(xiàn)「幻覺」信息的概率為20%。

當(dāng)前最新模型仍有諸多不足,文本生成「路漫漫其修遠(yuǎn)兮」

在下表中,研究人員選擇了觀察到的模型錯(cuò)誤,以突出顯示ToTTo數(shù)據(jù)集的面臨的一些更有挑戰(zhàn)性的問題:

研究人員發(fā)現(xiàn),即使使用「干凈」的引用參考內(nèi)容,最先進(jìn)的模型也會(huì)與「幻覺」、「數(shù)值推理」和「罕見的主題」等問題「糾纏不清」(在上圖中,錯(cuò)誤用紅色表明)。、

而最后一個(gè)例子表明,即使模型輸出是正確的,它有時(shí)也沒有原始引用提供的信息豐富——

原始引用包含了更多關(guān)于表的推理(在上圖中,用藍(lán)色顯示)。

最后,除了提出的任務(wù),研究人員還表示,希望ToTTo也可以幫助其他任務(wù),如表格的理解和句子的修改。

 

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2020-08-05 10:50:48

RedisCall數(shù)據(jù)庫

2012-04-11 11:36:08

帶寬提速千兆路由器

2017-11-02 16:03:12

2012-09-06 17:54:28

2017-11-27 10:53:00

大數(shù)據(jù)租房數(shù)據(jù)分析

2017-11-24 12:52:01

大數(shù)據(jù)數(shù)據(jù)分析房租

2013-10-10 17:22:51

開源開源軟件

2018-07-27 14:04:24

數(shù)據(jù)分析薪資數(shù)據(jù)分析師

2009-03-21 21:24:42

2021-12-01 11:50:50

HashMap面試Java

2013-09-03 14:59:05

2015-01-14 10:40:57

信息安全信息泄露個(gè)人信息安全

2017-11-10 07:08:24

前端優(yōu)化策略

2020-01-18 14:50:13

開源GoogleNLP

2017-02-13 18:37:57

2016-01-07 11:25:12

數(shù)據(jù)模型訓(xùn)練數(shù)據(jù)

2016-10-08 11:51:33

云服務(wù)器

2016-10-09 12:03:40

香港運(yùn)服務(wù)器小鳥云

2013-08-14 11:14:20

開源Google
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

老牛影视av牛牛影视av| 国产中文av在线| 久久久成人av毛片免费观看| 欧美国产欧美综合| 91精品久久久久久久久中文字幕 | 污污污污污污www网站免费| 男人天堂综合网| 日韩国产精品91| 久久91精品国产91久久跳| 91中文字幕永久在线| 精品欧美视频| 在线免费精品视频| 91.com在线| gogogo高清在线观看免费完整版| 国产伦精品一区二区三区在线观看| 国产69精品久久久久99| 日韩免费成人av| 超碰在线一区| 欧美一级久久久久久久大片| 国产精品欧美激情在线观看| www视频在线看| 国产欧美日韩在线| 精品亚洲第一| 国产高清免费在线观看| 六月婷婷一区| 午夜精品久久久久久99热| 91免费在线看片| 亚洲理论电影| 亚洲国产精品久久久久秋霞不卡| 国产无色aaa| 色天使综合视频| 午夜电影网亚洲视频| 爱爱爱视频网站| 懂色av中文在线| 26uuu亚洲综合色欧美| 91在线看网站| 97人妻人人澡人人爽人人精品| 亚洲一区日韩在线| 久久久久久97| 免费一级a毛片夜夜看| 999久久久91| 中文字幕免费国产精品| 一色道久久88加勒比一| 日韩av午夜| 亚洲第一区第一页| 艳妇乳肉豪妇荡乳xxx| 久久9999免费视频| 91精品欧美久久久久久动漫| 久久婷五月综合| 欧美123区| 91高清视频免费看| 黄色三级视频片| 性欧美18一19sex性欧美| 欧美视频中文字幕在线| 国产白丝袜美女久久久久| 蜜桃传媒在线观看免费进入| 亚洲免费在线视频| 日韩中文在线字幕| 国产丝袜在线| 一区二区三区在线不卡| 天堂а√在线中文在线| 欧美人与动牲性行为| 亚洲男同1069视频| 97干在线视频| 美女91在线看| 一本色道久久综合精品竹菊| 中文字幕第80页| 懂色aⅴ精品一区二区三区| 在线视频观看一区| 五月花丁香婷婷| 美女精品视频在线| 亚洲成人黄色在线观看| 完美搭档在线观看| 免费观看不卡av| 一区二区三区高清国产| 99久久久免费精品| 欧美视频二区| 欧美在线激情网| 在线观看亚洲一区二区| 狠狠色狠狠色合久久伊人| 91亚色免费| 邻居大乳一区二区三区| 中文成人av在线| 日韩精品手机在线观看| 国产精品186在线观看在线播放| 亚洲国产精品自拍| 欧美激情精品久久久久久小说| 亚洲mmav| 精品欧美黑人一区二区三区| 国产伦精品一区二区三区妓女| 精品国产精品国产偷麻豆| www.欧美三级电影.com| 精品无码人妻一区二区三区| 视频一区中文字幕国产| 91免费精品视频| 日本福利片在线| 国产精品成人免费精品自在线观看| 日本人妻伦在线中文字幕| 巨茎人妖videos另类| 在线播放日韩导航| 中文字幕在线播放一区| 午夜国产一区二区| 午夜精品一区二区三区视频免费看| 销魂美女一区二区| 国产不卡高清在线观看视频| 日韩精品av一区二区三区| 中文字幕伦理免费在线视频| 日韩欧美中文字幕在线播放| 欧洲在线免费视频| 在线日韩网站| 久久久久久久一区二区三区| 一女二男一黄一片| 久久亚洲精品国产精品紫薇| 欧美日韩中文字幕在线播放 | 欧美激情aⅴ一区二区三区| 97在线视频免费看| 99久久精品国产一区色| 国产嫩草影院久久久久| 成人一区二区免费视频| 91精品视频一区二区| 亚洲午夜av久久乱码| 精品一级少妇久久久久久久| 美女视频网站久久| 欧美精品123| 成人观看网址| 日韩精品在线网站| 欧美色视频一区二区三区在线观看| 六月丁香综合| 欧美国产综合视频| 密臀av在线播放| 精品久久一区二区| 国产人妻精品一区二区三区不卡| 日韩高清一区在线| 欧美日韩亚洲在线| 韩国成人二区| 亚洲成人激情视频| 国产精选第一页| 国产91在线|亚洲| 久久av喷吹av高潮av| 久久亚洲精品爱爱| 亚洲视频精品在线| 亚洲图片欧美日韩| 国产亚洲1区2区3区| 国内性生活视频| 欧美黑白配在线| 7777免费精品视频| 日韩a在线观看| 精品欧美国产一区二区三区| 精品国产av色一区二区深夜久久| 亚洲午夜91| 国产区一区二区| 两个人看的在线视频www| 亚洲精品久久久久中文字幕欢迎你| 国产真实乱偷精品视频| 丁香网亚洲国际| 国产真人做爰毛片视频直播| 高潮按摩久久久久久av免费| 97超级碰碰人国产在线观看| 三级在线电影| 欧美综合一区二区| 色偷偷www8888| 国产精品一二三在| 男人用嘴添女人下身免费视频| 久久综合社区| 国产精品福利片| 日本美女高清在线观看免费| 3atv在线一区二区三区| 欧美精品色哟哟| 成人av免费观看| 免费在线观看毛片网站| 国产一区二区三区电影在线观看 | 91精品福利观看| 久久6免费高清热精品| 成人免费视频国产免费麻豆| 黑人巨大精品欧美一区二区三区 | 亚洲成人精品在线播放| 亚洲欧洲日本mm| 奇米精品在线| 99精品视频在线免费播放| 欧美高清videos高潮hd| 天堂a√在线| 欧美视频精品在线| 无码人妻精品一区二区三区夜夜嗨| 国产福利一区二区三区视频| 成人免费毛片网| 国产精品久久久久久麻豆一区软件 | 亚洲熟女综合色一区二区三区| 国产午夜精品美女毛片视频| 日韩在线一区视频| 亚洲精品123区| 天天爽天天狠久久久| 日韩在线精品强乱中文字幕| 欧美在线激情网| 黄色网页在线免费看| 亚洲国产一区二区三区四区| 中文字幕一区2区3区| 一区二区三区中文免费| 中文字幕免费视频| 国产高清在线观看免费不卡| 国产在线观看福利| 亚洲色图二区| 日本一区二区三区免费观看| 欧美不卡在线观看| 国产成人在线精品| 先锋成人av| 中文字幕亚洲欧美一区二区三区| 丰满人妻熟女aⅴ一区| 欧洲在线/亚洲| 三级黄色在线视频| 《视频一区视频二区| 激情综合丁香五月| 国产一区二区不卡在线| av免费中文字幕| 欧美精品二区| 亚洲精品一区二区三区四区五区 | 午夜写真片福利电影网| 国产人成亚洲第一网站在线播放 | 97人妻人人澡人人爽人人精品| 黑丝美女久久久| 好吊色视频在线观看| 国产精品女主播av| 欧美 日韩 成人| av动漫一区二区| 永久免费看片在线观看| 精品伊人久久久久7777人| 久久精品99国产| 亚洲精品综合| 给我免费播放片在线观看| 欧美在线国产| 五月天激情图片| 亚洲第一天堂| 男插女免费视频| 国产探花一区在线观看| 91香蕉国产在线观看| 国产成人a视频高清在线观看| 日韩av免费一区| 中文字幕不卡三区视频| 国产91精品久久久久| 男女羞羞视频在线观看| 欧美成人一二三| av免费在线观看网站| 免费成人高清视频| a免费在线观看| 久久99精品久久久久久青青91| a毛片在线观看| 精品国产一区二区在线| 免费网站成人| 欧美尺度大的性做爰视频| fc2ppv国产精品久久| 欧美麻豆久久久久久中文| 午夜成年人在线免费视频| 欧美风情在线观看| 青青草手机视频在线观看| 欧美一级做一级爱a做片性| 国产精品69av| 精品国产黄a∨片高清在线| 国产精品三级美女白浆呻吟| 亚洲www啪成人一区二区| 日本成人精品在线| 成人爽a毛片免费啪啪| 热99久久精品| 久久国内精品| 91精品久久久久久久久久久| 依依综合在线| 国产精品爽爽爽| 亚洲福利影视| 国产一区香蕉久久| 国产激情一区| 97伦理在线四区| 亲子伦视频一区二区三区| 久久青青草综合| 精品在线播放| 日韩欧美激情一区二区| 欧美一区二区三| 亚洲一区精彩视频| 激情久久一区| 99色精品视频| 日韩成人伦理电影在线观看| 日本精品一区在线| 风间由美性色一区二区三区| 久久免费精品国产| 国产色婷婷亚洲99精品小说| 91麻豆精品国产91久久综合| 综合在线观看色| 国产区在线观看视频| 日本久久一区二区| 亚洲一区二区色| 精品国产自在久精品国产| 熟妇人妻一区二区三区四区 | 一区二区三区午夜| 精品国产不卡一区二区三区| 日韩精品视频在线观看一区二区三区| 亚洲天堂影视av| 8888四色奇米在线观看| 免费不卡欧美自拍视频| av免费不卡| 国产三级精品网站| 最新国产一区二区| 欧美性猛片xxxx免费看久爱| 日本爱爱免费视频| 老司机精品视频在线| 亚洲一级片免费观看| 久久综合久久久久88| 老司机深夜福利网站| 亚洲精品国产一区二区三区四区在线| 国产午夜福利一区二区| 在线视频一区二区三区| 性中国古装videossex| 亚洲欧美日韩网| 青青在线视频| 成人国产精品一区二区| 九九热播视频在线精品6| 亚洲精品一区二区三区av| 欧美综合国产| 午夜诱惑痒痒网| 99久久久久免费精品国产| 三级影片在线看| 色屁屁一区二区| 蜜桃久久一区二区三区| 综合久久五月天| 国产在线精彩视频| 99re在线视频上| 日本a口亚洲| 人人妻人人添人人爽欧美一区| 国产伦理精品不卡| 五月婷婷婷婷婷| 亚洲不卡av一区二区三区| 99久久精品国产一区色| 尤物九九久久国产精品的分类 | 欧美精品三级在线| 亚洲精品欧洲精品| 性感少妇一区| 一级黄色免费视频| 一区二区三区高清| 国产又粗又长又黄| 亚洲欧美日韩精品久久奇米色影视| 青春草视频在线观看| 国产精品一二区| 色爱综合网欧美| av在线无限看| 久久久久综合网| 4438国产精品一区二区| 日韩精品在线电影| 三级在线看中文字幕完整版| 91aaaa| 国产国产精品| 国产成人美女视频| 日本一区二区在线不卡| 国产一级av毛片| 亚洲国产精久久久久久| 丝袜国产在线| 狠狠久久综合婷婷不卡| 激情综合激情| 亚洲一区二区三区三州| 伊人开心综合网| 亚洲国产精品久久人人爱潘金莲 | 亚洲中字在线| 污污污www精品国产网站| 午夜日韩在线电影| 天天射天天操天天干| 欧美俄罗斯乱妇| 美女网站色精品尤物极品姐弟| 免费看欧美一级片| 91视频国产资源| 一级片中文字幕| 精品爽片免费看久久| 日日夜夜天天综合| 神马欧美一区二区| 精久久久久久久久久久| 91制片厂在线| 91精品国产乱码久久蜜臀| 在线电影福利片| 国产精品sss| 日韩精品一级中文字幕精品视频免费观看| 国产精品一区二区入口九绯色| 色婷婷精品久久二区二区蜜臀av | 精品国产麻豆| 91网站在线观看免费| 99久久精品国产一区二区三区 | 国产黄色在线观看| 999精品在线观看| 午夜亚洲伦理| 亚洲色图欧美色| 欧美日韩国产高清一区二区| 日本动漫理论片在线观看网站| 国产精华一区| 蜜桃精品在线观看| www.xxxx日本| 精品av综合导航| 国产成人福利夜色影视| 男女啪啪免费观看| 国产丝袜在线精品| 国产裸体无遮挡| 欧美在线视频观看免费网站| 精品免费一区二区| 亚洲av无一区二区三区久久| 色偷偷一区二区三区| 米奇777四色精品人人爽| 久久精品丝袜高跟鞋| 久久精品理论片|