精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

單個(gè)Transformer信息檢索,谷歌用可微搜索索引打敗雙編碼器模型

人工智能 新聞
谷歌提出基于 Transformer 的可微文本檢索索引,明顯優(yōu)于雙編碼器模型等強(qiáng)大基線,并且還具有強(qiáng)大的泛化能力,在零樣本設(shè)置中優(yōu)于 BM25 基線。

信息檢索 (Information Retrieval, IR) 從互聯(lián)網(wǎng)誕生之日起,便有著不可撼動(dòng)的地位。如何從海量數(shù)據(jù)中找到用戶需要的信息是當(dāng)前研究的熱點(diǎn)。目前比較流行的 IR 方法是先檢索后排序(retrieve-then-rank)策略。在檢索算法中,比較常用的是基于反向索引或最近鄰搜索,其中基于對(duì)比學(xué)習(xí)的雙編碼器 (dual encoders,DE) 是目前性能最優(yōu)的模型。

近日,谷歌研究院在論文《Transformer Memory as a Differentiable Search Index》中提出了一種替代架構(gòu),研究者采用序列到序列 (seq2seq) 學(xué)習(xí)系統(tǒng)。該研究證明使用單個(gè) Transformer 即可完成信息檢索,其中有關(guān)語(yǔ)料庫(kù)的所有信息都編碼在模型的參數(shù)中。

該研究引入了可微搜索索引(Differentiable Search Index,DSI),這是一種學(xué)習(xí)文本到文本新范式。DSI 模型將字符串查詢直接映射到相關(guān)文檔;換句話說(shuō),DSI 模型只使用自身參數(shù)直接回答查詢,極大地簡(jiǎn)化了整個(gè)檢索過(guò)程。

此外,本文還研究了如何表示文檔及其標(biāo)識(shí)符的變化、訓(xùn)練過(guò)程的變化以及模型和語(yǔ)料庫(kù)大小之間的相互作用。實(shí)驗(yàn)表明,在適當(dāng)?shù)脑O(shè)計(jì)選擇下,DSI 明顯優(yōu)于雙編碼器模型等強(qiáng)大基線,并且 DSI 還具有強(qiáng)大的泛化能力,在零樣本設(shè)置中優(yōu)于 BM25 基線

論文鏈接:https://arxiv.org/pdf/2202.06991.pdf

DSI 體系架構(gòu)與 DE 比較:

論文一作、谷歌高級(jí)研究員 Yi Tay 表示:在這個(gè)新范式中,檢索的所有內(nèi)容都映射到易于理解的 ML 任務(wù)上。索引是模型訓(xùn)練的一種特殊情況,不再依賴外部不可微的 MIPS 操作進(jìn)行檢索。這使得統(tǒng)一模型更容易。

可微搜索索引

DSI 背后的核心思想是在單個(gè)神經(jīng)模型中完全參數(shù)化傳統(tǒng)的多階段先檢索后排序 pipeline。為此,DSI 模型必須支持兩種基本操作模式:

  • 索引:DSI 模型應(yīng)該學(xué)會(huì)將每個(gè)文檔內(nèi)容 d_j 與其對(duì)應(yīng)的 docid j ( 文檔標(biāo)識(shí)符 :document identifiers,docid)相關(guān)聯(lián)。本文采用一種簡(jiǎn)單的序列到序列方法,將文檔 token 作為輸入并生成標(biāo)識(shí)符作為輸出;
  • 檢索:給定輸入查詢,DSI 模型應(yīng)返回候選 docid 排序列表。本文是通過(guò)自回歸生成實(shí)現(xiàn)的。

在這兩個(gè)操作之后,DSI 模型可以用來(lái)索引文檔語(yǔ)料庫(kù),并對(duì)可用的帶標(biāo)記數(shù)據(jù)集(查詢和標(biāo)記文檔)進(jìn)行微調(diào),然后用于檢索相關(guān)文檔 —— 所有這些都在單個(gè)、統(tǒng)一的模型中完成。與先檢索后排序方法相反,DSI 模型允許簡(jiǎn)單的端到端訓(xùn)練,并且可以很容易地用作更大、更復(fù)雜的神經(jīng)模型的可微組件

雙編碼器 (DE) 的概述,它有兩個(gè)獨(dú)立的步驟,編碼和檢索。

索引策略

Inputs2Target:研究者將其構(gòu)建為 doc_tokens → docid 的 seq2seq 任務(wù),此方式能夠以直接輸入到目標(biāo)的方式將 docid 綁定到文檔 token。

Targets2Inputs:從標(biāo)識(shí)符生成文檔 token,即 docid → doc token。直觀來(lái)講,這相當(dāng)于訓(xùn)練一個(gè)以 docid 為條件的自回歸語(yǔ)言模型。

雙向:其在同一個(gè)聯(lián)合訓(xùn)練設(shè)置中訓(xùn)練 Inputs2Targets 和 targets2input。附加一個(gè) prefix token 以允許模型知道任務(wù)正在哪個(gè)方向執(zhí)行。

表示 Docids 用于檢索

基于 seq2seq 的 DSI 模型中的檢索是通過(guò)解碼給定輸入查詢 docid 來(lái)完成的。如何有效地解碼很大程度上取決于模型中 docid 的表示方式。在本節(jié)中,研究者探討了表示 docid 的多種可能方式以及如何處理解碼。

非結(jié)構(gòu)化原子標(biāo)識(shí)符(Atomic Identifiers):表示文檔最簡(jiǎn)單的方法是為每個(gè)文檔分配一個(gè)任意的(并且可能是隨機(jī)的)唯一整數(shù)標(biāo)識(shí)符,該研究將這些標(biāo)識(shí)符稱為非結(jié)構(gòu)化原子標(biāo)識(shí)符。研究者要想使用這些標(biāo)識(shí)符,一個(gè)明顯的解碼方式是學(xué)習(xí)標(biāo)識(shí)符上的概率分布。在這種情況下,模型被訓(xùn)練為每個(gè)唯一的 docid (|Ndocuments|) 發(fā)出一個(gè) logit。為了適應(yīng)這種情況,該研究將標(biāo)準(zhǔn)語(yǔ)言模型的輸出詞匯表擴(kuò)展如下:

簡(jiǎn)單的結(jié)構(gòu)化字符串標(biāo)識(shí)符:該研究還考慮了另一種方法,將非結(jié)構(gòu)化標(biāo)識(shí)符 (即任意唯一整數(shù)) 視為可標(biāo)記的(tokenizable)字符串,將其稱為簡(jiǎn)單的結(jié)構(gòu)化標(biāo)識(shí)符。在此標(biāo)識(shí)符下,檢索是通過(guò)依次解碼一個(gè) docid 字符串來(lái)完成的。解碼時(shí),使用 beam search 來(lái)獲得最佳 docid。但是,使用這種策略不容易獲得 top-k 排名。不過(guò),研究者可以徹底梳理整個(gè) docid 空間,并獲得給定查詢的每個(gè) docid 的可能性。

語(yǔ)義結(jié)構(gòu)化標(biāo)識(shí)符:其目標(biāo)是自動(dòng)創(chuàng)建滿足以下屬性的標(biāo)識(shí)符:(1) docid 應(yīng)該捕獲一些語(yǔ)義信息,(2) docid 的結(jié)構(gòu)應(yīng)該是在每一個(gè)解碼 step 之后有效地減少搜索空間。給定一個(gè)需要索引的語(yǔ)料庫(kù),所有文檔都聚集成 10 個(gè)簇。每個(gè)文檔分配有一個(gè)標(biāo)識(shí)符,其簇的編號(hào)從 0 到 9。下表為這個(gè)進(jìn)程的偽代碼:

實(shí)驗(yàn)結(jié)果

所有 DSI 模型均使用標(biāo)準(zhǔn)預(yù)訓(xùn)練 T5 模型配置進(jìn)行初始化。配置名稱和對(duì)應(yīng)的模型參數(shù)數(shù)量為:Base (0.2B)、Large (0.8B)、XL (3B) 和 XXL (11B)。該研究用實(shí)驗(yàn)驗(yàn)證了上述各種策略的效果。

下表 3 給出了經(jīng)過(guò)微調(diào)的 NQ10K、NQ100K 和 NQ320K 的檢索結(jié)果,表 4 給出了零樣本檢索結(jié)果。對(duì)于零樣本檢索,模型僅針對(duì)索引任務(wù)而不是檢索任務(wù)進(jìn)行訓(xùn)練,因此模型看不到標(biāo)記查詢 → docid 數(shù)據(jù)點(diǎn)。

下圖 4 給出了 NQ320K 上的結(jié)果。總的來(lái)說(shuō),研究者發(fā)現(xiàn)直接索引方法效果最好,并且由于 docid 反復(fù)暴露于不同的 token,因此很難訓(xùn)練倒排索引( inverted index)方法。他們還發(fā)現(xiàn),較短的文檔長(zhǎng)度似乎在性能大幅下降超過(guò) 64 個(gè) token 時(shí)效果很好,這表明當(dāng)存在大量文檔 token 時(shí),可能更難優(yōu)化或有效記憶。最后,研究者還發(fā)現(xiàn)對(duì)文檔 token 應(yīng)用集合處理或停用詞預(yù)處理沒(méi)有額外的優(yōu)勢(shì)。

下圖 3 繪制了三種方法的縮放表現(xiàn)(以對(duì)數(shù)尺度計(jì)),它們分別是 DE、具有 naive ID 的 DSI 和具有語(yǔ)義 ID 的 DSI。其中,DSI (naive) 可以從 base 到 XXL 的尺度變化中獲益,并且似乎仍有改進(jìn)的空間。同時(shí),DSI (語(yǔ)義) 在開(kāi)始時(shí)與 DE base 具有同等競(jìng)爭(zhēng)力,但會(huì)隨尺度增加表現(xiàn)得更好。DE 模型在較小的參數(shù)化時(shí)基本處于穩(wěn)定狀態(tài)。

下圖 5 展示了修改索引比例對(duì)檢索樣本的影響。研究者發(fā)現(xiàn),索引和檢索任務(wù)之間的相互作用會(huì)顯著影響優(yōu)化過(guò)程。r 值設(shè)置得過(guò)高或過(guò)低一般都會(huì)導(dǎo)致性能不佳。他們發(fā)現(xiàn),索引比例為 32 時(shí)通常表現(xiàn)良好。

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心Pro
相關(guān)推薦

2021-11-02 20:44:47

數(shù)字化

2015-09-02 13:38:38

Windows 10搜索索引

2025-04-10 06:30:00

2010-06-11 17:00:34

2010-05-13 17:23:14

MySQL搜索索引

2019-01-24 17:15:09

Windows 10搜索索引加密文件

2010-06-10 13:54:10

MySQL全文搜索

2025-04-08 04:20:00

2021-03-29 11:37:50

人工智能深度學(xué)習(xí)

2021-03-22 10:52:13

人工智能深度學(xué)習(xí)自編碼器

2025-04-10 11:52:55

2012-04-10 16:55:22

PowerSmart編碼器

2012-04-01 16:40:45

編碼器

2023-04-25 21:36:07

火山引擎

2021-02-20 20:57:16

深度學(xué)習(xí)編程人工智能

2025-02-28 10:15:00

3D模型編碼器

2017-11-10 12:45:16

TensorFlowPython神經(jīng)網(wǎng)絡(luò)

2025-04-08 03:00:00

2025-04-07 03:30:00

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

欧美日韩 国产精品| 涩涩视频在线播放| 国产精品综合久久| 久久久久久国产免费 | 久久91精品国产91久久小草| www.欧美三级电影.com| 久草视频福利在线| 成人黄页网站视频| 亚洲午夜激情网站| 亚洲欧美精品| 青春有你2免费观看完整版在线播放高清| 三级在线观看一区二区| 欧美成人激情图片网| 国产色视频一区二区三区qq号| 欧美在线va视频| 亚洲不卡一区二区三区| 久久免费看毛片| 欧洲一级在线观看| 成人午夜av在线| 91麻豆国产精品| 特级西西444www高清大视频| 亚洲经典三级| 欧美激情免费在线| 我要看黄色一级片| 欧洲激情视频| 亚洲人成电影在线播放| 国模无码视频一区| 亚洲91网站| 欧美电影影音先锋| 国产wwwxx| 亚洲免费福利| 激情懂色av一区av二区av| 乱子伦一区二区| 免费在线毛片网站| 中文字幕乱码一区二区免费| 精品视频高清无人区区二区三区| 国产99视频在线| 麻豆视频观看网址久久| 国产激情视频一区| www.色国产| 蜜桃av综合| 欧美性受xxxx白人性爽| 久草视频在线资源| 欧美体内she精视频在线观看| 中文字幕在线亚洲| 日本一道本视频| 成人一区二区| 中文字幕一区电影| 日韩在线观看免| 久久精品影视| 另类美女黄大片| 男女做暖暖视频| 欧美人成网站| 久久久久久国产免费| 日本一二三区视频| 亚洲少妇在线| 青青a在线精品免费观看| 中文字幕激情小说| 久久久亚洲一区| 国产精品极品美女在线观看免费| 波多野结衣电车| 日本va欧美va精品发布| 国产免费亚洲高清| 国产精品露脸视频| 国产一区二区三区蝌蚪| 91久久大香伊蕉在人线| 可以免费看毛片的网站| 99精品视频免费在线观看| 久久久99国产精品免费| 成人综合影院| 亚洲私人黄色宅男| 性一交一乱一伧国产女士spa| 国产99re66在线视频| 黄色91在线观看| 五月天亚洲视频| 国产一区二区三区免费观看在线 | 国产+人+亚洲| 国产精品美女久久久久av爽| 首页欧美精品中文字幕| 国产日韩精品入口| 亚洲精品国产精品乱码不卡| eeuss国产一区二区三区| 欧美日韩视频在线一区二区观看视频| 成人免费黄色网页| 亚洲蜜臀av乱码久久精品| 久久久久久久9| 高清成人在线| 欧美xxxx在线观看| 国产又粗又猛又爽又黄av| 欧美疯狂party性派对| 欧美激情视频网站| 五月激情丁香网| 国产99久久久久久免费看农村| 麻豆成人av| 制服丝袜中文字幕在线| 日韩欧美在线中文字幕| 超碰中文字幕在线观看| 妖精一区二区三区精品视频| 久久精品视频亚洲| 欧美日韩综合在线观看| 韩国成人在线视频| 欧美精品v日韩精品v国产精品| av网站导航在线观看免费| 欧美三级免费观看| 26uuu国产| 成人在线免费小视频| 久久久亚洲国产天美传媒修理工| 在线观看国产小视频| 北条麻妃国产九九精品视频| 一区二区在线观看网站| 欧美gay囗交囗交| 日韩精品一区国产麻豆| 男人的天堂官网| 午夜亚洲激情| 国产欧美日韩亚洲| 调教一区二区| 91精品中文字幕一区二区三区 | 国产精品午夜久久| 青青青青草视频| 精品亚洲二区| 久久精品国产视频| 中文字幕第2页| 2023国产精品视频| 被灌满精子的波多野结衣| 成人豆花视频| 色伦专区97中文字幕| 无码人妻精品一区二区三区9厂 | 欧美精品一二三四| 99精品全国免费观看| 另类av一区二区| 极品日韩久久| 91色在线看| 精品国产电影一区二区| 免费在线观看国产精品| 国产伦精品一区二区三区免费| 亚洲一区二区三区四区中文| 成人美女黄网站| 亚洲精品视频免费| 亚洲精品午夜国产va久久成人| 丰满少妇久久久久久久| 成人高清dvd| 永久免费精品视频| 久久久久日韩精品久久久男男| 午夜精品久久久久久久99老熟妇| 中文字幕亚洲区| 五月婷婷六月丁香激情| 日本久久黄色| 国产狼人综合免费视频| 欧美一级二级三级区| 欧美人牲a欧美精品| 韩国一级黄色录像| 国产一区91精品张津瑜| www.18av.com| 99热这里只有精品首页| 欧美激情小视频| 欧美 日韩 国产 精品| 亚洲国产综合人成综合网站| av网页在线观看| 亚洲专区在线| 日韩精品另类天天更新| 欧美一级网址| 九九久久久久久久久激情| www.精品久久| 午夜精品一区二区三区三上悠亚| 国产极品一区二区| 久久精品首页| 亚洲电影一二三区| 精品国产亚洲一区二区三区大结局| 欧美成人亚洲成人| 欧美一级在线免费观看| 一本一本大道香蕉久在线精品 | 99精品视频在线观看播放| 亚洲r级在线观看| 2020国产在线| 亚洲网址你懂得| 国产一区二区女内射| 一区二区三区日韩欧美| 一二三不卡视频| 六月婷婷色综合| 日韩视频在线视频| 国产日韩视频在线| 亚洲xxxx做受欧美| 99riav视频在线观看| 一本一本久久a久久精品综合小说| 国产精品女人久久久| 亚洲成人动漫在线观看| 日本一道本视频| 成人成人成人在线视频| 日本激情视频在线| 欧美体内she精视频在线观看| 久久婷婷人人澡人人喊人人爽| 日韩电影精品| 91成人国产在线观看| 老司机午夜在线视频| 亚洲国产成人久久综合一区| 中文字幕乱码一区二区| 亚洲一卡二卡三卡四卡无卡久久| www..com.cn蕾丝视频在线观看免费版| 国产高清视频一区| 亚洲乱码国产一区三区| 欧美日韩调教| 性欧美videosex高清少妇| 国产乱人伦精品一区| 国产精品丝袜一区二区三区| 91丝袜在线| 欧美成aaa人片在线观看蜜臀| 精品视频三区| 亚洲精品久久久久久久久久久| 91片黄在线观看喷潮| 欧美日韩激情小视频| 91视频综合网| 亚洲国产精品ⅴa在线观看| 美女久久久久久久久| 国产一区视频导航| 手机在线看福利| 老司机免费视频久久| 欧美亚洲黄色片| 欧美激情在线| aaa免费在线观看| 欧美日韩色图| 欧美精品人人做人人爱视频| **爰片久久毛片| 成人激情黄色网| 欧美亚洲福利| 国产精品无av码在线观看| 你懂得影院夜精品a| 18久久久久久| 欧美日韩国产观看视频| 欧美激情一区二区三区久久久 | 综合久久国产九一剧情麻豆| 亚洲激情视频小说| 91免费国产在线| 日本japanese极品少妇| 成人av在线影院| 一二三区视频在线观看| 国产一区三区三区| 国内av一区二区| 狠狠色丁香久久婷婷综合丁香| 杨幂毛片午夜性生毛片| 久久精品在线| 97公开免费视频| 丝袜亚洲精品中文字幕一区| 99精品在线免费视频| 99热免费精品在线观看| 黄色网页免费在线观看| 日韩香蕉视频| 国产极品尤物在线| 国产精品日本| aaa毛片在线观看| 视频一区视频二区中文字幕| 无码日韩人妻精品久久蜜桃| 丝袜亚洲另类欧美| 日本中文字幕精品—区二区| 捆绑变态av一区二区三区| 天天干天天av| 国产丶欧美丶日本不卡视频| 97中文字幕在线观看| 成人的网站免费观看| 久久久久久久久免费看无码 | 美女露胸视频在线观看| 四虎国产精品免费久久| 98精品在线视频| 91福利在线尤物| 欧美有码在线观看| 日本.亚洲电影| 91久久中文字幕| www.国产精品一区| 国产亚洲精品美女久久久m| 四虎影视精品| 亚洲精品国产精品国自产| 亚洲一级毛片| 国产视频一视频二| 日本网站在线观看一区二区三区| 中文字幕永久有效| 成人激情文学综合网| 精品无人区无码乱码毛片国产| 亚洲国产精品精华液ab| 欧美黑人猛猛猛| 欧美视频精品一区| 一级aaaa毛片| 精品国产免费久久| 川上优的av在线一区二区| 久青草国产97香蕉在线视频| 91黄页在线观看| 国产欧美日韩中文字幕| 999久久精品| 色阁综合av| 在线视频观看日韩| 奇米影音第四色| av高清不卡在线| 欧美性x x x| 欧美视频中文字幕在线| 国产精品呻吟久久| 精品视频偷偷看在线观看| 免费日本一区二区三区视频| 国内精品一区二区三区四区| 99久久er| 美女视频久久| 午夜久久美女| 色播五月综合网| 久久一区二区视频| 久久精品波多野结衣| 在线观看91视频| 日本精品一二区| 日韩亚洲精品视频| 26uuu亚洲电影| av色综合网| 亚洲欧洲日韩| 鲁一鲁一鲁一鲁一av| 99久久精品国产精品久久| 久热这里有精品| 欧美日韩一区二区三区不卡| 天堂av在线免费观看| 欧美成人中文字幕| 国产成人久久精品麻豆二区| 久久精品中文字幕一区二区三区| 欧美二区视频| 特黄视频免费观看| 亚洲国产成人一区二区三区| 在线天堂中文字幕| 欧美mv和日韩mv国产网站| 美女av在线播放| 国产欧美久久一区二区| 九九视频免费观看视频精品| 黄页免费在线观看视频| 高清免费成人av| 久久久久久久久99| 日韩女优视频免费观看| av毛片在线| 91在线精品视频| 91精品国产福利在线观看麻豆| 9久久婷婷国产综合精品性色| 久久久久久99精品| 亚洲精品国产精品乱码| 欧美大片免费久久精品三p | 久久久影视传媒| 亚洲久久在线观看| 精品夜色国产国偷在线| 日韩欧美一中文字暮专区| 国产一区二区三区色淫影院| 欧美日本一区二区视频在线观看| 无套内谢丰满少妇中文字幕| 成人免费在线视频观看| 国产情侣自拍小视频| 欧美www在线| www.丝袜精品| 国产伦精品一区二区三区四区视频_| 国产盗摄女厕一区二区三区 | 在线a人片免费观看视频| 国产精品视频播放| 91精品国产乱码久久久久久| 992tv人人草| 亚洲成人精品一区| 日本福利片高清在线观看| 国产精品福利在线观看网址| 日韩www.| 三上悠亚 电影| 红桃av永久久久| 草草影院在线观看| 国产有码在线一区二区视频| 一级毛片免费高清中文字幕久久网| 欧美精品 - 色网| 洋洋成人永久网站入口| 婷婷丁香一区二区三区| 国产国语videosex另类| 天天揉久久久久亚洲精品| 国产成人精品一区二区三区在线观看| 亚洲国产精品影院| 国产在线你懂得| 成人免费黄色网| 日韩午夜激情| 欧美福利在线视频| 日韩免费福利电影在线观看| 天堂中文av在线资源库| 亚洲精品日韩成人| 丁香亚洲综合激情啪啪综合| 中文字幕精品无码一区二区| 综合久久五月天| 岛国精品一区| 欧美女同在线观看| 亚洲国产另类精品专区| 北岛玲一区二区三区| 粉嫩av一区二区三区免费观看| 久久在线精品| 久久黄色小视频| 国产一区二区三区在线播放免费观看| 国语精品视频| 国产精品wwwww| 一区二区三区波多野结衣在线观看| 天堂a中文在线| 91嫩草视频在线观看| 乱码第一页成人| 久久97人妻无码一区二区三区| 国产香蕉97碰碰久久人人| 视频精品二区| 超碰在线公开97| 欧美特级www| 色呦呦在线视频| 婷婷精品国产一区二区三区日韩 | 欧美日韩在线直播|