精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Elasticsearch查詢速度為什么這么快?

開發 架構 開發工具
這段時間在維護產品的搜索功能,每次在管理臺看到 Elasticsearch 這么高效的查詢效率我都很好奇他是如何做到的。

 這段時間在維護產品的搜索功能,每次在管理臺看到 Elasticsearch 這么高效的查詢效率我都很好奇他是如何做到的。

[[346395]]

 

圖片來自 Pexels

這甚至比在我本地使用 MySQL 通過主鍵的查詢速度還快。

 

為此我搜索了相關資料:

 

 

 

 

這類問題網上很多答案,大概意思呢如下:ES 是基于 Lucene 的全文檢索引擎,它會對數據進行分詞后保存索引,擅長管理大量的索引數據,相對于 MySQL 來說不擅長經常更新數據及關聯查詢。

說的不是很透徹,沒有解析相關的原理;不過既然反復提到了索引,那我們就從索引的角度來對比下兩者的差異。

MySQL 索引

先從 MySQL 說起,索引這個詞想必大家也是爛熟于心,通常存在于一些查詢的場景,是典型的空間換時間的案例。以下內容以 InnoDB 引擎為例。

常見的數據結構

假設由我們自己來設計 MySQL 的索引,大概會有哪些選擇呢?

①散列表

首先我們應當想到的是散列表,這是一個非常常見且高效的查詢、寫入的數據結構,對應到 Java 中就是 HashMap。

 

這個數據結構應該不需要過多介紹了,它的寫入效率很高 O(1),比如我們要查詢 id=3 的數據時,需要將 3 進行哈希運算,然后再這個數組中找到對應的位置即可。

但如果我們想查詢 1≤id≤6 這樣的區間數據時,散列表就不能很好的滿足了,由于它是無序的,所以得將所有數據遍歷一遍才能知道哪些數據屬于這個區間。

②有序數組

 

有序數組的查詢效率也很高,當我們要查詢 id=4 的數據時,只需要通過二分查找也能高效定位到數據 O(logn)。

同時由于數據也是有序的,所以自然也能支持區間查詢;這么看來有序數組適合用做索引咯?

自然是不行,它有另一個重大問題;假設我們插入了 id=2.5 的數據,就得同時將后續的所有數據都移動一位,這個寫入效率就會變得非常低。

③平衡二叉樹

既然有序數組的寫入效率不高,那我們就來看看寫入效率高的,很容易就能想到二叉樹。

這里我們以平衡二叉樹為例:

 

由于平衡二叉樹的特性:左節點小于父節點、右節點大于父節點。

所以假設我們要查詢 id=11 的數據,只需要查詢 10→12→11 便能最終找到數據,時間復雜度為 O(logn),同理寫入數據時也為 O(logn)。

但依然不能很好的支持區間范圍查找,假設我們要查詢 5≤id≤20 的數據時,需要先查詢 10 節點的左子樹再查詢 10 節點的右子樹最終才能查詢到所有數據。導致這樣的查詢效率并不高。

④跳表

跳表可能不像上邊提到的散列表、有序數組、二叉樹那樣日常見的比較多,但其實 Redis 中的 sort set 就采用了跳表實現。這里我們簡單介紹下跳表實現的數據結構有何優勢。

我們都知道即便是對一個有序鏈表進行查詢效率也不高,由于它不能使用數組下標進行二分查找,所以時間復雜度是 o(n)。

但我們也可以巧妙的優化鏈表來變相的實現二分查找,如下圖:

 

我們可以為最底層的數據提取出一級索引、二級索引,根據數據量的不同,我們可以提取出 N 級索引。當我們查詢時便可以利用這里的索引變相的實現了二分查找。

假設現在要查詢 id=13 的數據,只需要遍歷 1→7→10→13 四個節點便可以查詢到數據,當數越多時,效率提升會更明顯。

同時區間查詢也是支持,和剛才的查詢單個節點類似,只需要查詢到起始節點,然后依次往后遍歷(鏈表有序)到目標節點便能將整個范圍的數據查詢出來。

同時由于我們在索引上不會存儲真正的數據,只是存放一個指針,相對于最底層存放數據的鏈表來說占用的空間便可以忽略不計了。

平衡二叉樹的優化

但其實 MySQL 中的 InnoDB 并沒有采用跳表,而是使用的一個叫做 B+ 樹的數據結構。

這個數據結構不像是二叉樹那樣大學老師當做基礎數據結構經常講到,由于這類數據結構都是在實際工程中根據需求場景在基礎數據結構中演化而來。

比如這里的 B+ 樹就可以認為是由平衡二叉樹演化而來。剛才我們提到二叉樹的區間查詢效率不高,針對這一點便可進行優化:

 

在原有二叉樹的基礎上優化后:所有的非葉子都不存放數據,只是作為葉子節點的索引,數據全部都存放在葉子節點。

這樣所有葉子節點的數據都是有序存放的,便能很好的支持區間查詢。只需要先通過查詢到起始節點的位置,然后在葉子節點中依次往后遍歷即可。

當數據量巨大時,很明顯索引文件是不能存放于內存中,雖然速度很快但消耗的資源也不小;所以 MySQL 會將索引文件直接存放于磁盤中。

這點和后文提到 Elasticsearch 的索引略有不同。由于索引存放于磁盤中,所以我們要盡可能的減少與磁盤的 IO(磁盤 IO 的效率與內存不在一個數量級)。

通過上圖可以看出,我們要查詢一條數據至少得進行 4 次IO,很明顯這個 IO 次數是與樹的高度密切相關的,樹的高度越低 IO 次數就會越少,同時性能也會越好。

那怎樣才能降低樹的高度呢?

 

我們可以嘗試把二叉樹變為三叉樹,這樣樹的高度就會下降很多,這樣查詢數據時的 IO 次數自然也會降低,同時查詢效率也會提高許多。這其實就是 B+ 樹的由來。

使用索引的一些建議

其實通過上圖對 B+樹的理解,也能優化日常工作的一些小細節;比如為什么需要最好是有序遞增的?

假設我們寫入的主鍵數據是無序的,那么有可能后寫入數據的 id 小于之前寫入的,這樣在維護 B+樹索引時便有可能需要移動已經寫好數據。

如果是按照遞增寫入數據時則不會有這個考慮,每次只需要依次寫入即可。所以我們才會要求數據庫主鍵盡量是趨勢遞增的,不考慮分表的情況時最合理的就是自增主鍵。

整體來看思路和跳表類似,只是針對使用場景做了相關的調整(比如數據全部存儲于葉子節點)。

ES 索引

MySQL 聊完了,現在來看看 Elasticsearch 是如何來使用索引的。

正排索引

在 ES 中采用的是一種名叫倒排索引的數據結構;在正式講倒排索引之前先來聊聊和他相反的正排索引。

 

以上圖為例,我們可以通過 doc_id 查詢到具體對象的方式稱為使用正排索引,其實也能理解為一種散列表。

本質是通過 key 來查找 value。比如通過 doc_id=4 便能很快查詢到 name=jetty wang,age=20 這條數據。

倒排索引

那如果反過來我想查詢 name 中包含了 li 的數據有哪些?這樣如何高效查詢呢?

僅僅通過上文提到的正排索引顯然起不到什么作用,只能依次將所有數據遍歷后判斷名稱中是否包含 li ;這樣效率十分低下。

但如果我們重新構建一個索引結構:

 

當要查詢 name 中包含 li 的數據時,只需要通過這個索引結構查詢到 Posting List 中所包含的數據,再通過映射的方式查詢到最終的數據。

這個索引結構其實就是倒排索引。

Term Dictionary

但如何高效的在這個索引結構中查詢到 li 呢,結合我們之前的經驗,只要我們將 Term 有序排列,便可以使用二叉樹搜索樹的數據結構在 o(logn) 下查詢到數據。

將一個文本拆分成一個一個獨立Term 的過程其實就是我們常說的分詞。

而將所有 Term 合并在一起就是一個 Term Dictionary,也可以叫做單詞詞典。

英文的分詞相對簡單,只需要通過空格、標點符號將文本分隔便能拆詞,中文則相對復雜,但也有許多開源工具做支持(由于不是本文重點,對分詞感興趣的可以自行搜索)。

當我們的文本量巨大時,分詞后的 Term 也會很多,這樣一個倒排索引的數據結構如果存放于內存那肯定是不夠存的,但如果像 MySQL 那樣存放于磁盤,效率也沒那么高。

Term Index

所以我們可以選擇一個折中的方法,既然無法將整個 Term Dictionary 放入內存中,那我們可以為 Term Dictionary 創建一個索引然后放入內存中。

這樣便可以高效的查詢 Term Dictionary ,最后再通過 Term Dictionary 查詢到 Posting List。

相對于 MySQL 中的 B+樹來說也會減少了幾次磁盤 IO。

 


 

 

這個 Term Index 我們可以使用這樣的 Trie 樹,也就是我們常說的字典樹來存放。

 

如果我們是以 j 開頭的 Term 進行搜索,首先第一步就是通過在內存中的 Term Index 查詢出以 j 打頭的 Term 在 Term Dictionary 字典文件中的哪個位置(這個位置可以是一個文件指針,可能是一個區間范圍)。

緊接著在將這個位置區間中的所有 Term 取出,由于已經排好序,便可通過二分查找快速定位到具體位置;這樣便可查詢出 Posting List。

最終通過 Posting List 中的位置信息便可在原始文件中將目標數據檢索出來。

更多優化

當然 Elasticsearch 還做了許多針對性的優化,當我們對兩個字段進行檢索時,就可以利用 Bitmap 進行優化。

比如現在需要查詢 name=li and age=18 的數據,這時我們需要通過這兩個字段將各自的結果 Posting List 取出。

 

最簡單的方法是分別遍歷兩個集合,取出重復的數據,但這個明顯效率低下。

這時我們便可使用 Bitmap 的方式進行存儲(還節省存儲空間),同時利用先天的位與計算便可得出結果。

  1. [1, 3, 5] ⇒ 10101 
  2.  
  3. [1, 2, 4, 5] ⇒ 11011 

這樣兩個二進制數組求與便可得出結果:

  1. 10001 ⇒ [1, 5] 

最終反解出 Posting List 為 [1, 5],這樣的效率自然是要高上許多。同樣的查詢需求在 MySQL 中并沒有特殊優化,只是先將數據量小的數據篩選出來之后再篩選第二個字段,效率自然也就沒有 ES 高。

當然在最新版的 ES 中也會對 Posting List 進行壓縮,具體壓縮規則可以查看官方文檔,這里就不具體介紹了。

總結

最后我們來總結一下:

 

通過以上內容可以看出再復雜的產品最終都是基礎數據結構組成,只是會對不同應用場景針對性的優化,所以打好數據結構與算法的基礎后再看某個新的技術或中間件時才能快速上手,甚至自己就能知道優化方向。

最后畫個餅,后續我會嘗試按照 ES 倒排索引的思路做一個單機版的搜索引擎,只有自己寫一遍才能加深理解。

 

作者:crossoverJie

編輯:陶家龍

出處:轉載自公眾號 crossoverJie(ID:crossoverJie)

責任編輯:武曉燕 來源: crossoverJie
相關推薦

2022-12-15 18:20:46

ClickHouse存儲引擎

2024-02-26 21:15:20

Kafka緩存參數

2020-02-27 15:44:41

Nginx服務器反向代理

2020-02-27 21:03:30

調度器架構效率

2020-03-30 15:05:46

Kafka消息數據

2023-08-29 07:46:08

Redis數據ReHash

2021-05-27 20:56:51

esbuild 工具JavaScript

2024-04-03 09:23:31

ES索引分析器

2023-03-21 08:02:36

Redis6.0IO多線程

2024-10-30 09:42:43

固態硬盤SSD閃存

2017-06-06 16:30:55

戴爾交付保障

2020-10-21 09:17:52

Redis面試內存

2022-01-04 08:54:32

Redis數據庫數據類型

2023-11-02 10:22:29

gRPC后端通信

2024-11-26 08:52:34

SQL優化Kafka

2024-07-24 08:38:07

2020-04-27 07:13:37

Nginx底層進程

2021-03-18 14:34:34

達達集團京東云電商

2013-06-14 10:12:22

共享并行

2021-06-27 22:48:28

Redis數據庫內存
點贊
收藏

51CTO技術棧公眾號

日本韩国在线观看| 中文字幕求饶的少妇| 咪咪网在线视频| 91麻豆视频网站| 国产成人精品久久亚洲高清不卡| 亚洲无人区码一码二码三码的含义 | 鲁鲁视频www一区二区| 波多野结衣人妻| 91精品啪在线观看国产81旧版| 日韩一区国产二区欧美三区| 大j8黑人w巨大888a片| 国产1区2区3区在线| 久久久久国产精品一区三寸| 久久精品电影网| 国产日韩视频一区| 性欧美18一19sex性欧美| 一区在线观看视频| 极品校花啪啪激情久久| 在线播放亚洲精品| 日韩视频不卡| 不卡av在线网站| 欧美老熟妇乱大交xxxxx| 精品久久亚洲| 欧洲一区在线观看| 日韩精品一区在线视频| 在线观看a视频| 99久久精品一区| 成人在线精品视频| 手机看片久久久| 欧美成人一品| 在线播放国产精品| 波多野结衣有码| 免费观看在线一区二区三区| 色av综合在线| 日本阿v视频在线观看| 日韩在线资源| 国产日产欧美精品一区二区三区| 国产精品一区而去| 国产精品一区二区av白丝下载| 免费视频一区| 欧美激情手机在线视频 | 成人av综合网| 日韩一区二区三区免费观看| 超碰在线97免费| 老色鬼在线视频| 亚洲午夜日本在线观看| 免费成人进口网站| 欧洲美女少妇精品| 日本一区二区三区在线观看| 欧美最大成人综合网| 香港一级纯黄大片| 成人免费视频app| 亚洲一区二区在线播放| 亚洲性生活大片| 美女性感视频久久| 国产精品久久久久久久久久久新郎| 国产 日韩 欧美 在线| 一本色道久久精品| 2020国产精品视频| 日韩综合在线观看| 视频一区国产视频| 国产成人精品亚洲精品| 欧美成人精品网站| 六月丁香婷婷色狠狠久久| 国产精品91在线| 这里只有久久精品视频| 免费观看成人av| 国产精品网址在线| 一区二区视频网站| 精品国产av无码| 国产精品99精品一区二区三区∴| 在线视频国内一区二区| 免费涩涩18网站入口| 91国拍精品国产粉嫩亚洲一区| 欧美中文字幕亚洲一区二区va在线| 狠狠爱免费视频| 日本一区免费网站| 欧美日韩不卡一区| 亚洲三级在线视频| 动漫3d精品一区二区三区乱码| 亚洲国产中文字幕久久网| av鲁丝一区鲁丝二区鲁丝三区| 欧美日韩破处| 一本色道久久88综合亚洲精品ⅰ | 影音先锋国产资源| 国产一区二区网址| 国产日韩欧美亚洲一区| 欧美女v视频| 国产精品免费丝袜| 欧妇女乱妇女乱视频| 国产拍在线视频| 欧美唯美清纯偷拍| 国产伦精品一区二区三区妓女下载 | 日韩久久电影| 欧美精品制服第一页| 日本熟妇毛茸茸丰满| 国产一级一级片| 欧美日韩专区| 欧美在线视频免费观看| 中文字幕在线观看1| 国产激情一区二区三区桃花岛亚洲| 国产一区二区三区高清| 国产大片在线免费观看| 亚洲精品视频观看| 成年网站在线免费观看| 91成人精品观看| 亚洲国产天堂久久国产91| 91大神福利视频| 国产精品www.| 国产成人中文字幕| 性一交一乱一透一a级| 久久九九影视网| 91精品国产毛片武则天| 亚洲wwww| 亚洲成成品网站| 男女全黄做爰文章| 亚洲国内精品| 91久久精品国产91性色| 男人天堂网在线观看| 亚洲精品一卡二卡| 成人免费视频久久| 精品少妇3p| 深夜福利一区二区| 西西44rtwww国产精品| 国产一区二区视频在线播放| 欧美久久电影| 黄色在线观看www| 日韩一区二区免费在线电影| 干b视频在线观看| 亚洲黄色影院| 亚洲综合日韩在线| av在线资源网| 色婷婷亚洲综合| 国产综合内射日韩久| 羞羞答答成人影院www| 国产成人精品a视频一区www| 污视频在线免费观看| 亚洲一区二区三区四区的| 亚洲精品乱码久久久久久动漫| 人人狠狠综合久久亚洲婷| 人人做人人澡人人爽欧美| 欧美一区二区三区激情| 一区二区三区中文字幕精品精品 | 9lporm自拍视频区在线| 国产精品久久久久久久久久免费看| 国产欧美日本在线| 91精品久久久久久粉嫩| 欧美色视频在线| 自拍偷拍亚洲天堂| 国产欧美精品久久| 国产日韩一区欧美| jizz一区二区三区| 精品国产凹凸成av人网站| 草视频在线观看| 精品亚洲免费视频| www.午夜色| 95精品视频| 久久天天躁狠狠躁夜夜av| 91精品国产乱码久久久久| 国产精品久久久久aaaa| 午夜免费看毛片| 亚洲国产一区二区在线观看| 成人做爰www免费看视频网站| av在线免费一区| 欧美日韩在线不卡| 色哟哟精品观看| 日本不卡高清视频| 亚洲国产另类久久久精品极度| 日本久久免费| 亚洲偷熟乱区亚洲香蕉av| 国语对白做受69按摩| 国产香蕉久久精品综合网| 国产成人无码精品久久久性色| 国产精品白浆| 久久精品中文字幕免费mv| 国产精品无码免费播放| 亚洲色图在线播放| 黄色三级视频在线播放| 一区二区中文| 成人国产精品久久久| 日本中文字幕视频在线| 欧美日韩国产高清一区二区三区| 欧美日韩国产一二三区| 蜜臀精品一区二区三区在线观看| 欧美亚洲视频一区| 成人污污视频| 欧美黑人巨大xxx极品| 天堂8在线视频| 午夜天堂影视香蕉久久| 黄免费在线观看| 看片网站欧美日韩| 麻豆映画在线观看| 成午夜精品一区二区三区软件| 欧美制服第一页| 草草影院在线观看| 3atv在线一区二区三区| 日本青青草视频| 99re视频精品| 三级a三级三级三级a十八发禁止| 97精品一区二区| 国产91精品入口17c| 神马久久午夜| 久久成人一区二区| 日韩在线视频第一页| 一本大道综合伊人精品热热| 国产精品18在线| 国产激情偷乱视频一区二区三区| 欧美在线一区视频| 第一会所亚洲原创| 97se视频在线观看| gay欧美网站| 精品中文字幕在线2019| 无码h黄肉3d动漫在线观看| 色婷婷av一区二区三区之一色屋| 最新av电影网站| 91免费观看视频在线| 久久久久免费看黄a片app| 精品国内自产拍在线观看视频 | 巨胸喷奶水www久久久免费动漫| 亚洲欧美综合区自拍另类| 国产成人精品白浆久久69| 欧美日韩国产麻豆| 免费国产羞羞网站美图| 91麻豆国产精品久久| 亚洲欧美日韩中文字幕在线观看| 欧美专区一区二区三区| 久久久无码中文字幕久...| 精品一区毛片| 亚洲综合中文字幕在线| 日本美女一区| 久久久久久有精品国产| yourporn在线观看视频| 欧美精品亚洲二区| 伊人精品在线视频| 欧美日韩国产在线播放| 老妇女50岁三级| 久久久精品蜜桃| 黄色免费看视频| 国产麻豆精品视频| 91激情视频在线| 日韩一区二区久久| 精品国偷自产一区二区三区| 国产精品久久久久久影院8一贰佰| 国内视频一区二区| 国产精品一区二区三区四区在线观看| 国产精品美女久久久久av超清| 波多野结衣在线播放| 日韩有码在线视频| 国产露出视频在线观看| 亚洲精品电影网站| 亚洲欧洲综合在线| 欧美videos大乳护士334| 国产又黄又粗又长| 福利视频一区二区| 男人的天堂一区| 夜夜爽夜夜爽精品视频| 91制片厂在线| 亚洲精品国产无天堂网2021| 亚洲色图27p| 国产精品婷婷午夜在线观看| 国产真人做爰视频免费| 国产精品毛片大码女人| 精品国产aaa| 久久久久久日产精品| 搡老熟女老女人一区二区| 久久这里都是精品| 黄瓜视频污在线观看| 久久精品男人天堂av| 污污视频网站在线免费观看| 亚洲视频在线一区二区| 精品午夜福利在线观看| 一区二区欧美国产| 日韩三级一区二区三区| 精品高清美女精品国产区| 亚洲视频 欧美视频| 色婷婷av一区二区三区软件| 波多野结衣日韩| 欧美猛男gaygay网站| 91丨porny丨在线中文| 欧美老年两性高潮| 97人人爽人人爽人人爽| 精品日韩在线一区| av中文字幕播放| 亚洲精品国产拍免费91在线| 天堂在线中文字幕| 亚洲欧洲在线视频| 国产美女av在线| 欧美日本在线视频中文字字幕| rebdb初裸写真在线观看| 国内伊人久久久久久网站视频 | 精品福利久久久| 一区二区国产日产| 欧美不卡一区| 青青视频在线播放| 香蕉av777xxx色综合一区| 亚洲一级免费在线观看| 国产精品亚洲а∨天堂免在线| 中文字幕1区2区| 久久一夜天堂av一区二区三区| 少妇无套高潮一二三区| 国产精品久久久久一区二区三区共| 一级片一级片一级片| 黄色一区二区在线观看| 一级黄色av片| 欧美一区二区三区免费大片 | 亚洲欧美三级在线| 色网站免费在线观看| 久久久久久综合网天天| 成人a在线观看高清电影| 4444kk亚洲人成电影在线| 啪啪国产精品| 一区二区三区偷拍| 美女国产一区| 又黄又爽又色的视频| 91一区二区在线| 岛国毛片在线观看| 色噜噜狠狠成人网p站| 91久久久久国产一区二区| 日韩不卡中文字幕| 肉体视频在线| 国产精品久久久久久久电影| 日韩三级网址| 亚洲一区二区在线观| 亚洲免费观看| 伊人色在线视频| 国产日产欧美一区二区三区| 久久精品性爱视频| 欧美人与性动xxxx| 亚洲av永久无码国产精品久久| 日韩中文娱乐网| sis001欧美| 999热视频在线观看| 国产精品久久久久久麻豆一区软件| 无码人妻精品一区二区三区在线| 激情久久五月天| 毛茸茸多毛bbb毛多视频| 樱桃视频在线观看一区| 在线观看中文字幕av| 亚洲国产精品久久久久秋霞蜜臀| 色图在线观看| 国产视频观看一区| 欧美美女在线观看| 欧美在线观看成人| 粉嫩aⅴ一区二区三区四区 | 国产精品日韩一区二区三区| 亚洲深深色噜噜狠狠爱网站| 午夜两性免费视频| 91美女蜜桃在线| 岛国av中文字幕| 亚洲激情视频在线播放| 性xxxxfjsxxxxx欧美| 国产拍精品一二三| 久久福利综合| 久久精品影视大全| 久久久精品2019中文字幕之3| 久久久久久久久久久久久av| 亚洲国产精品va在线| 欧洲在线视频| 国产精品乱子乱xxxx| 欧美日韩亚洲三区| 精产国品一区二区三区| 亚洲一区二区三区四区在线观看 | 久久国产视频一区| 精品成人一区二区三区四区| 美女91在线| 超碰97在线资源| 欧美区国产区| 日本成人xxx| 一区二区三区在线免费视频| 国产福利视频导航| 久久精品久久久久电影| 久久av影院| 在线精品日韩| 久久久久久久高潮| 国产一二三av| 欧美人狂配大交3d怪物一区| 成年在线电影| 5g国产欧美日韩视频| 国模吧视频一区| 久草视频福利在线| 91精品福利视频| 1pondo在线播放免费| 成人激情av在线| 日韩视频中文| 中文字幕 亚洲一区| 色噜噜狠狠成人中文综合| 在线激情小视频| 444亚洲人体| 欧美99在线视频观看| 美女露出粉嫩尿囗让男人桶| 岛国av在线不卡| 在线看的av网站| 国内一区二区在线视频观看| 欧美专区在线| 可以直接看的黄色网址| 亚洲精品在线免费播放| 另类激情视频| www.18av.com| 91视频国产资源| 黄色av一区二区|