精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

ElasticSearch索引 VS MySQL索引

數據庫 MySQL
這段時間在維護產品的搜索功能,每次在管理臺看到 elasticsearch 這么高效的查詢效率我都很好奇他是如何做到的。

前言

這段時間在維護產品的搜索功能,每次在管理臺看到 elasticsearch 這么高效的查詢效率我都很好奇他是如何做到的。

這甚至比在我本地使用 MySQL 通過主鍵的查詢速度還快。

為此我搜索了相關資料:

這類問題網上很多答案,大概意思呢如下:

  •  ES 是基于 Lucene 的全文檢索引擎,它會對數據進行分詞后保存索引,擅長管理大量的索引數據,相對于 MySQL 來說不擅長經常更新數據及關聯查詢。

說的不是很透徹,沒有解析相關的原理;不過既然反復提到了索引,那我們就從索引的角度來對比下兩者的差異。

MySQL 索引

先從 MySQL 說起,索引這個詞想必大家也是爛熟于心,通常存在于一些查詢的場景,是典型的空間換時間的案例。

以下內容以 Innodb 引擎為例。

常見的數據結構

假設由我們自己來設計 MySQL 的索引,大概會有哪些選擇呢?

散列表

首先我們應當想到的是散列表,這是一個非常常見且高效的查詢、寫入的數據結構,對應到 Java 中就是 HashMap

這個數據結構應該不需要過多介紹了,它的寫入效率很高O(1),比如我們要查詢 id=3 的數據時,需要將 3 進行哈希運算,然后再這個數組中找到對應的位置即可。

但如果我們想查詢 1≤id≤6 這樣的區間數據時,散列表就不能很好的滿足了,由于它是無序的,所以得將所有數據遍歷一遍才能知道哪些數據屬于這個區間。

有序數組

有序數組的查詢效率也很高,當我們要查詢 id=4 的數據時,只需要通過二分查找也能高效定位到數據O(logn)。

同時由于數據也是有序的,所以自然也能支持區間查詢;這么看來有序數組適合用做索引咯?

自然是不行,它有另一個重大問題;假設我們插入了 id=2.5 的數據,就得同時將后續的所有數據都移動一位,這個寫入效率就會變得非常低。

平衡二叉樹

既然有序數組的寫入效率不高,那我們就來看看寫入效率高的,很容易就能想到二叉樹;這里我們以平衡二叉樹為例:

由于平衡二叉樹的特性:

左節點小于父節點、右節點大于父節點。

所以假設我們要查詢 id=11 的數據,只需要查詢 10—>12—>11 便能最終找到數據,時間復雜度為O(logn),同理寫入數據時也為O(logn)。

但依然不能很好的支持區間范圍查找,假設我們要查詢5≤id≤20 的數據時,需要先查詢10節點的左子樹再查詢10節點的右子樹最終才能查詢到所有數據。

導致這樣的查詢效率并不高。

跳表

跳表可能不像上邊提到的散列表、有序數組、二叉樹那樣日常見的比較多,但其實 Redis 中的 sort set 就采用了跳表實現。

這里我們簡單介紹下跳表實現的數據結構有何優勢。

我們都知道即便是對一個有序鏈表進行查詢效率也不高,由于它不能使用數組下標進行二分查找,所以時間復雜度是o(n)

但我們也可以巧妙的優化鏈表來變相的實現二分查找,如下圖:

我們可以為最底層的數據提取出一級索引、二級索引,根據數據量的不同,我們可以提取出 N 級索引。

當我們查詢時便可以利用這里的索引變相的實現了二分查找。

假設現在要查詢 id=13 的數據,只需要遍歷 1—>7—>10—>13 四個節點便可以查詢到數據,當數越多時,效率提升會更明顯。

同時區間查詢也是支持,和剛才的查詢單個節點類似,只需要查詢到起始節點,然后依次往后遍歷(鏈表有序)到目標節點便能將整個范圍的數據查詢出來。

同時由于我們在索引上不會存儲真正的數據,只是存放一個指針,相對于最底層存放數據的鏈表來說占用的空間便可以忽略不計了。

平衡二叉樹的優化

但其實 MySQL 中的 Innodb 并沒有采用跳表,而是使用的一個叫做 B+ 樹的數據結構。

這個數據結構不像是二叉樹那樣大學老師當做基礎數據結構經常講到,由于這類數據結構都是在實際工程中根據需求場景在基礎數據結構中演化而來。

比如這里的 B+ 樹就可以認為是由平衡二叉樹演化而來。

剛才我們提到二叉樹的區間查詢效率不高,針對這一點便可進行優化:

在原有二叉樹的基礎上優化后:所有的非葉子都不存放數據,只是作為葉子節點的索引,數據全部都存放在葉子節點。

這樣所有葉子節點的數據都是有序存放的,便能很好的支持區間查詢。

只需要先通過查詢到起始節點的位置,然后在葉子節點中依次往后遍歷即可。

當數據量巨大時,很明顯索引文件是不能存放于內存中,雖然速度很快但消耗的資源也不??;所以 MySQL 會將索引文件直接存放于磁盤中。

這點和后文提到 elasticsearch 的索引略有不同。

由于索引存放于磁盤中,所以我們要盡可能的減少與磁盤的 IO(磁盤 IO 的效率與內存不在一個數量級)

通過上圖可以看出,我們要查詢一條數據至少得進行 4 次IO,很明顯這個 IO 次數是與樹的高度密切相關的,樹的高度越低 IO 次數就會越少,同時性能也會越好。

那怎樣才能降低樹的高度呢?

我們可以嘗試把二叉樹變為三叉樹,這樣樹的高度就會下降很多,這樣查詢數據時的 IO 次數自然也會降低,同時查詢效率也會提高許多。

這其實就是 B+ 樹的由來。

使用索引的一些建議

其實通過上圖對 B+樹的理解,也能優化日常工作的一些小細節;比如為什么需要最好是有序遞增的?

假設我們寫入的主鍵數據是無序的,那么有可能后寫入數據的 id 小于之前寫入的,這樣在維護 B+樹 索引時便有可能需要移動已經寫好數據。

如果是按照遞增寫入數據時則不會有這個考慮,每次只需要依次寫入即可。

所以我們才會要求數據庫主鍵盡量是趨勢遞增的,不考慮分表的情況時最合理的就是自增主鍵。

整體來看思路和跳表類似,只是針對使用場景做了相關的調整(比如數據全部存儲于葉子節點)。

ES 索引

MySQL 聊完了,現在來看看 Elasticsearch 是如何來使用索引的。

正排索引

在 ES 中采用的是一種名叫倒排索引的數據結構;在正式講倒排索引之前先來聊聊和他相反的正排索引。

以上圖為例,我們可以通過 doc_id 查詢到具體對象的方式稱為使用正排索引,其實也能理解為一種散列表。

本質是通過 key 來查找 value。

比如通過 doc_id=4 便能很快查詢到 name=jetty wang,age=20 這條數據。

倒排索引

那如果反過來我想查詢 name 中包含了 li 的數據有哪些?這樣如何高效查詢呢?

僅僅通過上文提到的正排索引顯然起不到什么作用,只能依次將所有數據遍歷后判斷名稱中是否包含 li ;這樣效率十分低下。

但如果我們重新構建一個索引結構:

當要查詢 name 中包含 li 的數據時,只需要通過這個索引結構查詢到 Posting List 中所包含的數據,再通過映射的方式查詢到最終的數據。

這個索引結構其實就是倒排索引。

Term Dictionary

但如何高效的在這個索引結構中查詢到 li 呢,結合我們之前的經驗,只要我們將 Term 有序排列,便可以使用二叉樹搜索樹的數據結構在o(logn) 下查詢到數據。

將一個文本拆分成一個一個獨立Term 的過程其實就是我們常說的分詞。

而將所有 Term 合并在一起就是一個 Term Dictionary,也可以叫做單詞詞典。

  •  英文的分詞相對簡單,只需要通過空格、標點符號將文本分隔便能拆詞,中文則相對復雜,但也有許多開源工具做支持(由于不是本文重點,對分詞感興趣的可以自行搜索)。

當我們的文本量巨大時,分詞后的 Term 也會很多,這樣一個倒排索引的數據結構如果存放于內存那肯定是不夠存的,但如果像 MySQL 那樣存放于磁盤,效率也沒那么高。

Term Index

所以我們可以選擇一個折中的方法,既然無法將整個 Term Dictionary 放入內存中,那我們可以為Term Dictionary 創建一個索引然后放入內存中。

這樣便可以高效的查詢Term Dictionary ,最后再通過Term Dictionary 查詢到 Posting List。

相對于 MySQL 中的 B+樹來說也會減少了幾次磁盤IO。

這個 Term Index 我們可以使用這樣的 Trie樹 也就是我們常說的字典樹 來存放。

更多關于字典樹的內容請查看這里。

如果我們是以 j 開頭的 Term 進行搜索,首先第一步就是通過在內存中的 Term Index 查詢出以 j 打頭的 Term 在 Term Dictionary 字典文件中的哪個位置(這個位置可以是一個文件指針,可能是一個區間范圍)。

緊接著在將這個位置區間中的所有 Term 取出,由于已經排好序,便可通過二分查找快速定位到具體位置;這樣便可查詢出 Posting List。

最終通過 Posting List 中的位置信息便可在原始文件中將目標數據檢索出來。

更多優化

當然 ElasticSearch 還做了許多針對性的優化,當我們對兩個字段進行檢索時,就可以利用 bitmap 進行優化。

比如現在需要查詢 name=li and age=18 的數據,這時我們需要通過這兩個字段將各自的結果 Posting List 取出。

最簡單的方法是分別遍歷兩個集合,取出重復的數據,但這個明顯效率低下。

這時我們便可使用 bitmap 的方式進行存儲(還節省存儲空間),同時利用先天的位與 計算便可得出結果。

[1, 3, 5]       ⇒ 10101

[1, 2, 4, 5] ⇒ 11011

這樣兩個二進制數組求與便可得出結果:

10001 ⇒ [1, 5]

最終反解出 Posting List 為[1, 5],這樣的效率自然是要高上許多。

同樣的查詢需求在 MySQL 中并沒有特殊優化,只是先將數據量小的數據篩選出來之后再篩選第二個字段,效率自然也就沒有 ES 高。

當然在最新版的 ES 中也會對 Posting List 進行壓縮,具體壓縮規則可以查看官方文檔,這里就不具體介紹了。

總結

最后我們來總結一下:

通過以上內容可以看出再復雜的產品最終都是基礎數據結構組成,只是會對不同應用場景針對性的優化,所以打好數據結構與算法的基礎后再看某個新的技術或中間件時才能快速上手,甚至自己就能知道優化方向。

最后畫個餅,后續我會嘗試按照 ES 倒排索引的思路做一個單機版的搜索引擎,只有自己寫一遍才能加深理解。 

 

責任編輯:龐桂玉
相關推薦

2016-09-07 15:02:03

ElasticSear索引速度

2015-10-30 15:55:43

MySQL

2021-12-13 01:40:29

ElasticSear倒排索引

2025-04-10 01:11:00

2024-03-01 09:57:19

數據庫檢索項目

2022-03-25 10:38:40

索引MySQL數據庫

2017-09-04 16:03:46

MySQLMySQL索引索引

2011-03-31 13:51:54

MySQL索引

2010-10-12 13:42:11

MySQL單列索引

2010-05-26 13:42:08

MySQL數據庫索引

2024-12-11 08:09:54

2010-10-12 13:37:54

mysql索引

2010-10-08 13:53:14

2010-10-12 14:16:56

MySQL索引

2010-10-12 14:09:34

MySQL索引

2010-10-12 14:40:03

mysql索引

2011-08-08 15:43:01

MySQL索引

2017-08-17 16:42:38

Elastic 全文搜索服務器

2023-09-28 09:03:56

開源搜索分析引擎

2018-12-28 09:48:11

SolrElasticSear搜索
點贊
收藏

51CTO技術棧公眾號

亚洲精品一区二区三区av| 秋霞午夜一区二区| 少妇欧美激情一区二区三区| 成人性生交大片免费看网站| 久久综合成人精品亚洲另类欧美 | 欧美成人一区二区三区高清| 麻豆一区一区三区四区| 欧美亚洲综合色| 久久www视频| 麻豆影视在线| 国产99久久精品| 国产精品h片在线播放| 久操视频免费在线观看| 欧美日韩国产一区二区三区不卡| 欧美一区二区三区免费| 欧美日韩激情视频在线观看| 免费av网站在线看| 91麻豆文化传媒在线观看| 成人免费在线网址| 久久久久在线视频| 欧美日韩综合| 日韩亚洲一区二区| 国产伦精品一区二区三区妓女| 亚洲狼人在线| 91国产免费观看| 人妻夜夜添夜夜无码av| 麻豆tv免费在线观看| 久久久精品天堂| 国产精品日韩欧美一区二区| 91激情在线观看| 亚洲女同同性videoxma| 欧美激情亚洲国产| av资源在线免费观看| 亚洲第一二三区| 精品日韩在线观看| 日本成人在线免费观看| 97精品资源在线观看| 日本高清免费不卡视频| 日本www在线播放| segui88久久综合9999| 亚洲精品菠萝久久久久久久| 亚洲欧洲免费无码| 高清av在线| 国产欧美视频在线观看| 欧美高清性xxxxhd| 五月婷婷丁香网| www.久久久久久久久| 国产精品国产精品国产专区蜜臀ah | av黄色在线观看| 日本一区免费视频| 视频一区二区精品| 91caoporn在线| 中文字幕精品一区二区精品绿巨人 | 欧美伦理在线视频| 亚洲人午夜色婷婷| 熟女少妇内射日韩亚洲| 精品日韩免费| 日韩在线小视频| 国产又色又爽又高潮免费| 成人vr资源| 日韩视频免费中文字幕| 国产极品美女在线| 亚洲深深色噜噜狠狠爱网站| 久久高清视频免费| 免费无码毛片一区二区app| 国产精品a级| 97碰碰碰免费色视频| 日韩不卡在线播放| 日本成人中文字幕| 91麻豆国产语对白在线观看| 国内毛片毛片毛片毛片| 成人福利视频在线| 欧美日韩国产三区| 婷婷五月在线视频| 一区二区三区四区蜜桃| www插插插无码视频网站| 忘忧草在线日韩www影院| 日本韩国欧美三级| www.桃色.com| 久久亚洲道色| 国产亚洲精品91在线| 中文乱码字幕高清一区二区| 欧美日韩1080p| 国产91精品视频在线观看| 午夜精品一区二| 九色综合国产一区二区三区| 俄罗斯精品一区二区| 人操人视频在线观看| 国产精品久久久久久久午夜片 | 成年人视频软件| 亚洲xxx拳头交| 91精品国产一区| 伊人成人在线观看| 国产成人在线色| 日本亚洲导航| 牛牛精品视频在线| 在线观看免费亚洲| 亚洲少妇一区二区三区| 欧美日韩在线网站| 国内精品久久久久久中文字幕| 欧美日韩a v| 福利一区福利二区| 涩涩涩999| 国产美女一区视频| 欧美日韩五月天| 中文字幕 日本| 欧美独立站高清久久| 91精品国产免费久久久久久| 国产手机av在线| 欧美极品少妇xxxxⅹ高跟鞋| 欧美一级免费播放| 成人午夜888| 国产午夜一区二区| 国产一卡二卡在线播放| 久久精品国产一区二区三| 六月婷婷久久| 欧美1—12sexvideos| 9191久久久久久久久久久| 欧美特级黄色录像| 国产深夜精品| 岛国一区二区三区高清视频| 天堂а√在线资源在线| 日本韩国欧美国产| 成年人网站免费在线观看| 国产精品va| 国产精品福利在线观看网址| 天天av天天翘| 亚洲一区视频在线| 在线免费看v片| 日韩理论片av| 国产精品久久久久久亚洲调教| 无码国产精品一区二区色情男同| 一区二区三区中文字幕电影| 99九九精品视频| 99久久www免费| 国产精品三级美女白浆呻吟 | 国产日产精品1区| 浮妇高潮喷白浆视频| 国产成人在线中文字幕| 久99九色视频在线观看| 国产色片在线观看| 中文字幕综合网| а 天堂 在线| 亚洲精品tv久久久久久久久久| 国产精品亚发布| 成人在线免费公开观看视频| 色丁香久综合在线久综合在线观看| 欧美夫妇交换xxx| 亚洲特级毛片| 精品高清视频| 性感女国产在线| 国产婷婷色综合av蜜臀av | 久久久久久色| 欧美一级二级三级九九九| a日韩av网址| 亚洲欧美精品一区二区| 欧美一区免费看| 国产欧美综合在线观看第十页| 日日摸天天爽天天爽视频| 欧美激情在线免费| 国产精品丝袜一区二区三区| 欧美人xxx| 日韩亚洲欧美在线| 亚洲国产精一区二区三区性色| www.日韩av| 亚洲中文字幕久久精品无码喷水| 国产传媒欧美日韩成人精品大片| 国产精品日日做人人爱| 国产福利在线播放麻豆| 精品捆绑美女sm三区| 久久99精品波多结衣一区| 久久精品视频在线免费观看| 日本中文字幕二区| 狠狠干综合网| 日本亚洲导航| 精品国产乱码一区二区三区 | 在线观看欧美一区| 一区二区三区高清在线观看| 97超级碰在线看视频免费在线看| 国产高清视频免费最新在线| 91精品国产一区二区三区香蕉 | 1区2区3区在线视频| 精品99一区二区三区| 亚洲欧美综合另类| 亚洲欧洲在线观看av| 稀缺小u女呦精品呦| 日韩精品电影在线| 91精品国产毛片武则天| 日韩黄色网络| 91免费看片在线| 中文字幕21页在线看| 久久久999国产精品| 亚洲色偷精品一区二区三区| 欧美久久一区二区| 国产毛片aaa| 亚洲男人的天堂一区二区| 精品国产av色一区二区深夜久久| 免播放器亚洲一区| 国产av国片精品| 久久影院一区| 欧美大香线蕉线伊人久久国产精品 | 在线观看免费亚洲| 国产精品99无码一区二区| 欧美激情一区二区三区四区| 亚洲中文字幕无码一区| 蜜桃视频在线观看一区| 大j8黑人w巨大888a片| 91精品啪在线观看国产18| 免费观看成人在线| 澳门精品久久国产| 成人日韩在线电影| 日韩三区在线| 国模视频一区二区三区| 国产精品一卡二卡三卡| 亚洲欧美在线免费观看| 亚洲精品久久久久avwww潮水| 欧美色大人视频| 日日噜噜噜噜人人爽亚洲精品| 亚洲免费av网站| 久久久免费看片| 久久久精品tv| 精品国产一区在线| 国产成人精品网址| 在线播放免费视频| 久久精品国产一区二区| 日本a√在线观看| 欧美中文日韩| 国产乱子伦农村叉叉叉| 伊人久久成人| 韩国无码av片在线观看网站| 先锋资源久久| 中文字幕乱码一区二区三区| 欧洲福利电影| 日韩国产伦理| 欧美极品在线观看| 青青成人在线| 黄色不卡一区| 日韩福利在线| 精品国产一区二区三区久久久樱花| 久久精品五月婷婷| 日韩欧美在线精品| 久久一区二区精品| 一道在线中文一区二区三区| 精品一区二区三区免费毛片| 欧美激情15p| 久中文字幕一区| 自拍偷拍精品| 日本一区网站| 成人免费在线播放| 一区二区三区四区五区精品| 97精品国产| 国产女人18毛片| 好看的亚洲午夜视频在线| 日本一区二区三区四区五区六区| 牛牛国产精品| 九色自拍视频在线观看| 国产精品外国| 毛葺葺老太做受视频| 免费观看一级特黄欧美大片| 亚洲免费成人在线视频| 国产精品538一区二区在线| 伊人久久久久久久久| 成人av网站在线观看免费| 亚洲综合自拍网| 国产三级精品三级| 天天色影综合网| 亚洲综合色噜噜狠狠| 日韩 欧美 综合| 在线精品视频小说1| 国产精品-色哟哟| 精品国产一区二区亚洲人成毛片| 视频污在线观看| 一本色道久久88综合亚洲精品ⅰ| 91精品专区| 欧美激情欧美激情在线五月| 伊人网在线播放| 国产精品亚洲精品| 日韩一区免费| 免费av一区二区三区| 偷拍欧美精品| 少妇av一区二区三区无码| 日本女人一区二区三区| 国产又粗又猛又爽又黄| 91麻豆高清视频| 老司机成人免费视频| 亚洲国产精品一区二区www| 无码人妻av免费一区二区三区 | 欧美偷拍一区二区| www.com在线观看| 亚洲天堂色网站| 天天色天天射天天综合网| 日本欧美黄网站| 欧美精品三级在线| 欧美少妇一区| 欧美日本一区二区高清播放视频| 日韩中文字幕免费在线| 国产福利一区在线| 东方伊人免费在线观看| 亚洲成人一区二区| 亚洲天堂狠狠干| 日韩精品免费在线观看| 超碰在线caoporn| 国产精品久久av| 久久aimee| 亚洲天堂av免费在线观看| 老鸭窝91久久精品色噜噜导演| 日本成人xxx| 中文字幕国产精品一区二区| 国产在线观看99| 欧美精品电影在线播放| 欧美3p视频在线观看| 欧美国产视频一区二区| 国产福利91精品一区二区| 久久天天狠狠| 亚洲小说区图片区| 天天爽夜夜爽视频| 国产精品每日更新| 免费无码国产精品| 日韩av在线免费看| 久草在线资源站资源站| 国产在线拍揄自揄视频不卡99| 自拍偷拍精品| 男人亚洲天堂网| 99re视频这里只有精品| 久一视频在线观看| 日韩午夜电影在线观看| 黄网站免费在线播放| 国产精品永久免费视频| 国际精品欧美精品| 凹凸日日摸日日碰夜夜爽1| 不卡av在线网| 日本特黄特色aaa大片免费| 日韩一区二区三区四区 | 26uuu另类亚洲欧美日本一| 在线视频亚洲欧美中文| www.99riav| 激情欧美日韩一区二区| 国产wwwwxxxx| 欧美日韩dvd在线观看| 日本中文字幕在线视频| 国产精品日韩专区| 欧美顶级大胆免费视频| 一级淫片在线观看| 亚洲精品国产高清久久伦理二区| 国产精品高潮呻吟久久久| 久久久国产一区二区| 高清精品久久| 免费的av在线| 高清不卡一二三区| 国偷自拍第113页| 亚洲人成在线免费观看| 一区二区视频免费完整版观看| 日本免费高清一区二区| 免费观看久久久4p| 欧美色视频一区二区三区在线观看| 欧美日韩精品电影| 国产cdts系列另类在线观看| 5566av亚洲| 亚洲三级色网| 色一情一交一乱一区二区三区| 在线观看日韩国产| 黄色片免费在线观看| 99精品国产高清一区二区| 在线成人欧美| 男人操女人动态图| 欧美猛男gaygay网站| 深夜国产在线播放| 久久av一区二区三区漫画| 狂野欧美一区| 国产激情无码一区二区三区| 日韩欧美中文字幕精品| 日韩激情电影| 亚洲欧美在线网| 丁香激情综合国产| 亚洲大片免费观看| 久久亚洲欧美日韩精品专区| 白白在线精品| 91福利国产成人精品播放| 亚洲欧美另类小说| 无码精品人妻一区二区三区影院| 国产ts一区二区| 亚洲精品成人| 蜜臀av一区二区三区有限公司| 欧美午夜宅男影院| 丁香花在线电影| 日韩精品欧美专区| 国产aⅴ精品一区二区三区色成熟| 国产三级av片| 理论片在线不卡免费观看| 亚洲欧美校园春色| 熟妇无码乱子成人精品| 色综合咪咪久久| 在线heyzo| 视频二区一区| 99国产精品久久久| 国产乱码久久久| 国产成人91久久精品| 欧美视频亚洲视频| 国产大屁股喷水视频在线观看| 亚洲福利视频二区|