同事問我，SQL 語句明明命中了索引，為什么執(zhí)行很慢？

作者：Tom哥 2021-06-28 07:13:35

運維數(shù)據(jù)庫運維

我們都知道，業(yè)務(wù)開發(fā)涉及到數(shù)據(jù)庫的SQL操作時，一定要 review 是否命中索引。否則，會走全表掃描，如果表數(shù)據(jù)量很大時，會慢的要死。

[[407616]]

本文轉(zhuǎn)載自微信公眾號「微觀技術(shù)」，作者Tom哥。轉(zhuǎn)載本文請聯(lián)系微觀技術(shù)公眾號。

大家好，我是Tom哥~

假如命中了索引呢?是不是就不會有慢查詢?

殊不知，我們習(xí)以為常的常識有時也會誤導(dǎo)我們!

人生好難!

聊這個話題，要有一定技術(shù)基礎(chǔ)，需了解 B+ 樹的存儲結(jié)構(gòu)

如果不是很清楚的話，先看下之前一篇文章，有詳細(xì)介紹

面試題：mysql 一棵 B+ 樹可以存多少條數(shù)據(jù)?

1、工作準(zhǔn)備：建表，造數(shù)據(jù)

首先創(chuàng)建一張 user 表，并創(chuàng)建一個 id的主鍵索引，和一個 user_name 的普通索引。

CREATE TABLE `user` ( 
  `id` bigint(20) NOT NULL AUTO_INCREMENT, 
  `user_name` varchar(128) NOT NULL DEFAULT '' COMMENT '用戶名', 
  `age` int(11) NOT NULL  COMMENT '年齡', 
  `address` varchar(128) COMMENT '地址', 
   PRIMARY KEY (`id`), 
   key `idx_user_name` (user_name), 
) ENGINE=InnoDB  DEFAULT CHARSET=utf8mb4 COMMENT='用戶表';

啟動程序，往 user 表中插入 10000 條數(shù)據(jù)。

@GetMapping("/insert_batch") 
public Object insertBatch(@RequestParam("batch") int batch) { 
    for (int j = 1; j <= batch; j++) { 
        List<User> userList = new ArrayList<>(); 
        for (int i = 1; i <= 100; i++) { 
            User user = User.builder().userName("Tom哥-" + ((j - 1) * 100 + i)).age(29).address("上海").build(); 
            userList.add(user); 
        } 
        userMapper.insertBatch(userList); 
    } 
    return "success"; 
}

2、慢查詢

在分析原因前，我們先來了解 mysql 慢查詢是什么?如何定義的?

慢查詢定義：

MySQL的慢查詢?nèi)罩臼荕ySQL提供的一種日志記錄，用來記錄在MySQL中響應(yīng)時間超過閥值的語句，具體指運行時間超過long_query_time值的SQL，則會被記錄到慢查詢?nèi)罩局小?/p>

慢查詢相關(guān)參數(shù)：

slow_query_log：是否開啟慢查詢?nèi)罩荆?表示開啟，0表示關(guān)閉。
log-slow-queries：舊版(5.6以下版本)MySQL數(shù)據(jù)庫慢查詢?nèi)罩敬鎯β窂健？梢圆辉O(shè)置該參數(shù)，系統(tǒng)則會默認(rèn)給一個缺省的文件host_name-slow.log
slow-query-log-file：新版(5.6及以上版本)MySQL數(shù)據(jù)庫慢查詢?nèi)罩敬鎯β窂健？梢圆辉O(shè)置該參數(shù)，系統(tǒng)則會默認(rèn)給一個缺省的文件host_name-slow.log
long_query_time：慢查詢閾值，當(dāng)查詢時間高于設(shè)定的閾值時，記錄到日志
log_queries_not_using_indexes：未使用索引的查詢也被記錄到慢查詢?nèi)罩局?可選項)

默認(rèn)情況下slow_query_log的值為OFF，表示慢查詢?nèi)罩臼墙玫模梢酝ㄟ^設(shè)置slow_query_log的值來開啟，如下所示：

使用set global slow_query_log=1 開啟了慢查詢?nèi)罩局粚Ξ?dāng)前數(shù)據(jù)庫生效，如果MySQL重啟后則會失效。如果要永久生效，必須修改配置文件 my.cnf

long_query_time的默認(rèn)值為10 秒，支持二次修改。線上我們一般會設(shè)置成1秒，如果業(yè)務(wù)對延遲敏感的話，我們根據(jù)需要設(shè)置一個更低的值。

3、開始實驗

首先看下以下幾種場景的SQL語句執(zhí)行時，索引的命中情況。

1、執(zhí)行explain select * from user;，發(fā)現(xiàn) key 這列為NULL，說明了沒有命中索引，走了全表掃描。

2、執(zhí)行 explain select * from user where id=10;，發(fā)現(xiàn) key 這列為 PRIMARY，說明使用了主鍵索引。

3、執(zhí)行 explain select user_name from user;，發(fā)現(xiàn) key 這列為 idx_user_name，說明使用了二級普通索引。

但是，實驗發(fā)現(xiàn)，雖然走了二級索引，但是 rows 掃描行為 9968，說明走了全表掃描。性能很差。

本文測試只造了 1W 條數(shù)據(jù)，如果線上環(huán)境有個千萬級數(shù)據(jù)量，那估計要好幾秒才能響應(yīng)結(jié)果。

如果請求并發(fā)量很高，很容易引發(fā)數(shù)據(jù)庫連接無法及時釋放，導(dǎo)致客戶端無法獲取數(shù)據(jù)庫連接而報錯。

4、命中索引，依然很慢

我們知道所有的數(shù)據(jù)都是存儲在 B+ 索引樹上，當(dāng)執(zhí)行 explain select * from user where id>0; 時，發(fā)現(xiàn)使用了主鍵索引。

mysql 優(yōu)化器根據(jù)主鍵索引找到第一個 id>0 的值，雖然走了索引但其實還是全表掃描。

沒命中索引會走全表掃描，命中了索引也可能走全表掃描。

看來是否命中索引，并不是評判 SQL 性能好壞的唯一標(biāo)準(zhǔn)。

其實，還有一個重要指標(biāo)，那就是掃描行數(shù)。

當(dāng)一個表很大時，不僅要關(guān)注是否有索引，還要關(guān)注索引的過濾性是否足夠好。

5、回表優(yōu)化

首先為user表增加一個 user_name 和 age 的聯(lián)合索引。

ALTER TABLE `user` ADD INDEX idx_user_name_age ( `user_name`,`age` );

執(zhí)行 explain select * from user where user_name like 'Tom哥-1%' and age =29;

執(zhí)行流程：

① 首先在 idx_user_name_age 索引樹，查找第一個以 Tom哥-1 開頭的記錄對應(yīng)的主鍵id
② 根據(jù)主鍵id從主鍵索引樹找到整行記錄，并根據(jù)age做判斷過濾，等于29則留下，否則丟棄。這個過程也稱為回表
③ 然后，在 idx_user_name_age 聯(lián)合索引樹上向右遍歷，找到下一個主鍵id
④ 再執(zhí)行第二步
⑤ 后面重復(fù)執(zhí)行第三步、第四步，直到user_name不是以 Tom哥-1 開頭，則結(jié)束
⑥ 返回所有查詢結(jié)果

分析：

由于按user_name 的前綴匹配，idx_user_name_age二級索引中的 age 部分并沒有發(fā)揮作用。導(dǎo)致了大量回表查詢，性能較差。

有什么優(yōu)化策略：

MySQL 5.6 版本引入一個 Index Condition Pushdown Optimization

https://dev.mysql.com/doc/refman/5.6/en/index-condition-pushdown-optimization.html

優(yōu)化后，執(zhí)行流程：

① 首先在 idx_user_name_age 索引樹，查找第一個以 Tom哥-1 開頭的索引記錄
② 然后，判斷這個索引記錄中的 age 是否等于 29。如果是，回表取出整行數(shù)據(jù)，作為后面的結(jié)果返回;如果不是，則丟棄
③ 在 idx_user_name_age 聯(lián)合索引樹上向右遍歷，重復(fù)第二步，直到user_name不是以 Tom哥-1 開頭，則結(jié)束
④ 返回所有查詢結(jié)果

跟上面的過程差別，在于判斷 age 是否等于 29 放在了遍歷聯(lián)合索引過程中進(jìn)行，不需要回表判斷，大大降低了回表的次數(shù)，提升性能。

當(dāng)然這個優(yōu)化依然沒有繞開最左前綴原則，索引的過濾性仍然有提升空間。

這時，我們需要引入一個叫虛擬列的概念。

修改表結(jié)構(gòu)：

ALTER TABLE `user` add user_name_first varchar(12) generated always as  
(left(user_name,6)) , add index(user_name_first,age);

執(zhí)行 explain select * from user where user_name_first like 'Tom哥-1%' and age =29;

比較發(fā)現(xiàn)，掃描行數(shù) row 變小了，證明優(yōu)化有效果。

6、寫在最后

slow_query_log 收集到的慢 SQL ，結(jié)合 explain 分析是否命中索引，結(jié)合掃描行數(shù)，有針對性的優(yōu)化慢 SQL。

但是要注意一點，慢 SQL 日志中也可能有正常的 SQL，可能只是當(dāng)時CPU等系統(tǒng)資源過載，影響到正常 SQL 的執(zhí)行速度。

簡單來講，慢查詢和索引沒有必然聯(lián)系，一個SQL語句的執(zhí)行效率最終要看的是掃描行數(shù)。另外可以使用虛擬列和聯(lián)合索引來提升復(fù)雜查詢的執(zhí)行效率。

責(zé)任編輯：武曉燕來源：微觀技術(shù)

SQL 語句索引