不止SQL優(yōu)化！數(shù)據(jù)庫(kù)還有哪些優(yōu)化大法？

作者：飄渺Jam 2021-12-27 09:52:43

當(dāng)有人問(wèn)你如何對(duì)數(shù)據(jù)庫(kù)進(jìn)行優(yōu)化時(shí)，很多人第一反應(yīng)想到的就是SQL優(yōu)化，如何創(chuàng)建索引，如何改寫SQL，他們把數(shù)據(jù)庫(kù)優(yōu)化與SQL優(yōu)化劃上了等號(hào)。當(dāng)然這不能算是完全錯(cuò)誤的回答，只不過(guò)思考的角度稍微片面了些，太“程序員思維”化了，沒(méi)有站在更高層次來(lái)思考回答。

前言

當(dāng)然這不能算是完全錯(cuò)誤的回答，只不過(guò)思考的角度稍微片面了些，太“程序員思維”化了，沒(méi)有站在更高層次來(lái)思考回答。那今天我們就將視角拔高，站在架構(gòu)的角度來(lái)聊聊這一問(wèn)題，數(shù)據(jù)庫(kù)優(yōu)化可以從哪些維度入手?

正如上圖所示，數(shù)據(jù)庫(kù)優(yōu)化可以從架構(gòu)優(yōu)化，硬件優(yōu)化，DB優(yōu)化，SQL優(yōu)化四個(gè)維度入手。

此上而下，位置越靠前優(yōu)化越明顯，對(duì)數(shù)據(jù)庫(kù)的性能提升越高。我們常說(shuō)的SQL優(yōu)化反而是對(duì)性能提高最小的優(yōu)化。

接下來(lái)我們?cè)倏纯疵糠N優(yōu)化該如何實(shí)施。

一、架構(gòu)優(yōu)化

一般來(lái)說(shuō)在高并發(fā)的場(chǎng)景下對(duì)架構(gòu)層進(jìn)行優(yōu)化其效果最為明顯，常見(jiàn)的優(yōu)化手段有：分布式緩存，讀寫分離，分庫(kù)分表等，每種優(yōu)化手段又適用于不同的應(yīng)用場(chǎng)景。

1、分布式緩存

有句老話說(shuō)的好，性能不夠，緩存來(lái)湊。當(dāng)需要在架構(gòu)層進(jìn)行優(yōu)化時(shí)我們第一時(shí)間就會(huì)想到緩存這個(gè)神器，在應(yīng)用與數(shù)據(jù)庫(kù)之間增加一個(gè)緩存服務(wù)，如Redis或Memcache。

當(dāng)接收到查詢請(qǐng)求后，我們先查詢緩存，判斷緩存中是否有數(shù)據(jù)，有數(shù)據(jù)就直接返回給應(yīng)用，如若沒(méi)有再查詢數(shù)據(jù)庫(kù)，并加載到緩存中，這樣就大大減少了對(duì)數(shù)據(jù)庫(kù)的訪問(wèn)次數(shù)，自然而然也提高了數(shù)據(jù)庫(kù)性能。

不過(guò)需要注意的是，引入分布式緩存后系統(tǒng)需要考慮如何應(yīng)對(duì)緩存穿透、緩存擊穿和緩存雪崩的問(wèn)題。

簡(jiǎn)單理解一下緩存穿透、緩存擊穿和緩存雪崩

緩存穿透：它是指當(dāng)用戶在查詢一條數(shù)據(jù)的時(shí)候，而此時(shí)數(shù)據(jù)庫(kù)和緩存都沒(méi)有關(guān)于這條數(shù)據(jù)的任何記錄。這條數(shù)據(jù)在緩存中沒(méi)找到就會(huì)向數(shù)據(jù)庫(kù)請(qǐng)求獲取數(shù)據(jù)。它拿不到數(shù)據(jù)時(shí)，是會(huì)一直查詢數(shù)據(jù)庫(kù)，這樣會(huì)對(duì)數(shù)據(jù)庫(kù)的訪問(wèn)造成很大的壓力。
緩存擊穿：一個(gè)熱點(diǎn)key剛好在某個(gè)時(shí)間點(diǎn)失效了，但是這時(shí)候突然來(lái)了大量對(duì)這個(gè)key的并發(fā)訪問(wèn)請(qǐng)求，導(dǎo)致大并發(fā)請(qǐng)求直接穿透緩存直達(dá)數(shù)據(jù)庫(kù)，瞬間對(duì)數(shù)據(jù)庫(kù)的訪問(wèn)壓力增大。
緩存雪崩：某一個(gè)時(shí)間段內(nèi)，緩存集中過(guò)期失效，如果這個(gè)時(shí)間段內(nèi)有大量請(qǐng)求，而查詢數(shù)據(jù)量巨大，所有的請(qǐng)求都會(huì)達(dá)到存儲(chǔ)層，存儲(chǔ)層的調(diào)用量會(huì)暴增，引起數(shù)據(jù)庫(kù)壓力過(guò)大甚至宕機(jī)。

2、讀寫分離

一主多從，讀寫分離，主動(dòng)同步，是一種常見(jiàn)的數(shù)據(jù)庫(kù)架構(gòu)優(yōu)化手段。

一般來(lái)說(shuō)當(dāng)你的應(yīng)用是讀多寫少，數(shù)據(jù)庫(kù)扛不住讀壓力的時(shí)候，采用讀寫分離，通過(guò)增加從庫(kù)數(shù)量可以線性提升系統(tǒng)讀性能。

主庫(kù)，提供數(shù)據(jù)庫(kù)寫服務(wù);從庫(kù)，提供數(shù)據(jù)庫(kù)讀能力;主從之間，通過(guò)binlog同步數(shù)據(jù)。

當(dāng)準(zhǔn)備實(shí)施讀寫分離時(shí)，為了保證高可用，需要實(shí)現(xiàn)故障的自動(dòng)轉(zhuǎn)移，主從架構(gòu)會(huì)有潛在主從不一致性問(wèn)題。

3、水平切分

水平切分，也是一種常見(jiàn)的數(shù)據(jù)庫(kù)架構(gòu)優(yōu)化手段。

當(dāng)你的應(yīng)用業(yè)務(wù)數(shù)據(jù)量很大，單庫(kù)容量成為性能瓶頸后，采用水平切分，可以降低數(shù)據(jù)庫(kù)單庫(kù)容量，提升數(shù)據(jù)庫(kù)寫性能。

當(dāng)準(zhǔn)備實(shí)施水平切分時(shí)，需要結(jié)合實(shí)際業(yè)務(wù)選取合理的分片鍵(sharding-key)，有時(shí)候?yàn)榱私鉀Q非分片鍵查詢問(wèn)題還需要將數(shù)據(jù)寫到單獨(dú)的查詢組件，如ElasticSearch。

4、架構(gòu)優(yōu)化小結(jié)

讀寫分離主要是用于解決 “數(shù)據(jù)庫(kù)讀性能問(wèn)題”
水平切分主要是用于解決“數(shù)據(jù)庫(kù)數(shù)據(jù)量大的問(wèn)題”
分布式緩存架構(gòu)可能比讀寫分離更適用于高并發(fā)、大數(shù)據(jù)量大場(chǎng)景。

二、硬件優(yōu)化

我們使用數(shù)據(jù)庫(kù)，不管是讀操作還是寫操作，最終都是要訪問(wèn)磁盤，所以說(shuō)磁盤的性能決定了數(shù)據(jù)庫(kù)的性能。一塊PCIE固態(tài)硬盤的性能是普通機(jī)械硬盤的幾十倍不止。這里我們可以從吞吐率、IOPS兩個(gè)維度看一下機(jī)械硬盤、普通固態(tài)硬盤、PCIE固態(tài)硬盤之間的性能指標(biāo)。

吞吐率：?jiǎn)挝粫r(shí)間內(nèi)讀寫的數(shù)據(jù)量
機(jī)械硬盤：約100MB/s ～ 200MB/s
普通固態(tài)硬盤：200MB/s ～ 500MB/s
PCIE固態(tài)硬盤：900MB/s ～ 3GB/s
IOPS：每秒IO操作的次數(shù)
機(jī)械硬盤：100 ～200
普通固態(tài)硬盤：30000 ～ 50000
PCIE固態(tài)硬盤：數(shù)十萬(wàn)

通過(guò)上面的數(shù)據(jù)可以很直觀的看到不同規(guī)格的硬盤之間的性能差距非常大，當(dāng)然性能更好的硬盤價(jià)格會(huì)更貴，在資金充足并且迫切需要提升數(shù)據(jù)庫(kù)性能時(shí)，嘗試更換一下數(shù)據(jù)庫(kù)的硬盤不失為一個(gè)非常好的舉措，你之前遇到SQL執(zhí)行緩慢問(wèn)題在你更換硬盤后很可能將不再是問(wèn)題。

三、DB優(yōu)化

SQL執(zhí)行慢有時(shí)候不一定完全是SQL問(wèn)題，手動(dòng)安裝一臺(tái)數(shù)據(jù)庫(kù)而不做任何參數(shù)調(diào)整，再怎么優(yōu)化SQL都無(wú)法讓其性能最大化。要讓一臺(tái)數(shù)據(jù)庫(kù)實(shí)例完全發(fā)揮其性能，首先我們就得先優(yōu)化數(shù)據(jù)庫(kù)的實(shí)例參數(shù)。

數(shù)據(jù)庫(kù)實(shí)例參數(shù)優(yōu)化遵循三句口訣：日志不能小、緩存足夠大、連接要夠用。

數(shù)據(jù)庫(kù)事務(wù)提交后需要將事務(wù)對(duì)數(shù)據(jù)頁(yè)的修改刷( fsync)到磁盤上，才能保證數(shù)據(jù)的持久性。這個(gè)刷盤，是一個(gè)隨機(jī)寫，性能較低，如果每次事務(wù)提交都要刷盤，會(huì)極大影響數(shù)據(jù)庫(kù)的性能。數(shù)據(jù)庫(kù)在架構(gòu)設(shè)計(jì)中都會(huì)采用如下兩個(gè)優(yōu)化手法：

先將事務(wù)寫到日志文件RedoLog(WAL)，將隨機(jī)寫優(yōu)化成順序?qū)?/li>
加一層緩存結(jié)構(gòu)Buffer，將單次寫優(yōu)化成順序?qū)?/li>

所以日志跟緩存對(duì)數(shù)據(jù)庫(kù)實(shí)例尤其重要。而連接如果不夠用，數(shù)據(jù)庫(kù)會(huì)直接拋出異常，系統(tǒng)無(wú)法訪問(wèn)。

接下來(lái)我們以O(shè)racle、MySQL(InnoDB)、POSTGRES、達(dá)夢(mèng)為例，看看每種數(shù)據(jù)庫(kù)的參數(shù)該如何配置。

1、Oracle

2、MySQL

3、POSTGRES

4、達(dá)夢(mèng)數(shù)據(jù)庫(kù)

四、SQL優(yōu)化

SQL優(yōu)化很容易理解，就是通過(guò)給查詢字段添加索引或者改寫SQL提高其執(zhí)行效率，一般而言，SQL編寫有以下幾個(gè)通用的技巧：

1)合理使用索引

索引少了查詢慢;索引多了占用空間大，執(zhí)行增刪改語(yǔ)句的時(shí)候需要?jiǎng)討B(tài)維護(hù)索引，影響性能選擇率高(重復(fù)值少)且被where頻繁引用需要建立B樹(shù)索引;一般join列需要建立索引;復(fù)雜文檔類型查詢采用全文索引效率更好;索引的建立要在查詢和DML性能之間取得平衡;復(fù)合索引創(chuàng)建時(shí)要注意基于非前導(dǎo)列查詢的情況

2)使用UNION ALL替代UNION

UNION ALL的執(zhí)行效率比UNION高，UNION執(zhí)行時(shí)需要排重;UNION需要對(duì)數(shù)據(jù)進(jìn)行排序

3)避免select * 寫法

執(zhí)行SQL時(shí)優(yōu)化器需要將 * 轉(zhuǎn)成具體的列;每次查詢都要回表，不能走覆蓋索引。

4)JOIN字段建議建立索引

一般JOIN字段都提前加上索引

5)避免復(fù)雜SQL語(yǔ)句

提升可閱讀性;避免慢查詢的概率;可以轉(zhuǎn)換成多個(gè)短查詢，用業(yè)務(wù)端處理

6)避免where 1=1寫法

7)避免order by rand()類似寫法

RAND()導(dǎo)致數(shù)據(jù)列被多次掃描

1、執(zhí)行計(jì)劃

要想優(yōu)化SQL必須要會(huì)看執(zhí)行計(jì)劃，執(zhí)行計(jì)劃會(huì)告訴你哪些地方效率低，哪里可以需要優(yōu)化。我們以MYSQL為例，來(lái)認(rèn)識(shí)一下執(zhí)行計(jì)劃。

通過(guò)explain sql 可以查看執(zhí)行計(jì)劃，如：

2、SQL優(yōu)化實(shí)戰(zhàn)

這里為大家準(zhǔn)備了一套SQL優(yōu)化的綜合實(shí)戰(zhàn)，一步一步帶你走一遍完整SQL優(yōu)化的過(guò)程。

在執(zhí)行優(yōu)化之前我們需要先認(rèn)識(shí)一下原始表及待優(yōu)化的SQL。

1)原數(shù)據(jù)庫(kù)表結(jié)構(gòu)

CREATE TABLE `a` 
( 
    `id`          int(11) NOT NULL AUTO_INCREMENT, 
    `seller_id`   bigint(20)                                       DEFAULT NULL, 
    `seller_name` varchar(100) CHARACTER SET utf8 COLLATE utf8_bin DEFAULT NULL, 
    `gmt_create`  varchar(30)                                      DEFAULT NULL, 
    PRIMARY KEY (`id`) 
); 
CREATE TABLE `b` 
( 
    `id`          int(11) NOT NULL AUTO_INCREMENT, 
    `seller_name` varchar(100) DEFAULT NULL, 
    `user_id`     varchar(50)  DEFAULT NULL, 
    `user_name`   varchar(100) DEFAULT NULL, 
    `sales`       bigint(20)   DEFAULT NULL, 
    `gmt_create`  varchar(30)  DEFAULT NULL, 
    PRIMARY KEY (`id`) 
); 
CREATE TABLE `c` 
( 
    `id`         int(11) NOT NULL AUTO_INCREMENT, 
    `user_id`    varchar(50)  DEFAULT NULL, 
    `order_id`   varchar(100) DEFAULT NULL, 
    `state`      bigint(20)   DEFAULT NULL, 
    `gmt_create` varchar(30)  DEFAULT NULL, 
    PRIMARY KEY (`id`) 
);

2)待優(yōu)化的SQL(查詢當(dāng)前用戶在當(dāng)前時(shí)間前后10個(gè)小時(shí)的訂單情況，并根據(jù)訂單創(chuàng)建時(shí)間升序排列)

select a.seller_id, 
       a.seller_name, 
       b.user_name, 
       c.state 
from a, 
     b, 
     c 
where a.seller_name = b.seller_name 
  and b.user_id = c.user_id 
  and c.user_id = 17 
  and a.gmt_create 
    BETWEEN DATE_ADD(NOW(), INTERVAL – 600 MINUTE) 
    AND DATE_ADD(NOW(), INTERVAL 600 MINUTE) 
order by a.gmt_create；

3)原表數(shù)據(jù)量：

4)原執(zhí)行時(shí)間

0.21s，執(zhí)行速度還挺快

5)原執(zhí)行計(jì)劃

真是糟糕的執(zhí)行計(jì)劃。(全表掃描，沒(méi)有索引;臨時(shí)表;排序)

①初步優(yōu)化思路：

SQL中 where條件字段類型要跟表結(jié)構(gòu)一致，表中user_id 為varchar(50)類型，實(shí)際SQL用的int類型，存在隱式轉(zhuǎn)換，也未添加索引。將b和c表user_id 字段改成int類型。
因存在b表和c表關(guān)聯(lián)，將b和c表user_id創(chuàng)建索引
因存在a表和b表關(guān)聯(lián)，將a和b表seller_name字段創(chuàng)建索引
利用復(fù)合索引消除臨時(shí)表和排序

②初步優(yōu)化SQL

alter table b modify `user_id` int(10) DEFAULT NULL; 
alter table c modify `user_id` int(10) DEFAULT NULL; 
alter table c add index `idx_user_id`(`user_id`); 
alter table b add index `idx_user_id_sell_name`(`user_id`,`seller_name`); 
alter table a add index `idx_sellname_gmt_sellid`(`gmt_create`,`seller_name`,`seller_id`);

③查看優(yōu)化后的執(zhí)行時(shí)間

通過(guò)執(zhí)行計(jì)劃可以看到，執(zhí)行時(shí)間從0.21s優(yōu)化成了0.01s，執(zhí)行時(shí)間近乎縮短20倍。

④查看優(yōu)化后的執(zhí)行計(jì)劃

執(zhí)行計(jì)劃顯示從全表掃描優(yōu)化成了走索引，rows減少，但是此時(shí)出現(xiàn)了2個(gè)告警。

⑤通過(guò)show warning語(yǔ)句查看告警信息

提示gmt_crteate 的格式不對(duì)，mysql進(jìn)行了隱式轉(zhuǎn)換導(dǎo)致不能使用索引。

⑥繼續(xù)優(yōu)化，修改gmtc-create的格式

alter table a modify "gmt_create" datetime DEFAULT NULL;

⑦再次查看執(zhí)行時(shí)間

⑧再次查看執(zhí)行計(jì)劃

至此，我們的優(yōu)化過(guò)程結(jié)束，結(jié)果非常完美。

3、SQL優(yōu)化小結(jié)

這里給大家總結(jié)一下SQL優(yōu)化的套路：

查看執(zhí)行計(jì)劃 explain sql
如果有告警信息，查看告警信息 show warnings;
查看SQL涉及的表結(jié)構(gòu)和索引信息
根據(jù)執(zhí)行計(jì)劃，思考可能的優(yōu)化點(diǎn)
按照可能的優(yōu)化點(diǎn)執(zhí)行表結(jié)構(gòu)變更、增加索引、SQL改寫等操作
查看優(yōu)化后的執(zhí)行時(shí)間和執(zhí)行計(jì)劃
如果優(yōu)化效果不明顯，重復(fù)第四步操作

小結(jié)

我們今天分別從架構(gòu)優(yōu)化、硬件優(yōu)化、DB優(yōu)化、SQL優(yōu)化四個(gè)角度探討了如何實(shí)施優(yōu)化，提升數(shù)據(jù)庫(kù)性能。但是大家還是要記住一句話，數(shù)據(jù)庫(kù)系統(tǒng)沒(méi)有銀彈，要讓適合的系統(tǒng)，做合適的事情。

責(zé)任編輯：未麗燕來(lái)源： JAVA日知錄

數(shù)據(jù)庫(kù)優(yōu)化 SQL