同事問我,SQL 語句明明命中了索引,為什么執(zhí)行很慢?
我們都知道,業(yè)務(wù)開發(fā)涉及到數(shù)據(jù)庫的SQL操作時,一定要 review 是否命中索引。否則,會走 全表掃描,如果表數(shù)據(jù)量很大時,會慢的要死。
假如命中了索引呢?是不是就不會有慢查詢?

殊不知,我們習(xí)以為常的常識有時也會誤導(dǎo)我們!
人生好難!
聊這個話題,要有一定技術(shù)基礎(chǔ),需了解 B+ 樹的存儲結(jié)構(gòu)
1、工作準(zhǔn)備:建表,造數(shù)據(jù)
id的主鍵索引,和一個 user_name 的普通索引。CREATE TABLE `user` (
`id` bigint(20) NOT NULL AUTO_INCREMENT,
`user_name` varchar(128) NOT NULL DEFAULT '' COMMENT '用戶名',
`age` int(11) NOT NULL COMMENT '年齡',
`address` varchar(128) COMMENT '地址',
PRIMARY KEY (`id`),
key `idx_user_name` (user_name),
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COMMENT='用戶表';
user 表中插入 10000 條數(shù)據(jù)。@GetMapping("/insert_batch")
public Object insertBatch(@RequestParam("batch") int batch) {
for (int j = 1; j <= batch; j++) {
List<User> userList = new ArrayList<>();
for (int i = 1; i <= 100; i++) {
User user = User.builder().userName("Tom哥-" + ((j - 1) * 100 + i)).age(29).address("上海").build();
userList.add(user);
}
userMapper.insertBatch(userList);
}
return "success";
}
MySQL的慢查詢?nèi)罩臼荕ySQL提供的一種日志記錄,用來記錄在MySQL中響應(yīng)時間超過閥值的語句,具體指運行時間超過long_query_time值的SQL,則會被記錄到慢查詢?nèi)罩局小?/span>
slow_query_log:是否開啟慢查詢?nèi)罩荆?表示開啟,0表示關(guān)閉。 log-slow-queries:舊版(5.6以下版本)MySQL數(shù)據(jù)庫慢查詢?nèi)罩敬鎯β窂健?梢圆辉O(shè)置該參數(shù),系統(tǒng)則會默認給一個缺省的文件host_name-slow.log slow-query-log-file:新版(5.6及以上版本)MySQL數(shù)據(jù)庫慢查詢?nèi)罩敬鎯β窂???梢圆辉O(shè)置該參數(shù),系統(tǒng)則會默認給一個缺省的文件host_name-slow.log long_query_time:慢查詢閾值,當(dāng)查詢時間高于設(shè)定的閾值時,記錄到日志 log_queries_not_using_indexes:未使用索引的查詢也被記錄到慢查詢?nèi)罩局校蛇x項)
slow_query_log的值為OFF,表示慢查詢?nèi)罩臼墙玫模梢酝ㄟ^設(shè)置slow_query_log的值來開啟,如下所示:
使用set global slow_query_log=1 開啟了慢查詢?nèi)罩局粚Ξ?dāng)前數(shù)據(jù)庫生效,如果MySQL重啟后則會失效。如果要永久生效,必須修改配置文件 my.cnf
long_query_time的默認值為10 秒,支持二次修改。線上我們一般會設(shè)置成1秒,如果業(yè)務(wù)對延遲敏感的話,我們根據(jù)需要設(shè)置一個更低的值。
explain select * from user;,發(fā)現(xiàn) key 這列為NULL,說明了沒有命中索引,走了全表掃描。
explain select * from user where id=10;,發(fā)現(xiàn) key 這列為 PRIMARY,說明使用了主鍵索引。
explain select user_name from user;,發(fā)現(xiàn) key 這列為 idx_user_name,說明使用了二級普通索引。
rows 掃描行為 9968,說明走了全表掃描。性能很差。explain select * from user where id>0; 時,發(fā)現(xiàn)使用了主鍵索引。
id>0 的值,雖然走了索引但其實還是全表掃描。
掃描行數(shù)。過濾性是否足夠好。
5、回表優(yōu)化
user表 增加一個 user_name 和 age 的聯(lián)合索引。ALTER TABLE `user` ADD INDEX idx_user_name_age ( `user_name`,`age` );

explain select * from user where user_name like 'Tom哥-1%' and age =29;
① 首先在 idx_user_name_age索引樹,查找第一個以Tom哥-1開頭的記錄對應(yīng)的主鍵id② 根據(jù)主鍵id從主鍵索引樹找到整行記錄,并根據(jù) age做判斷過濾,等于29則留下,否則丟棄。這個過程也稱為回表③ 然后,在 idx_user_name_age聯(lián)合索引樹上向右遍歷,找到下一個主鍵id④ 再執(zhí)行第二步 ⑤ 后面重復(fù)執(zhí)行第三步、第四步,直到 user_name不是以Tom哥-1開頭,則結(jié)束⑥ 返回所有查詢結(jié)果
user_name 的前綴匹配,idx_user_name_age二級索引中的 age 部分并沒有發(fā)揮作用。導(dǎo)致了大量回表查詢,性能較差。Index Condition Pushdown Optimization
https://dev.mysql.com/doc/refman/5.6/en/index-condition-pushdown-optimization.html
① 首先在 idx_user_name_age索引樹,查找第一個以Tom哥-1開頭的索引記錄② 然后,判斷這個索引記錄中的 age是否等于 29。如果是,回表取出整行數(shù)據(jù),作為后面的結(jié)果返回;如果不是,則丟棄③ 在 idx_user_name_age聯(lián)合索引樹上向右遍歷,重復(fù)第二步,直到user_name不是以Tom哥-1開頭,則結(jié)束④ 返回所有查詢結(jié)果
age 是否等于 29 放在了遍歷聯(lián)合索引過程中進行,不需要回表判斷,大大降低了回表的次數(shù),提升性能。當(dāng)然這個優(yōu)化依然沒有繞開最左前綴原則,索引的過濾性仍然有提升空間。虛擬列 的概念。ALTER TABLE `user` add user_name_first varchar(12) generated always as
(left(user_name,6)) , add index(user_name_first,age);

explain select * from user where user_name_first like 'Tom哥-1%' and age =29;
row 變小了,證明優(yōu)化有效果。slow_query_log 收集到的慢 SQL ,結(jié)合 explain 分析是否命中索引,結(jié)合掃描行數(shù),有針對性的優(yōu)化慢 SQL。有道無術(shù),術(shù)可成;有術(shù)無道,止于術(shù)
歡迎大家關(guān)注Java之道公眾號
好文章,我在看??
