MySQL中有专门负责优化SELECT语句的优化器模块,主要功能:通过计算分析系统中收集到的统计信息,为客户端请求的Query提供他认为最优的执行计划(他认为最优的数据检索方式,但不见得是DBA认为是最优的,这部分最耗费时间)
当客户端向MySQL 请求一条Query,命令解析器模块完成请求分类,区别出是 SELECT 并转发给MySQL Query Optimizer时,MySQL Query Optimizer 首先会对整条Query进行优化,处理掉一些常量表达式的预算,直接换算成常量值。并对 Query 中的查询条件进行简化和转换,如去掉一些无用或显而易见的条件、结构调整等。然后分析 Query 中的 Hint 信息(如果有),看显示Hint信息是否可以完全确定该Query 的执行计划。如果没有 Hint 或Hint 信息还不足以完全确定执行计划,则会读取所涉及对象的统计信息,根据 Query 进行些相应的计算分析,然后再得出最后的执行计划。
使用 EXPLAIN 关键字可以模拟优化器执行 SQL 查询语句,从而知道 MySQL 是 如何处理你的 SQL 语句的。分析你的查询语句或是表结构的性能瓶颈;
使用 EXPLAIN 关键字可以帮我们分析:
Explain + SQL语句
Column | JSON Name | Meaning |
---|---|---|
id | select_id | 表示查询中执行 select 子句或操作表的顺序: id 相同由上到下执行,id 不同由大到小执行 |
select_type | None | 查询的类型,主要是用于区别 普通查询、联合查询、子查询等的复杂查询 |
table | table_name | 显示这一行的数据是关于哪张表的 |
partitions | partitions | 代表分区表中的命中情况,非分区表,该项为null |
type | access_type | 访问类型排列:用于区分 SQL 的执行优劣,是较为重要的一个指标 |
possible_keys | possible_keys | 显示可能应用在这张表中的索引,一个或多个。 |
key | key | 实际使用的索引。如果为NULL,则没有使用索引 |
key_len | key_length | key_len 表示索引使用的字节数,值越大越好 |
ref | ref | 显示将哪些列或常量与键列中命名的索引进行比较,以从表中选择行。 |
rows | rows | rows 列显示 MySQL 认为它执行查询时必须检查的行数。值越小越好 |
filtered | filtered | 这个字段表示存储引擎返回的数据在 server 层过滤后, 剩下多少满足查询的记录数量的比例,注意是百分比 |
Extra | None | 包含不适合在其他列中显示,但十分重要的额外信息 |
CREATE TABLE t1(id INT(10) AUTO_INCREMENT,content VARCHAR(100) NULL , PRIMARY KEY (id));
CREATE TABLE t2(id INT(10) AUTO_INCREMENT,content VARCHAR(100) NULL , PRIMARY KEY (id));
CREATE TABLE t3(id INT(10) AUTO_INCREMENT,content VARCHAR(100) NULL , PRIMARY KEY (id));
CREATE TABLE t4(id INT(10) AUTO_INCREMENT,content VARCHAR(100) NULL , PRIMARY KEY (id));
INSERT INTO t1(content) VALUES(CONCAT('t1_',FLOOR(1+RAND()*1000)));
INSERT INTO t2(content) VALUES(CONCAT('t2_',FLOOR(1+RAND()*1000)));
INSERT INTO t3(content) VALUES(CONCAT('t3_',FLOOR(1+RAND()*1000)));
INSERT INTO t4(content) VALUES(CONCAT('t4_',FLOOR(1+RAND()*1000)));
select 查询的序列号,包含一组数字,表示查询中执行 select 子句或操作表的顺序;
有三种情况:
select * from t1,t2,t3;
explain select t1.id from t1 where t1.id = (select t2.id from t2 where t2.id = (select t3.id from t3 where t3.content='t3_897'));
value | meaning |
---|---|
SIMPLE | 简单的 select 查询,查询中不包含子查询或者 union |
PRIMARY | 查询中若包含任何复杂的子部分,最外层查询则被标记为 primary |
SUBQUERY | 在 select 或 where 列表中包含了子查询 |
DEPENDENT SUBQUERY | 在 select 或 where 列表中包含了子查询,子查询基于外层 |
UNCACHEABLE SUBQUREY | 表示这个 subquery 的查询要受到外部系统变量的影响 |
UNION | 若第二个 select 出现在 union 之后,则被标记为 union; 若 union 包含在 from 子句的子查询中,外层 select 将被标记为:DERIVED |
UNION RESULT | 从 union 表获取结果的 select |
type 显示的是访问类型,是较为重要的一个指标,结果值从最好到最坏依次是:
我们着重看下面几个级别:
一般来说,得保证查询至少达到 range 级别,最好能达到 ref。
const:表示通过索引一次就找到了,const 用于 primary key 或者 unique 索引。
因为只匹配一行数据,所以很快 如将主键置于 where 列表中,MySQL 就能将该查询转换为一个常量
range:只检索给定范围的行,使用一个索引来选择行。
key 列显示使用了哪个索引 一般就是在你的where语句中出现了between、<、>、in等的查询 这种范围索引扫描比全表扫描要好,因为它只需要开始于索引的某一点,而结束语另一点,不用扫描全部索引。
index:出现 index 是 sql 使用了索引但是没用通过索引进行过滤,一般是使用了覆盖索引或者是利用索引进行了排序分组
Full Index Scan,index 与 all 区别为 index 类型只遍历索引树。
okey_len 表示索引使用的字节数,根据这个值可以判断索引的使用情况,特别是在组合索引的时候,判断该索引有多少部分被使用到非常重要。值越大越好。
key_len 的计算方式:
显示将哪些列或常量与键列中命名的索引进行比较,以从表中选择行。
优化后(给 deptno 和 ename 字段建立复合索引),去掉 filesort:
优化前存在 using temporary 和 using filesort
优化后(给 deptno 和 ename 建立复合索引)去掉 using temporary 和 using filesort,性能发生明显变化:
使用了临时表保存中间结果,MySQL在对查询结果排序时使用临时表。常见于排序order by 和分组查询group by。
如果同时出现using where,表明索引被用来执行索引键值的查找;
如果没有同时出现using where,表明索引用来读取数据而非执行查找动作。
Using where:表示使用了 where 过滤
using join buffer:如果有它则表明关联字段没有使用索引,使用了连接缓存