mysql索引

mysql索引

目录

一、索引介绍

二、索引的优缺点

三、索引结构

3.1B+tree索引结构

3.2为什么innodb存储引擎选择使用B+tree索引结构

四、索引的分类

4.1聚集索引的选取规则

五、索引的语法

5.1创建索引

5.2查看索引

5.3删除索引

六、sql性能分析

6.1sql执行频率

6.2慢查询日志

6.3profile详情

6.4explain执行计划

七、索引使用

八、sql提示

九、覆盖索引

十、前缀索引

十一、索引设计原则

一、索引介绍

索引是帮助mysql高效获取数据的数据结构（有序）。在数据之外，数据库系统还维护着满足特定查找算法的数据结构，这些数据结构以某种方式引用（指向）数据，这样就可以在这些数据结构上实现高级查找算法，这种数据结构就是索引。

二、索引的优缺点

优点：提高数据检索的效率，降低数据库的io成本，通过索引列队数据进行排序，降低数据排序的成本，降低CPU的消耗；
缺点：索引列也是要占用空间的，索引大大提高了查询效率，同时却也降低更新表的速度，如对表进行insert、update、delete时，效率低。

三、索引结构

mysql的索引是在存储引擎层实现的，不同的存储引擎有不同的结构，主要包含以下几种
索引结构；
B+tree索引最常见的索引类型，大部分引擎都支持B+树索引；
hash索引底层数据结构是用哈希表实现的，只有精确匹配索引列的查询才有效，不支持范围查询；
R-tree(空间索引)：空间索引是myisam引擎的一个特殊索引类型，主要用于地理空间数据类型，通常使用较少；
Full-text（全文索引）：是一种通过建立倒排索引，快速匹配文档的方式。类似于lucence，solr，es。

3.1B+tree索引结构

mysql索引数据结构对经典的B+tree进行了优化，在原B+tree的基础上，增加了指向相邻叶子节点的链表指针，就形成了带有顺序的指针的B+tree提高了区间访问的性能。

3.2为什么innodb存储引擎选择使用B+tree索引结构

   相对于二叉树，层级更少，搜素效率高；
   对于B Tree，无论是叶子节点还是非叶子节点，都会保存数据，这样导致一页中的存储的键值减少，指针跟着减少，要同样保存大量数据，只能增加树的高度，导致性能降低；
   相对于hash索引，B+tree支持范围匹配及排序操作。

四、索引的分类

   主键索引：针对表中的主键创建的索引，默认自动创建，只能有一个；
   唯一索引：避免同一个表中的数据重复，可以有多个；
   常规索引：快速定位数据可以有多个；
   全文索引：全文索引查找的是文本中的关键词，而不是比较索引中的值。可以有多个。

在存储引擎中，根据索引的存储形式，又可以分为以下两种：

   聚集索引：将数据存储与索引放到一起，索引结构的叶子节点保存了行数据。必须有，而且只有一个；
   二级索引：将数据与索引分开存储，索引结构的叶子节点关联的是对应的主键。可以存在多个。

4.1聚集索引的选取规则

   如果存在主键，主键索引就是聚集索引；
   如果不存在主键，将使用第一个唯一（unique）索引作为聚集索引；
   如果表没有主键，或没有合适的唯一索引，则innodb会自动生成一个rowid作为隐藏的聚集索引。

五、索引的语法

5.1创建索引

create [unique][fulltext]index index_name on table_name (字段1,字段2.....)

5.2查看索引

show index from table_name;

5.3删除索引

drop index index_name on table_name;

六、sql性能分析

6.1sql执行频率

mysql客户端连接成功后，通过show[session][global]status命令可以提供服务器状态信息。通过如下指令，可以查看当前数据库的insert、update、delete、select的访问频次；
show global status like 'Com_______'; (7个下划线) 。

6.2慢查询日志

慢查询日志记录了所有执行时间超过指定参数（long_query_time,单位：秒，默认10秒）的所有sql语句的日志。

MySQL的慢查询日志是否开启 show varialbes like 'slow_query_log' ；

mysql的慢查询日志默认是没有开启的，需要在mysql的配置文件在/etc/my.cnf中添加如下配置：
#开启mysql慢日志查询开关
slow_query_log=1
#设置慢日志的时间为2s，sql语句执行时间超高2s，就会视为慢查询，记录慢查询日志。
long_query_time=2
配置完毕后，重启mysql服务器进行测试，查看慢日志文件中记录的信息。

慢日志文件（在mysql的数据文件目录下）

/var/lib/mysql/localhost-slow.log

6.3profile详情

show profile能够在做sql优化时帮助我们了解时间都耗费到哪里去了。通过have_profiling参数，能够看到当前mysql是否支持profile操作。
select @@have_profiling;

默认profiling是关闭的，可以通过set语句在session/g'lobal级别开启profiling。
set profiling=1;

执行一系列的业务sql的操作，然后通过如下指令查看指令的执行耗时：

查看每一条sql的耗时基本情况：
show profiles;

查看指定的query_id的SQL语句各个阶段的耗时情况：
show profile for query query_id;

查看指定query_id的sql语句，CPU的使用情况：
show profile cpu for query query_id;

6.4explain执行计划

explain或者desc命令获取mysql如何执行select语句信息，包括在select语句执行过程中表如何连接和连接顺序；
语法
直接在select语句之前加上关键字explain/desc
explain select 字段列表 from 表名 where 条件;

explain执行计划各个字段含义
id
select查询的序列号，表示查询中select子句或者是操作表的顺序(id相同，执行顺序从上到下，id不同，值越大，越先执行);

select_type
表示select的类型，常见的取值有simple（简单表，即不使用表连接或者子查询）、primary（主查询，即外层查询）、union(union中的第二个或者后面的查询语句)、subquery（select/where之后包含了子查询）等

type
表示连接类型，性能由好到差的连接类型为NULL、system、const、eq_ref、ref、range、index、all

possible_key
显示可能应用在这张表上的索引，一个或者多个;

key
实际使用的索引，如果为null，则没有使用索引;

key_len
表示索引中使用的字节数，该值为索引字段最大可能长度，并非实际使用长度，在不损失精确性的前提下，长度越短越好;

rows
mysql认为必须要执行查询的行数，在innodb引擎的表中，是一个估计值，可能并不总是准确的;

filtered
表示返回结果的行数占需读取行数的百分比，filtered的值越大越好。

七、索引使用

最左前缀法则
如果索引了多列（联合索引），要遵循最左前缀法则，最左前缀法则指的是查询从索引的最左列开始，并且不跳过索引中的列，如果跳跃某一列，索引将部分失效（后面的字段索引失效）；

范围查询
联合索引中，出现范围查询（>,<）,范围查询右侧的列索引失效；

索引列运算
不要在索引列上进行运算操作，索引将会失效；

模糊查询
如果仅仅是尾部模糊匹配，索引不会失效，如果是头部模糊匹配，索引失效；

or连接的条件
用or分割开的条件，如果or前的条件中的列有索引，而后面的列没有索引，那么涉及的索引，都不会被用到；

数据分布影响
如果mysql评估使用索引比全表扫描更慢，则不使用索引。

八、sql提示

sql提示，是优化数据库的一个重要手段，简单来说，就是在sql语句中加入一些人为的提示来达到优化的目的。
use index建议使用哪个索引
ignore index 忽略哪个索引
force index强制用哪个索引

九、覆盖索引

尽量使用覆盖索引（查询使用了索引，并且需要返回的列，在该索引中已经全部能够找到），减少select*。

十、前缀索引

        当字段类型为字符串（varchar，text等）时，有时候需要很长的字符串，这会让索引变的很大，查询时，浪费大量的磁盘io，影响查询效率。
        此时可以将字符串的一部分前缀，建立索引，这样可以大大节约索引空间，从而提升索引的效率。

语法
create index index_name on table_name(column(n))；

前缀长度
可以根据索引的选择性来决定，而选择性是指不重复的索引值（基数）和数据表的记录总数比值，索引选择性越高，查询效率越高。
唯一索引的选择性1，这是最好的索引选择性，性能也是最好的。

十一、索引设计原则

1、针对数据量大且查询比较频繁的表建立索引；
2、针对常作为查询条件（where）、排序（order by）、分组（group by）操作的字段建立索引；
3、尽量选择区分度高的列作为索引，尽量建立唯一索引，区分度越高，使用索引的效率越高；
4、如果字符串类型的字段，字段的长度较长，可以针对字段的特点建立前缀索引；
5、尽量使用联合索引，减少单列索引，查询时，联合索引很多时候可以覆盖索引，节省存储空间，避免回表，提高查询效率；
6、要控制索引的数量，索引并不是多多益善，索引越多，维护索引结构的代价也就越大，会影响增删改的效率；
7、如果索引列不能存储null值，请在创建表时，使用not null约束它。当优化器知道每列是否包含null值时，它可以更好地确定哪个索引最有效的用于查询。

        难，才有意思，just do it！

        自由的前提是自律，自律的顶端是享受，愿你以渺小启程，以伟大结局；

        希望我们都能成为自由又自律的人。
相关阅读:
文件编码、转换、乱码问题
 DATA AI Summit 2022提及到的对 aggregate 的优化
 架构篇（八）架构师的职责和能力模型
 [附源码]计算机毕业设计JAVA小超市进销存管理系统
 Kafka 就这么点东西，不难，直接拿走
 Mybatis主键自动生成
 Apollo 应用与源码分析：CyberRT-组件（component）
阿里云的ACP认证与ACE认证含金量高吗？
Notepad ++ 零基础入门到精通安装与配置教程（非常详细）
网卡限速工具之WonderShaper
原文地址：https://blog.csdn.net/yin_jia_jun/article/details/133943612

一、索引介绍

二、索引的优缺点

三、索引结构

3.1B+tree索引结构

3.2为什么innodb存储引擎选择使用B+tree索引结构

四、索引的分类

4.1聚集索引的选取规则

五、索引的语法

5.1创建索引

5.2查看索引

5.3删除索引

六、sql性能分析

6.1sql执行频率

6.2慢查询日志

6.3profile详情

6.4explain执行计划

七、索引使用

八、sql提示

九、覆盖索引

十、前缀索引

十一、索引设计原则