先简单介绍一下基础部分
说明:以空间换取时间 维护索引结构
primary key
表数据主键,自动创建索引
说明:主键必不可少
unique key
索引列数据必须保证唯一,允许为空
说明:不建议为空,可指定为空字符。因为考虑索引的空间占用:允许为null时,需要额外一个字节保留是否为空。
多个列组成一个索引
文本类型,允许指定索引列的长度
fulltext key
用于搜索很长一篇文章的时候,效果最好。用在比较短的文本,如果就一两行字的,普通的INDEX 也可以。
用法:MATCH(xxx) AGAINST(xxx)
spatial key
5.7以后支持空间索引,支持OpenGIS几何数据模型
说明:
单索引长度限制:5.6里面默认不能超过767bytes,5.7不超过3072bytes
5.6可以调整配置,放开767长度限制,但是最多也不能超过3072
一般前三种用的比较多,后面三种使用比较少。
使用key-value键值对方式存储数据。key存储列数据,value存储存储记录或者磁盘地址,点查命中数据
说明:存在hash冲突,命中地址后,循环链表查询数据
优点:不考虑hash冲突情况下,时间复杂度为O(1)
缺点:
不支持范围查询,需要全表扫描完成集合搜索
hash冲突之后,时间复杂度变成了O(n)
每个节点最多两个分支节点且左小右大。使用二分算法查找,减少IO
优点:理想情况二分查找,减少IO
缺点:
子树之间高度差不能超过1,通过左旋,右旋保证树平衡
优点:结构稳定
缺点:
子树之间高度差不能超过2倍,通过左旋,右旋,节点变色保证树平衡
优点:读写性能接近平衡
缺点:
所有叶子节点都在同一层的平衡多叉树
优点:
不足:mysql数据块使用率还不够高
b树的改进版,非叶子节点不存储数据
优点:
a.叶子节点存储数据,充分使用了数据块
b.减少了IO查询,只需要查询叶子节点的数据
算法延时动态演示:https://www.cs.usfca.edu/~galles/visualization/Algorithms.html
特点:
特点:
数据点查:等值查询最快
最左匹配原则:组合索引的使用
索引列不做计算:计算索引失效
覆盖索引:非聚簇索引直接返回数据,说明:回表
null值判断:非空字段做空判断
or导致的索引失效:索引列与非索引列查询导致索引失效
字段类型不匹配:字符类型未做匹配
索引下推:5.6以后新增
group by:临时表、文件排序
注:三范式按实际情况来,不一定要全部满足,比如有时候适当冗余字段比连表查询效果更好。
注:第三条还是得按实际情况来,有时候加上确实比不加要快。
cache缓存块、数据集过滤都依赖内存
数据删除会造成不连续的空白空间
SQL执行计划,优化SQL
查询SQL执行情况
查看执行耗时
传送门
/1093229)