一.前缀索引
- MySQL支持前缀索引,可以定义字符串的一部分做索引
- 创建索引的语句不指定前缀长度,那么索引就会包含整个字符串
二.使用多长前缀
使用前缀索引,定义好长度,可以做到节省空间,不额外增加太多的查询成本。
- 在建立索引时关注的区分度,区分度越高越好
- 区分度越高,意味着重复的键值越少
- 我们可以统计索引上有多少个不同的值 来判断要使用多少长的前缀
例子:统计不同字段的不同长度下的区分度
count(distinct left(email,4))as L4,
count(distinct left(email,5))as L5,
count(distinct left(email,6))as L6,
count(distinct left(email,7))as L7,
三.前缀索引对覆盖索引的影响
- 如果是全量字符串的话,支持索引覆盖的话就不会回表。
- 如果只是一部分字符串的话,系统还是要根据id索引回表看一下,因为系统不确定前缀索引定义是否截断了完整信息。
索引越长,占用的磁盘空间越大,相同数据页能放下的索引值越小,搜索效率越低。
四.身份证场景(字段前面想同后面区分度高)
- 使用倒叙存储,如果存储身份证号的时候把他们倒过来
- 使用 hash 字段
使用倒叙存储和使用hash字段两种方式的异同点
相同点
不同点
- 占用的额外空间来看,倒叙存储方式在主键索引,不会消耗额外的存储空间
- hash字段方法需要增加一个字段
CPU消耗方面:
- 倒叙方式需要额外调用一次reverse函数
- hash字段需要额外调用一次哈希函数,reverse 函数额外消耗的 CPU 资源会更小些
查询效率:
- hash 字段方式的查询性能相对更稳定一些。因为 crc32 算出来的值虽然有冲突的概率,但是概率非常小
- 倒序存储方式毕竟还是用的前缀索引的方式,也就是说还是会增加扫描行数