• Mysql 45讲学习笔记(十一)字符串字段怎么加索引


    一.前缀索引

    • MySQL支持前缀索引,可以定义字符串的一部分做索引
    • 创建索引的语句不指定前缀长度,那么索引就会包含整个字符串

    二.使用多长前缀

    使用前缀索引,定义好长度,可以做到节省空间不额外增加太多的查询成本。

    • 在建立索引时关注的区分度,区分度越高越好
    • 区分度越高,意味着重复的键值越少
    • 我们可以统计索引上有多少个不同的值 来判断要使用多少长的前缀

    例子:统计不同字段的不同长度下的区分度

    1. select
    2. count(distinct left(email,4))as L4,
    3. count(distinct left(email,5))as L5,
    4. count(distinct left(email,6))as L6,
    5. count(distinct left(email,7))as L7,
    6. from SUser;

    三.前缀索引对覆盖索引的影响

    • 如果是全量字符串的话,支持索引覆盖的话就不会回表。
    • 如果只是一部分字符串的话,系统还是要根据id索引回表看一下,因为系统不确定前缀索引定义是否截断了完整信息。

    索引越长,占用的磁盘空间越大,相同数据页能放下的索引值越小,搜索效率越低。

    四.身份证场景(字段前面想同后面区分度高)

    • 使用倒叙存储,如果存储身份证号的时候把他们倒过来   
    • 使用 hash 字段

    使用倒叙存储使用hash字段两种方式的异同点

    相同点

    • 都不支持范围查询

    不同点

    • 占用的额外空间来看,倒叙存储方式在主键索引,不会消耗额外的存储空间
    • hash字段方法需要增加一个字段

    CPU消耗方面:

    • 倒叙方式需要额外调用一次reverse函数
    • hash字段需要额外调用一次哈希函数,reverse 函数额外消耗的 CPU 资源会更小些

    查询效率:

    • hash 字段方式的查询性能相对更稳定一些。因为 crc32 算出来的值虽然有冲突的概率,但是概率非常小
    • 倒序存储方式毕竟还是用的前缀索引的方式,也就是说还是会增加扫描行数

  • 相关阅读:
    Spring Boot 整合JPA
    SpringBoot集成文件 - 如何基于POI-tl和word模板导出庞大的Word文件?
    session和cookie和token
    MySQL理论基础篇
    安卓多渠道打包(五)360加固walle多渠道打包
    学习R语言第六天
    java图(含java图的代码)
    蚱蜢优化算法(Matlab代码实现)
    HTML文本溢出处理
    el-tabs(标签栏)的入门学习
  • 原文地址:https://blog.csdn.net/weixin_42369687/article/details/125463395