• 【Redis】hash类型-内部编码&使用场景


    内部编码

    哈希的内部编码有两种:

    • ziplist(压缩列表):当哈希类型元素个数⼩于hash-max-ziplist-entries配置(默认512个)、同时所有值都⼩于hash-max-ziplist-value配置(默认64字节)时,Redis会使⽤ziplist作为哈希的内部实现,ziplist使⽤更加紧凑的结构实现多个元素的连续存储,所以在节省内存⽅⾯⽐hashtable更加优秀
    • hashtable(哈希表):当哈希类型⽆法满⾜ziplist的条件时,Redis会使⽤hashtable作为哈希的内部实现,因为此时ziplist的读写效率会下降,⽽hashtable的读写时间复杂度为O(1)

    测试内部编码:

    1)当field个数⽐较少且没有⼤的value时,内部编码为ziplist:

    image-20231021165931816

    2)当有value⼤于64字节时,内部编码会转换为hashtable:

    image-20231021170207558

    3)当field个数超过512时,内部编码也会转换为hashtable:


    使用场景

    关系型数据表记录的两条⽤⼾信息,⽤⼾的属性表现为表的列,每条⽤⼾信息表现为⾏。如果映射关系表⽰这两个⽤⼾信息

    使用关系型数据库表示用户的信息

    image-20231021172740831

    若使用关系表映射用户的信息

    image-20231021172801924

    相⽐于使⽤JSON格式的字符串缓存⽤⼾信息,哈希类型变得更加直观,并且在更新操作上变得更灵活。可以将每个⽤⼾的id定义为键后缀,多对field-value对应⽤⼾的各个属性,类似如下伪代码

    UserInfo getUserInfo(long uid) {
        // 根据 uid 得到 Redis 的键
        String key = "user:" + uid;
        // 尝试从 Redis 中获取对应的值
        userInfoMap = Redis 执⾏命令:hgetall key;
        // 如果缓存命中(hit)
        if (value != null) {
            // 将映射关系还原为对象形式
            UserInfo userInfo = 利⽤映射关系构建对象(userInfoMap);
            return userInfo;
        }
        // 如果缓存未命中(miss)
        // 从数据库中,根据 uid 获取⽤⼾信息
        UserInfo userInfo = MySQL 执⾏ SQL:select * from user_info where uid = <uid>
            // 如果表中没有 uid 对应的⽤⼾信息
            if (userInfo == null) {
                响应 404
                return null;
            }
        // 将缓存以哈希类型保存
        Redis 执⾏命令:hmset key name userInfo.name age userInfo.age city userInfo.c
            // 写⼊缓存,为了防⽌数据腐烂(rot),设置过期时间为 1 ⼩时(3600 秒)
            Redis 执⾏命令:expire key 3600
            // 返回⽤⼾信息
            return userInfo;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26

    需要注意的是哈希类型和关系型数据库有两点不同之处:

    • 哈希类型是稀疏的,⽽关系型数据库是完全结构化的,例如哈希类型每个键可以有不同的field,⽽关系型数据库⼀旦添加新的列,所有⾏都要为其设置值,即使为null
    • 关系数据库可以做复杂的关系查询,⽽Redis去模拟关系型复杂查询,例如联表查询、聚合查询等基本不可能,维护成本⾼

    关系型数据库稀疏性

    image-20231021173017301


    缓存方式对比

    ⽬前为⽌,我们已经能够⽤三种⽅法缓存⽤⼾信息(原生字符串类型,序列化字符串类型,哈希类型),下⾯给出三种⽅案的实现⽅法和优缺点分析

    • 原⽣字符串类型⸺使⽤字符串类型,每个属性⼀个键
    set user:1:name James
    set user:1:age 23
    set user:1:city Beijing
    
    • 1
    • 2
    • 3

    优点:实现简单,针对个别属性变更也很灵活。

    缺点:占⽤过多的键,内存占⽤量较⼤,同时⽤⼾信息在Redis中⽐较分散,缺少内聚性,所以这种⽅案基本没有实⽤性。

    • 序列化字符串类型,例如JSON格式
    set user:1 经过序列化后的⽤⼾对象字符串
    
    • 1

    优点:针对总是以整体作为操作的信息⽐较合适,编程也简单。同时,如果序列化⽅案选择合适,内存的使⽤效率很⾼

    缺点:本⾝序列化和反序列需要⼀定开销,同时如果总是操作个别属性则⾮常不灵活

    • 哈希类型
    hmset user:1 name James age 23 city Beijing 
    
    • 1

    优点:简单、直观、灵活。尤其是针对信息的局部变更或者获取操作。

    缺点:需要控制哈希在ziplisthashtable两种内部编码的转换,可能会造成内存的较⼤消耗


  • 相关阅读:
    MySQL大杂烩
    自动微分原理
    python工作中、使用中必须会的使用方法
    游戏服务端配置“热更”及“秒启动”终极方案(golang/ygluu/卢益贵)
    windows 安装 Android Studio
    【数据结构】【版本2.0】【树形深渊】——二叉树入侵
    2.1.1BFS中的Flood Fill和最短路模型
    Ubuntu 实现shell文件的开机运行
    Linux下git维护
    小白学爬虫:通过商品ID或商品链接封装接口获取淘宝商品销量数据接口|淘宝商品销量接口|淘宝月销量接口|淘宝总销量接口
  • 原文地址:https://blog.csdn.net/chuxinchangcun/article/details/134211115