• 【中间件】Redis监控以及指标


    一、监控指标

    1.1、性能指标:Performance

    Name

    Description

    latency

    Redis响应一个请求的时间

    instantaneous_ops_per_sec

    平均每秒处理请求总数

    hi rate(calculated)

    缓存命中率(计算出来的

    1.2、内存指标: Memory

    Name

    Description

    used_memory

    已使用内存

    mem_fragmentation_ratio

    内存碎片率

    evicted_keys

    由于最大内存限制被移除的key的数量

    blocked_clients

    由于BLPOP,BRPOP,or BRPOPLPUSH而备阻塞的客户端

    1.3、基本活动指标:Basic activity

    Name

    Description

    connected_clients

    客户端连接数

    conected_laves

    slave数量

    master_last_io_seconds_ago

    最近一次主从交互之后的秒数

    keyspace

    数据库中的key值总数

    1.4、持久性指标: Persistence

    Name

    Description

    rdb_last_save_time

    最后一次持久化保存磁盘的时间戳

    rdb_changes_sice_last_save

    自最后一次持久化以来数据库的更改数

    1.5、错误指标:Error

    Name

    Description

    rejected_connections

    由于达到maxclient限制而被拒绝的连接数

    keyspace_misses

    key值查找失败(没有命中)次数

    master_link_down_since_seconds

    主从断开的持续时间(以秒为单位)

    二、监控方式 

    2.1、redis-benchmark

    2.2、redis-stat

    2.3、redis-faina

    2.4、redislive

    2.5、redis-cl

    2.6、monitor

    2.7、showlog

    三、具体监控实例

    3.1、redis性能测试命令

    命令:redis-benchmark

    ./redis-benchmark -c 100 -n 5000

    说明:100个连接,5000次请求对应的性能

    3.2、性能监控

    命令:redis-cli info | grep ops # 每秒操作数

    3.3、内存监控

    命令 :redis-cli info | grep used | grep human   


    used_memory_human:90.51M  # 内存分配器从操作系统分配的内存总量
    used_memory_rss_human:240.89M  #操作系统看到的内存占用,top命令看到的内存
    used_memory_peak_human:8.59GM # redis内存消耗的峰值
    used_memory_lua_human:37.00K   # lua脚本引擎占用的内存大小

     3.4、由于BLPOP,BRPOP,or BRPOPLPUSH而备阻塞的客户端

    命令:./redis-cli -h 9.1.33.205 -a madp@redis info|grep blocked_clients

    3.5、由于最大内存限制被移除的key的数量

    命令:./redis-cli -h 9.1.33.205 -a madp@redis info|grep evicted_keys

      

     3.6、内存碎片率

    ./redis-cli -h 9.1.33.205 -a madp@redis info|grep mem_fragmentation_ratio

    3.7、已使用内存

    ./redis-cli -h 9.1.33.205 -a madp@redis info|grep used_memory

     

    3.8、基本活动指标

            redis连接了多少客户端 通过观察其数量可以确认是否存在意料之外的连接。如果发现数量不对劲,就可以使用lcient list指令列出所有的客户端链接地址来确定源头。 

    命令: ./redis-cli info | grep connected_clients

    connected_clients:1

    [root@CombCloud-2020110836 src]# ./redis-cli info | grep connected
    connected_clients:1   # 客户端连接数量
    connected_slaves:1   # slave连接数量

    3.9、持久性指标

    命令: ./redis-cli info | grep rdb_last_save_time

    rdb_last_save_time:1591876204  # 最后一次持久化保存磁盘的时间戳
    [root@CombCloud-2020110836 src]# ./redis-cli info | grep rdb_changes_since_last_save
    rdb_changes_since_last_save:0   # 自最后一次持久化以来数据库的更改数

    3.10、错误指标

            由于超出最大连接数限制而被拒绝的客户端连接次数,如果这个数字很大,则意味着服务器的最大连接数设置得过低,需要调整maxclients 

    命令: ./redis-cli info | grep connected_clients

    [root@CombCloud-2020110836 src]# ./redis-cli info | grep connected_clients
    connected_clients:1

     3.11、key值查找失败(没有命中)次数,出现多次可能是被攻击

    命令:./redis-cli info | grep keyspace

    [root@CombCloud-2020110836 src]# ./redis-cli info | grep keyspace
    keyspace_misses:0  

    3.12、主从断开的持续时间(以秒为单位)

    命令:./redis-cli info | grep rdb_changes_since_last_save

    [root@CombCloud-2020110836 src]# ./redis-cli info | grep rdb_changes_since_last_save
    rdb_changes_since_last_save:0  

    3.13、复制积压缓冲区如果设置得太小,会导致里面的指令被覆盖掉找不到偏移量,从而触发全量同步

    命令: ./redis-cli info | grep backlog_size

    [root@CombCloud-2020110836 src]# ./redis-cli info | grep backlog_size
    repl_backlog_size:1048576

     3.14、 通过查看sync_partial_err变量的次数来决定是否需要扩大积压缓冲区,它表示主从半同步复制失败的次数

    命令:./redis-cli info | grep sync_partial_err

    [root@CombCloud-2020110836 src]# ./redis-cli info | grep sync_partial_err
    sync_partial_err:1

    四、相关参数配置和说明

    4.1、慢日志相关的

            4.1.1、  get:获取慢查询日志

           4.1.2、 len:获取慢查询日志条目数

           4.13、 reset:重置慢查询日志

            slowlog-log-slower-than 1000 # 设置慢查询的时间下线,单位:微秒
            slowlog-max-len 100 # 设置慢查询命令对应的日志显示长度,单位:命令数

    4.2、终端info命令使用

            info(可以一次性获取所有的信息,也可以按块获取信息)

            ./redis-cli info 按块获取信息 | grep 需要过滤的参数
            ./redis-cli info stats | grep ops

            4.2.1、server:服务器运行的环境参数

            4.2.2、clients:客户端相关信息

            4.2.3、memory:服务器运行内存统计数据

            4.2.4、persistence:持久化信息

            4.2.5、stats:通用统计数据

            4.2.6、Replication:主从复制相关信息

            4.2.7、CPU:CPU使用情况

             4.2.8、cluster:集群信息

             4.2.9、Keypass:键值对统计数量信息

     

     

  • 相关阅读:
    行列视(RCV)能解决哪些问题?
    变量、运算符、表达式、输入与输出
    Tomcat--Linux下如何配置2个或多个同时运行
    【小收获】一维字符数组 与 二维字符数组
    对接专有钉钉(浙政钉)登陆步骤
    SpringBoot启动时加载
    怎么找到贵人?
    04.9. 环境和分布偏移
    linux centos、Anolis安装中文字符集zh_CN.utf8
    Spring DI 简单案例
  • 原文地址:https://blog.csdn.net/m0_49428126/article/details/127503025