• Zookeeper特性与节点数据类型详解


    1、Zookeeper介绍

      ZooKeeper 是一个开源的分布式协调框架,是Apache Hadoop 的一个子项目,主要用来解决分布式集群中应用系统的一致性问题。Zookeeper 的设计目标是将那些复杂且容易出错的分布式一致性服务封装起来,构成一个高效可靠的原语集,并以一系列简单易用的接口提供给用户使用。
    官方:https://zookeeper.apache.org/
    在这里插入图片描述
      ZooKeeper本质上是一个分布式的小文件存储系统(Zookeeper=文件系统+监听机制)。提供基于类似于文件系统的目录树方式的数据存储,并且可以对树中的节点进行有效管理,从而用来维护和监控存储的数据的状态变化。通过监控这些数据状态的变化,从而可以达到基于数据的集群管理、统一命名服务、分布式配置管理、分布式消息队列、分布式锁、分布式协调等功能。
      Zookeeper从设计模式角度来理解:是一个基于观察者模式设计的分布式服务管理框架,它负责存储和管理大家都关心的数据,然后接受观察者的注册,一旦这些数据的状态发生变化,Zookeeper 就将负责通知已经在Zookeeper上注册的那些观察者做出相应的反应。
    在这里插入图片描述

    2、 Zookeeper快速开始

    2.1、 Zookeeper安装

    下载地址:https://zookeeper.apache.org/releases.html
    运行环境:jdk8
    在这里插入图片描述
    1)修改配置文件
    解压安装包后进入conf目录,复制zoo_sample.cfg,修改为zoo.cfg

     cp zoo_sample.cfg  zoo.cfg 
    
    • 1

    修改 zoo.cfg 配置文件,将 dataDir=/tmp/zookeeper 修改为指定的data目录
    在这里插入图片描述
    2)启动zookeeper server

    # 可以通过 bin/zkServer.sh  来查看都支持哪些参数 
    # 默认加载配置路径conf/zoo.cfg
    bin/zkServer.sh start
    bin/zkServer.sh start conf/my_zoo.cfg
    
    # 查看zookeeper状态
    bin/zkServer.sh status
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7

    3)启动zookeeper client连接Zookeeper server

    bin/zkCli.sh
    # 连接远程的zookeeper server
    bin/zkCli.sh -server ip:port
    
    • 1
    • 2
    • 3

    2.2、 客户端命令行操作

    在这里插入图片描述
    常见cli命令
    https://zookeeper.apache.org/doc/r3.8.0/zookeeperCLI.html

    命令基本语法功能描述
    help显示所有操作命令
    ls [-s] [-w] [-R] path使用 ls 命令来查看当前 znode 的子节点 [可监听]
    -w: 监听子节点变化
    -s: 节点状态信息(时间戳、版本号、数据大小等)
    -R: 表示递归的获取
    create [-s] [-e] [-c] [-t ttl] path [data] [acl]创建节点
    -s : 创建有序节点。
    -e : 创建临时节点。
    -c : 创建一个容器节点。
    t ttl] : 创建一个TTL节点, -t 时间(单位毫秒)。
    data:节点的数据,可选,如果不使用时,节点数据就为null。
    acl:访问控制
    get [-s] [-w] path获取节点数据信息
    -s: 节点状态信息(时间戳、版本号、数据大小等)
    -w: 监听节点变化
    set [-s] [-v version] path data设置节点数据
    -s:表示节点为顺序节点
    -v: 指定版本号
    getAcl [-s] path获取节点的访问控制信息
    -s: 节点状态信息(时间戳、版本号、数据大小等)
    setAcl [-s] [-v version] [-R] path acl设置节点的访问控制列表
    -s:节点状态信息(时间戳、版本号、数据大小等)
    -v:指定版本号
    -R:递归的设置
    stat [-w] path查看节点状态信息
    delete [-v version] path删除某一节点,只能删除无子节点的节点。
    -v: 表示节点版本号
    deleteall path递归的删除某一节点及其子节点
    setquota -n-b val path

    2.3、 GUI工具

    3、ZooKeeper数据结构

      Zookeeper 数据模型的结构与 Unix 文件系统很类似,整体上可以看作是一棵树,每个节点称做一个 ZNode。
    在这里插入图片描述
    ZooKeeper的数据模型是层次模型,层次模型常见于文件系统。层次模型和key-value模型是两种主流的数据模型。ZooKeeper使用文件系统模型主要基于以下两点考虑:

    • 文件系统的树形结构便于表达数据之间的层次关系
    • 文件系统的树形结构便于为不同的应用分配独立的命名空间( namespace )

    ZooKeeper的层次模型称作Data Tree,Data Tree的每个节点叫作Znode。不同于文件系统,每个节点都可以保存数据,每一个 ZNode 默认能够存储 1MB 的数据,每个 ZNode 都可以通过其路径唯一标识,每个节点都有一个版本(version),版本从0开始计数。

    public class DataTree {
        private final ConcurrentHashMap<String, DataNode> nodes =
            new ConcurrentHashMap<String, DataNode>();
            
            
        private final WatchManager dataWatches = new WatchManager();
        private final WatchManager childWatches = new WatchManager();
        
    }
    
    public class DataNode implements Record {
        byte data[];
        Long acl;
        public StatPersisted stat;
        private Set<String> children = null;
     }  
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16

    3.1、 节点分类

    zookeeper存在几种不同的节点类型,他们具有不同的生命周期:

    类型生命周期创建示例
    持久节点 (persistent node)一直存在,一直存储在ZooKeeper 服务器上,即使创建该节点的客户端与服务端的会话关闭了,该节点依然不会被删除create /locks
    临时节点 (ephemeral node)当创建该临时节点的客户端会话因超时或发生异常而关闭时,该节点也相应在 ZooKeeper 服务器上被删除。create -e /locks/DBLock
    有序节点 (sequential node)并不算是一种单独种类的节点,而是在之前提到的持久节点和临时节点特性的基础上,增加了一个节点有序的性质。在我们创建有序节点的时候会自动使用一个单调递增的数字作为后缀create -e -s /jobs/job
    (临时有序节点)
    容器节点 (container node)当一个容器节点的最后一个子节点被删除后,容器节点也会被删除create -c /work
    TTL节点 (ttl node)当一个TTL节点在 TTL 内没有被修改并且没有子节点,会被删除。注意:默认此功能不开启,需要修改配置文件extendedTypesEnabled=truecreate -t 3000 /ttl_node

    一个znode可以使持久性的,也可以是临时性的:
      1.持久节点(PERSISTENT): 这样的znode在创建之后即使发生ZooKeeper集群宕机或者client宕机也不会丢失。
      2.临时节点(EPHEMERAL ): client宕机或者client在指定的timeout时间内没有给ZooKeeper集群发消息,这样的znode就会消失。

    如果上面两种znode具备顺序性,又有以下两种znode :
      3. 持久顺序节点(PERSISTENT_SEQUENTIAL): znode除了具备持久性znode的特点之外,znode的名字具备顺序性。
      4.临时顺序节点(EPHEMERAL_SEQUENTIAL): znode除了具备临时性znode的特点之外,zorde的名字具备顺序性。
    zookeeper主要用到的是以上4种节点。

      5.Container节点 (3.5.3版本新增):Container容器节点,当容器中没有任何子节点,该容器节点会被zk定期删除(定时任务默认60s 检查一次)。 和持久节点的区别是 ZK 服务端启动后,会有一个单独的线程去扫描,所有的容器节点,当发现容器节点的子节点数量为 0 时,会自动删除该节点。可以用于 leader 或者锁的场景中。
    在这里插入图片描述
      6. TTL节点: 带过期时间节点,默认禁用,需要在zoo.cfg中添加 extendedTypesEnabled=true 开启。 注意:TTL不能用于临时节点

    #创建持久节点
    create /servers  xxx
    #创建临时节点
    create -e /servers/host  xxx
    #创建临时有序节点
    create -e -s /servers/host  xxx
    #创建容器节点
    create -c /container xxx
    # 创建ttl节点
    create -t 10 /ttl
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10

    示例:实现分布式锁
    分布式锁要求如果锁的持有者宕了,锁可以被释放。ZooKeeper 的 ephemeral 节点恰好具备这样的特性。
    终端1:

    zkCli.sh
    create –e /lock
    quit
    
    • 1
    • 2
    • 3

    终端2:

    zkCli.sh
    create –e /lock
    stat –w /lock
    create –e /lock
    
    • 1
    • 2
    • 3
    • 4

    节点状态信息
    类似于树状结构,节点下面是可以存储一些信息和属性的。可以通过stat命令来进行查看。
    在这里插入图片描述

    • cZxid :Znode创建的事务id。
    • ctime:节点创建时的时间戳。
    • mZxid :Znode被修改的事务id,即每次对znode的修改都会更新mZxid。

    对于zk来说,每次的变化都会产生一个唯一的事务id,zxid(ZooKeeper Transaction Id),通过zxid,可以确定更新操作的先后顺序。例如,如果zxid1小于zxid2,说明zxid1操作先于zxid2发生,zxid对于整个zk都是唯一的,即使操作的是不同的znode。

    • pZxid: 表示该节点的子节点列表最后一次修改的事务ID,添加子节点或删除子节点就会影响子节点列表,但是修改子节点的数据内容则不影响该ID(注意: 只有子节点列表变更了才会变更pzxid,子节点内容变更不会影响pzxid)
    • mtime:节点最新一次更新发生时的时间戳.
    • cversion :子节点的版本号。当znode的子节点有变化时,cversion 的值就会增加1。
    • dataVersion:数据版本号,每次对节点进行set操作,dataVersion的值都会增加1(即使设置的是相同的数据),可有效避免了数据更新时出现的先后顺序问题。
    • ephemeralOwner:如果该节点为临时节点, ephemeralOwner值表示与该节点绑定的session id。如果不是, ephemeralOwner值为0(持久节点)。

    在client和server通信之前,首先需要建立连接,该连接称为session。连接建立后,如果发生连接超时、授权失败,或者显式关闭连接,连接便处于closed状态, 此时session结束。

    • dataLength : 数据的长度
    • numChildren :子节点的数量(只统计直接子节点的数量)
      在这里插入图片描述
  • 相关阅读:
    最强AI换脸工具Rope使用教程,Rope整合包下载【全网最全安装步骤】
    数据特征工程 | 主成分分析(Python)
    AI图书推荐:ChatGPT等生成式AI在高等教育中的应用
    计算机网络之传输层 + 应用层
    春节活动 - 高峰值奖励发放技术方案
    【html-CSS布局】简单设计一个静态网页
    唐高宗封后武则天,是家谱维护门第失败的转折事件
    VTN系列多通道振弦、温度、模拟传感信号系列数据采集仪
    Java新特性(2):Java 10以后
    【软件测试】一个边界值事故,领导leader心里苦季度奖金没了还被罚3K......
  • 原文地址:https://blog.csdn.net/beautybug1126/article/details/133578854