这一篇来趣味性的探讨一下 , 如何通过更少的空间描述更多的信息
在数据库里面 ,通常我们会用数字的递进来描述状态等信息 , 但是如果想进行更复杂的操作 , 就有必要对二进制有一定理解了.
单数中保存多个信息的意思是 : 我们能把多少信息存储到一串数字里面. 这里直接来通过一些案例来说明用法
用单个数字来表示状态
这也是业务中最常见的一种使用方式 , 通过数字 1,2,3 等来描述一个状态 , 这种方式有一定的可读性 , 也有足够的扩展性
如果从二进制的角度说 , 这是一种进位体现状态的方式.
用单个数字来描述多个状态 : 包含多种状态
单数描述多个信息这一块首先能想到的就是 Linux 的权限表示法 , 在Linux 中有四种权限 , 分别如下 :
这种表示法的方式很简单, 从表象上来说就是两数相加 , 把初始状态设为 1 / 2 / 4 , 更复杂的状态则是初始状态的组合.
这种模式从二进制的角度看的话能更明显 , 每一位都标识一种状态.在更复杂的场景中, 还可以通过质数的数学特性 , 来做更多的扩展
用单个数字来描述不同维度的信息 : 包含状态和数量
这种体现最有代表的就是线程池的表现方式. 在线程池对象ThreadPoolExecutor 中 , 有个属性可秀了 , 它叫 ctl.
- // ctl 是一个整形原子类 , 它即表示了状态 , 有记录了梳理
- private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0));
- : 此变量 记录了 “线程池中的任务数量”和“线程池的状态”两个信息
- : 高3位表示"线程池状态",低29位表示"线程池中的任务数量"
- - RUNNING : 111 : 该线程池能接收新任务 ,且能对新任务进行处理
- - SHUTDOWN : 000 : 不能接收新任务 ,但是可以对任务进行处理
- - STOP : 001 : 不添加新任务 , 不对任务进行处理 , 会中断正在执行的任务
- - TIDYING : 010 : 当所有的任务已终止,ctl记录的"任务数量"为0,线程池会变为TIDYING状态
- - 当所有的任务已终止,ctl记录的"任务数量"为0,线程池会变为TIDYING状态
- - TERMINATED : 011 : 线程池彻底终止的状态
-
-
- // 对数量的统计很简单 , 因为是 低 29 位用来描述梳理 , 所以做正常的加减即可实现
- private boolean compareAndIncrementWorkerCount(int expect) {
- return ctl.compareAndSet(expect, expect + 1);
- }
-
- private boolean compareAndDecrementWorkerCount(int expect) {
- return ctl.compareAndSet(expect, expect - 1);
- }
-
-
- // 对状态的修改则是通过位运算来做的
- > S1 : 预先准备多种状态
- private static final int RUNNING = -1 << COUNT_BITS;
- private static final int SHUTDOWN = 0 << COUNT_BITS;
- private static final int STOP = 1 << COUNT_BITS;
- private static final int TIDYING = 2 << COUNT_BITS;
- private static final int TERMINATED = 3 << COUNT_BITS;
-
- > S2 : 判断是否是运行状态或停止状态
- private static final int COUNT_BITS = Integer.SIZE - 3;
- private static final int CAPACITY = (1 << COUNT_BITS) - 1;
- // ~CAPACITY将反转CAPACITY的值,也就是CAPACITY的高3位全部为1,低29位全部为0
- // & 操作则可以得到高三位的值
- private static int runStateOf(int c) { return c & ~CAPACITY; }
- final boolean isRunningOrShutdown(boolean shutdownOK) {
- int rs = runStateOf(ctl.get());
- return rs == RUNNING || (rs == SHUTDOWN && shutdownOK);
- }
这样一个数字则将数据进行了深度扩展 , 了解一定的二进制思想就足够了解这些逻辑的变化
雪花算法对数字的整合
下面说的几种方式会跳出二进制 , 从业务的角度去看数字的玩法 , 先来看一段很常见的雪花算法
- 3 << 60 | timestamp - 1504000000000L << 20 | workerId << 10 | random.nextInt(128);
-
- 首位 : 可以自定义首位
- 时间戳 : 可以根据自己的业务情况定义毫秒级 (这里我随便给了个时间)
- 工作机器id:也被叫做workId,这个可以灵活配置,机房或者机器号组合都可以
- 随机序列号 : 自增值支持同一毫秒内同一个节点可以生成随机多少个ID
类似的方式还可以有很多 , 一个数有很长的位数 , 我们可以通过这些位数来实现不同的业务逻辑 , 以表达不同的涵义.
偏移量对进度的处理
说到偏移量 , 最简单的方向就是 for 循环时对 size 进行判断 ,当达到 size 后直接结束.
而稍微复杂点的就是 IO 流种对长度进行读取, 分批去读取数据.
更深度一点的就是即进行长度的扩展 , 又包含其他的信息 , 这一篇就来看一下 ObjectStream 中如何使用偏移量的.
ObjectStream 是一个对象流 , 通过 JDK 序列化对对象进行转换和解析.
在下面这个场景中 , 有一个对象叫 passHandle , ObjectStream 会通过该值作为下标获取存在对象列表中的对象 , 同时通过该对象判断整体的进度已经状态
- // S1 : 初始化
- private static final int NULL_HANDLE = -1;
- private int passHandle = NULL_HANDLE;
-
- // S2 : 写入 passHandler (PS : 此处是在 ObjectOutputStream 中)
- bout.writeInt(baseWireHandle + passHandle);
-
-
- // S3 : 解析 passHandler
- passHandle = bin.readInt() - baseWireHandle;
- if (passHandle < 0 || passHandle >= handles.size()) {
- throw new StreamCorruptedException...
- }
-
-
- // S4 : 通过 Handler 取位数
- Object lookupObject(int handle) {
- return (handle != NULL_HANDLE &&
- status[handle] != STATUS_EXCEPTION) ?
- entries[handle] : null;
- }
除了作为偏移量来确定进度 , 还可以通过 passHandler 来标识状态
通常用偏移量来标识状态是需要和其他对象相配合的 , 例如集合 :
在下面这个案例里面 , passHandler 是作为 status 的下标存在的 , 而每个下标中都会存储一个状态, 则就对整个序列化中的状态进行了统计 :
- private static final byte STATUS_OK = 1;
- private static final byte STATUS_UNKNOWN = 2;
- private static final byte STATUS_EXCEPTION = 3;
在这个案例里面 , 游标本身只代表了定位 , 但是它可以配合多个其他的对象 , 来扩展其含义. 同时游标可以通过设置负数形式 , 来扩展其状态含义. 当其等于 -1 时 , 则标识不存在该对象 , 是另外一种层面的扩展
对数据的信息处理其实还有很多种方式 , 总结出来主要包括以下几种 :