• 第三章:什么是分库分表


    背景

    一个系统当伴随着用户量的激增,业务数据的不断增加,数据库表中的数据越来越多,如果再去对我们数据库中的表进行curd操作的时候,就会造成一些性能上的瓶颈问题!
    这就引入了我们今天话题,分库分表

    什么是分库分表

    我们就从他的字面意思来理解,这样有助于我们对分库分表有一个清晰的了解

    分库:他就是将我们原来用于存放单个数据库中的数据,进行拆分,将它存储到多个数据库中

    分表:他就是将我们原来存放在单个表中的数据,进行拆分,将它存储到多张表中

    为什么要分库分表

    分库分表自然是为了提升软件系统的性能以及增加其可用性

    性能

    随着系统上线的时间越久,数据量就会越大,我们查询的QPS也会越来越高的,那么相对应的读写时间也会增加。这样就导致了我们数据库读写的瓶颈期。从而考虑对数据库性能方面的优化。

    可用性

    我们都知道单体数据库如果发生了意外情况,就会导致我们数据的丢失。我们常规的保证可用行使用的是MS或者MM等等部署方式来解决可用性的问题。其实,我们对数据进行拆分也会提高容灾及可用性。

    什么时候考虑分库分表

    什么时候分库

    当我们的业务量持续增大的时候,多个服务在共享一个单体数据库的时候,数据库就会遇到性能瓶颈,这个时候就需要考虑分库。比如订单和用户等,都可以抽取出来,然后在搞个应用(其实就是微服务思想),并且拆分数据库(订单库、用户库)。
    数据库被切分以后后,就不能再依赖数据库自身的主键生成机制,最简单的可以考虑UUID(不连续,性能不佳),或者使用雪花算法来生成分布式ID(推荐使用)。

    什么时候分表

    当我们的系统处于快速发展的时期,如果每天订单的流水都新增几十万,并且,订单表的查询效率明显变慢的时候,就需要考虑进行规划分库分表了。一般B+树索引高度是2~3层最佳,当数据量达到千万级别,可能高度就变4层了,查询就会明显变慢了。不过业界流传,一般500万数据就开始要考虑分表了。

    欢迎大家点击下方卡片,关注《coder练习生》

  • 相关阅读:
    03梯度下降
    centos 6.10 安装 perl 5.14
    web期末作业设计网页
    PyTorch: 张量的变换、数学运算及线性回归
    朴素贝叶斯法
    Ansible 自动化运维企业实战(一)
    datadog ebpf模块 offset-guess.o 问题排查解决
    关于报表打印
    MINA架构DEMO
    Redis学习
  • 原文地址:https://blog.csdn.net/ybb_ymm/article/details/130910751