第三章：什么是分库分表

文章目录

背景
什么是分库分表
为什么要分库分表
- 性能
- 可用性
什么时候考虑分库分表
- 什么时候分库
- 什么时候分表

背景

一个系统当伴随着用户量的激增，业务数据的不断增加，数据库表中的数据越来越多，如果再去对我们数据库中的表进行curd操作的时候，就会造成一些性能上的瓶颈问题！
这就引入了我们今天话题，分库分表

什么是分库分表

我们就从他的字面意思来理解，这样有助于我们对分库分表有一个清晰的了解

分库：他就是将我们原来用于存放单个数据库中的数据，进行拆分，将它存储到多个数据库中

分表：他就是将我们原来存放在单个表中的数据，进行拆分，将它存储到多张表中

为什么要分库分表

分库分表自然是为了提升软件系统的性能以及增加其可用性

性能

随着系统上线的时间越久，数据量就会越大，我们查询的QPS也会越来越高的，那么相对应的读写时间也会增加。这样就导致了我们数据库读写的瓶颈期。从而考虑对数据库性能方面的优化。

可用性

我们都知道单体数据库如果发生了意外情况，就会导致我们数据的丢失。我们常规的保证可用行使用的是MS或者MM等等部署方式来解决可用性的问题。其实，我们对数据进行拆分也会提高容灾及可用性。

什么时候考虑分库分表

什么时候分库

当我们的业务量持续增大的时候，多个服务在共享一个单体数据库的时候，数据库就会遇到性能瓶颈，这个时候就需要考虑分库。比如订单和用户等，都可以抽取出来，然后在搞个应用（其实就是微服务思想），并且拆分数据库（订单库、用户库）。
数据库被切分以后后，就不能再依赖数据库自身的主键生成机制，最简单的可以考虑UUID（不连续，性能不佳），或者使用雪花算法来生成分布式ID（推荐使用）。

什么时候分表

当我们的系统处于快速发展的时期，如果每天订单的流水都新增几十万，并且，订单表的查询效率明显变慢的时候，就需要考虑进行规划分库分表了。一般B+树索引高度是2~3层最佳，当数据量达到千万级别，可能高度就变4层了，查询就会明显变慢了。不过业界流传，一般500万数据就开始要考虑分表了。

欢迎大家点击下方卡片，关注《coder练习生》

相关阅读:
Linux网络管理
【kafka】JDBC source&sink connect实现数据从Oracle实时同步插入更新到PostgreSQL（PG）...
如何搭建一个 websocket
4、Elasticsearch 检查及索引的CRUD
docker安装Apache NIFI
SQL Server教程 - T-SQL-索引（INDEX）
写给小白的开源编译器
代码随想录Day22 | Leetcode39 组合总和、Leetcode40 数组总和II | Leetcode131 分割回文串
3.8-镜像的发布
L1-7 分寝室(Python)

原文地址：https://blog.csdn.net/ybb_ymm/article/details/130910751