相比大家或多或少,都会遇到查询记录数的情况。在mysql中查询记录数使用的是select count(*) from t。但是在不同引擎却有不同的执行效果。在MyISAM 引擎,他会直接给你返回一个结果数,因为它存储了这个行数,innodb引擎则需要一行行的去读。
上面说到。myisam引擎会把这个行数存起来,所以很快(这个指的是没有加条件的情况下,不让也得一行一行判断)。那么为什么innodb引擎不去把这个数存起来呢。这是因为mvvc的影响。如下图
为什么是这个返回结果,这里不再多介绍,有需要的可以看之前的文章。
那么存redis里面呢,其实也不行。
如上图,这样就是redis读的数据是最新的,但是读出的记录数是不对的。如果你把t2和t4换个位置,那么就会变成,你读的记录数对的,但是最新的记录没有读到。
那么怎么解决这个问题呢,大家一下,是不是只要会话a的结果对会话b不可见,那么会话b独到的数据和记录数就是一致的,那么关于这个不可见,大家有没有想到什么,不错就是mysql中的事务的隔离。所以我们可以把这个记录数存储到表c中,然后你去读,就可以实现快速无误的读出这个记录数。
上面的优化方案我们看到了,但是大多数情况下是用不到了。大多数情况下,我们还是一个count(*)就解决了。那么它的效率到底怎么样呢,和其他的相比效率如何呢。我们往下看。
首先呢,我们要知道,主键索引数和非主键索引树统计出来的行数是一样的,但是非主键索引树比较小,所以mysql正常情况下都会通过小的树来统计这个行数。而上面的几个用法区别如下。
1.count(*8):(这个8是为了不让这个星号生效,应该是没有)它就是简单的取行数,一行一行的遍历,最后统计出一个结果。
2.count(1):会往每一行里插入数字1,判断为非空,将结果数加1
3.count(id):把每一行值取出来,返回给serve层,判断是不可能为空的,然后统计出结果数。
4.count(字段):如果该字段设置的是不为null,和conut(id)流程一样,如果该字段设置的是可以为null,则还需要则该字段的具体值取出来,在判断一次是不是为null,最后统计结果数。
因为count(id)和count(字段)还需要将值取出来,返回给serve层,所以肯定是比较慢的,所以大致的效率排序count(*)<=count(1) < count(id) <= count(字段)
今天对常用的统计总数的sql做了一个分析,同时也给出了一个比较可行的优化方案,希望往后在遇到统计总数的业务的时候,可以找到一个最优的解决方案或者写法。