在MySQL中进行JOIN操作,特别是在处理一对多关系的表时,可能会出现重复的记录,这是因为左表(或右表)中的每一项在与右表(或左表)连接时,如果对应有多条匹配记录,则会生成多次组合。
一般的业务场景,使用DISTINCT
跟GROUP BY
往往都能够实现,这里主要说一种比较取巧的方法:
-- 假设a表跟b表的关系是多对一
SELECT SUM(b.amount) / COUNT(DISTINCT a.id)
FROM table_a a LEFT JOIN table_b b ON b.a_id = a.id;
不难看出,关键点在于/ COUNT(DISTINCT a.id)
,这里直接除掉去重后的a表数,最后得到的结果就是准确的,也不需要再额外使用子查询或是其他聚合操作。
最后说明一下,以上例子是在SQL本身已经非常复杂并且无法再进行DISTINCT
或是GROUP BY
的情况下针对单列数据聚合使用的,一般的业务场景直接使用DISTINCT
跟GROUP BY
即可。
如果有更好的实现方式欢迎各位在评论区交流。