MySQL执行关联查询的策略简单地说,先从一个表循环取出单条数据,然后再循环到下一个表中寻找匹配的行,然后再下一个表,依次下去,直到找到所有表中匹配的行为止。然后根据各个表匹配的行,返回查询中需要的各个列。(这样说不十分严谨,主要是为了说明索引的作用。)
根据上述内容,第一张表很重要。但关联顺序并不是按照SQL语句中的顺序。在执行关联查询的时候,关联查询优化器通过评估不同顺序时的成本,选择一个代价最小的关联顺序。当然如果需要,可以使用STRAIGHT_JOIN关键字人工指定关联顺序。
所以,多表关联查询,比如三表关联,执行过程大概是,关联查询优化器选择其中一个查询成本最小的表,一般是扫描行数最少,然后根据关联字段关联后面第二、第三张表。可见如果第二、第三张表上有索引,就能大幅提高性能。优化关联查询,确保ON或者USING子句上的列有索引。在创建索引的时候就要考虑到关联顺序。优化器的关联顺序中最前面的表不需要在关联列上建索引,只需在关联顺序中的第二个及以后表的相应列上建索引。
可见,在关联查询中,第一张表以后的多张表的关联字段上的索引,可以同时起作用。
此外注意,要确保任何group by和order by中的表达式只涉及到一个表中的列,这样mysql才有可能使用索引来优化这个过程。