- 论坛徽章:
- 0
|
David那边有一个SQL优化的案例,我觉得非常有指导意义,记录如下。
优化前的SQL:
SELECT max(p.id) as id,p.sid FROM tbl_test p where p.sid>0 and authorized=xxxx group by p.sid order by max(addtime) desc limit 10;
这个表较大,并且SQL最终取出的记录只有10条,但是却需要做大量的GROUP和排序操作。实际耗费10秒以上。
与开发人员协商后,决定先在子查询中限定到一个可以滤出最终10条记录的父结果集。在这个结果集之上再来做GROUP BY和排序。
优化后的SQL如下:
SELECT MAX(p.ID) AS ID, p.SID
FROM (SELECT * FROM tbl_test
WHERE SID > 0
AND AUTHORIZED = xxxx
ORDER BY ADDTIME DESC LIMIT 1000) p
GROUP BY p.sid
ORDER BY max(addtime) DEsc limit 10;
子查询中的结果集是1000条,在1000条上做排序和GROUPBY消耗已经缩小了很多,耗费时间约10MS。这样做的话,程序只在非常罕见的情况下拿不到10条记录。
总结:
在逻辑上有多种途径可以达成结果的情况下,在结果集上做小小的妥协,带来的却是上千倍的效率提升,在这个节能减排首当其冲的年代,做这点小小的牺牲,太值得了。 |
|