在性能分析中,SQL 的分析那是必须的。
不同的库又有着不同的命令,但是总体来说,同一类型的数据库,除了有一些手段上的不同之外,给出的结果基本上都是类似的。
今天说一下 MySQL 的。
每次我都会说,对数据库的性能分析来说,就是要知道一个 SQL 在数据库中执行得有多快。从进到数据库,到出数据库,需要多长时间。
对 MySQL 来说,分析 SQL 的执行时间有几种方法。比如说:
1. 执行计划:
从执行计划中可以看到走没走索引,key的长度,取了多少行数据,使用的条件之类的。这是个最基本的在数据库里看sql的性能的了,但是这个信息相对oracle里的执行计划,那真是差太多了。所以我们也就是用它随便看看,不用过于依赖,不然只能伤自己。
2. Query Stats
在 mysqlworkbench 里有这么个tab,可以看查询的状态,在这里面我们可以看到了更多的东西,就是有了 joins 和 sort、index usage之类的信息。但是感觉还是不够劲。不够深入。
3. profiling
set profiling=1; show profiles; show profile all for query <ID>;
这下开心了。终于可以看到更深入的信息了,在这里可以看到一个SQL 从初级化开始到 cleaningup 整个过程中每一步消耗的时间,以及使用的 cpu、memory、io、cs 等等的信息。只要看不懂的,没有看不到的。
那如何有一堆的 SQL 要分析怎么办?
4. mysqldumpslow 和 pt-query-digest
mysqldumpslow -s t -t 10 slow.log.last
按时间排个序,取前 10。一个个 SQL 就自己出来站好了。(其他好用的参数请看命令的help)
下面看看 pt-query-digest 能做什么。
对整个 slowlog 进行分析,把 exec time/lock time/rows sent/rows examine/rows affecte/query size 分别整理出来,有 total 值,还有最大、最小、平均、95%、标准方差、中位值。
第二部分中,对每个 SQL 进行排序,按执行时间。这里不仅有执行时间、还有执行次数、每次执行响应时间、和方差均值比。顿觉方向不再迷茫了。后续分析有了方向。
下面会把每一个 SQL 列出来,并分析时间的消耗。
(有看官问了,你这怎么有码呢?我笑而不语,有身份证的人都懂得。)
不过不影响接着说思路。从这里可以看到每个语句的 count/lock time/rows sent/rows examine/rows affecte/query size,并且这里还有 percentage 了。按性能从最严重的地方开始收拾的原则,我们基本上不用再想其他的了。
有了这个慢 SQL的分析,再结合前面提到的 profiling。
因为 mysqldumpslow 是 MySQL 自带的工具,所以建议先用那个。也有人说了,现在 MySQL 有一抓一大把的工具可以监控,说到 SQL 就到 SQL ,为啥还要会这些呢?是呀,为啥呢?
其实不为啥,就是哥喜欢。
总之,不管用什么工具,最重要的是你要达到什么目的。不管是架构级分析、系统级分析、DB级分析、网络级分析、应用级分析、代码级分析,你到底是想实现什么目的,工具并不重要。