MySQL—SQL优化详解(下)

谁借莪1个温暖的怀抱¢ 2023-10-12 15:07 19阅读 0赞

♥️作者:小刘在C站

♥️个人主页: 小刘主页

♥️努力不一定有回报,但一定会有收获加油!一起努力,共赴美好人生!

♥️学习两年总结出的运维经验,以及思科模拟器全套网络实验教程。专栏:云计算技术

♥️小刘私信可以随便问,只要会绝不吝啬,感谢CSDN让你我相遇!

前言

本章讲解SQL语言中的优化,有想看上章的小伙伴可以到小刘主页进行查看,因为有一些原因我提供不了链接。

目录

3 order by优化

A. 数据准备

B. 执行排序SQL

C. 创建索引

D. 创建索引后,根据age, phone进行升序排序

E. 创建索引后,根据age, phone进行降序排序

F. 根据phone,age进行升序排序,phone在前,age在后。

F. 根据age, phone进行降序一个升序,一个降序

G. 创建联合索引(age 升序排序,phone 倒序排序)

H. 然后再次执行如下SQL

4 group by优化

5 limit优化

6 count优化

6.1 概述

6.2 count用法

7 update优化


3 order by**优化**

MySQL 的排序,有两种方式:

Using filesort : 通过表的索引或全表扫描,读取满足条件的数据行,然后在排序缓冲区 sort

buffer 中完成排序操作,所有不是通过索引直接返回排序结果的排序都叫 FileSort 排序。

Using index : 通过有序索引顺序扫描直接返回有序数据,这种情况即为 using index ,不需要

额外排序,操作效率高。

对于以上的两种排序方式, Using index 的性能高,而 Using filesort 的性能低,我们在优化排序

操作时,尽量要优化为 Using index 。

接下来,我们来做一个测试:

A. 数据准备

把之前测试时,为 tb_user 表所建立的部分索引直接删除掉

  1. drop index idx_user_phone on tb_user;
  2. drop index idx_user_phone_name on tb_user;
  3. drop index idx_user_name on tb_user;

69fa1aa9f2094e47b54768a5b11f8806.png

B. 执行排序SQL

  1. explain select id,age,phone from tb_user order by age ;

a51a9f7f443946dba2964c0ceab2f664.png

  1. explain select id,age,phone from tb_user order by age, phone ;

e8d7f4d5799e465593d885149b88842a.png

由于 age, phone 都没有索引,所以此时再排序时,出现 Using filesort , 排序性能较低。

C. 创建索引

  1. -- 创建索引
  2. create index idx_user_age_phone_aa on tb_user(age,phone);

D. 创建索引后,根据age, phone进行升序排序

  1. explain select id,age,phone from tb_user order by age;

241ab7905f234cf3b5fd243039af3e99.png

  1. explain select id,age,phone from tb_user order by age , phone;

1166516604a845a78ff08b392a6c7f95.png

建立索引之后,再次进行排序查询,就由原来的 Using filesort , 变为了 Using index ,性能

就是比较高的了。

E. 创建索引后,根据age, phone进行降序排序

  1. explain select id,age,phone from tb_user order by age desc , phone desc ;

2654e232788147c1a1b596bc33361b92.png

也出现 Using index , 但是此时 Extra 中出现了 Backward index scan ,这个代表反向扫描索

引,因为在 MySQL 中我们创建的索引,默认索引的叶子节点是从小到大排序的,而此时我们查询排序 时,是从大到小,所以,在扫描时,就是反向扫描,就会出现 Backward index scan 。 在

MySQL8 版本中,支持降序索引,我们也可以创建降序索引。

F. 根据phone,age进行升序排序,phone在前,age在后。

  1. explain select id,age,phone from tb_user order by phone , age;

7a6a179f2e5743c2a4aa361c8145cb70.png

排序时 , 也需要满足最左前缀法则 , 否则也会出现 filesort 。因为在创建索引的时候, age 是第一个

字段, phone 是第二个字段,所以排序时,也就该按照这个顺序来,否则就会出现 Using

filesort 。

F. 根据age, phone进行降序一个升序,一个降序

  1. explain select id,age,phone from tb_user order by age asc , phone desc ;

53027b4aa739434b8487a16f3e19c429.png

因为创建索引时,如果未指定顺序,默认都是按照升序排序的,而查询时,一个升序,一个降序,此时就会出现Using filesort。

3f47116ab516462ab648308c5534d346.png

为了解决上述的问题,我们可以创建一个索引,这个联合索引中 age 升序排序, phone 倒序排序。

G. 创建联合索引(age 升序排序,phone 倒序排序)

  1. create index idx_user_age_phone_ad on tb_user(age asc ,phone desc);

cdd4a384a61e4595bf47f05a6c00a406.png

H. 然后再次执行如下SQL

  1. explain select id,age,phone from tb_user order by age asc , phone desc ;

08c31c7340914b839c13dbba2e4d00b0.png

升序/降序联合索引结构图示:

80ac6a23d81741aca8c4d6580acec7e2.png

72262a392294448a9ac0965e07e4876c.png

由上述的测试 , 我们得出 order by 优化原则 :

A. 根据排序字段建立合适的索引,多字段排序时,也遵循最左前缀法则。

B. 尽量使用覆盖索引。

C. 多字段排序 , 一个升序一个降序,此时需要注意联合索引在创建时的规则( ASC/DESC )。

D. 如果不可避免的出现 filesort ,大数据量排序时,可以适当增大排序缓冲区大小

sort_buffer_size( 默认 256k) 。

4 group by**优化**

分组操作,我们主要来看看索引对于分组操作的影响。

首先我们先将 tb_user 表的索引全部删除掉 。

  1. drop index idx_user_pro_age_sta on tb_user;
  2. drop index idx_email_5 on tb_user;
  3. drop index idx_user_age_phone_aa on tb_user;
  4. drop index idx_user_age_phone_ad on tb_user;

9c4dff0964e647baac8c9686f1cd2141.png

接下来,在没有索引的情况下,执行如下SQL,查询执行计划:

  1. explain select profession , count(*) from tb_user group by profession ;

a4bd160e0c2e433da793546e99aaed7f.png

然后,我们在针对于 profession , age, status 创建一个联合索引。

  1. create index idx_user_pro_age_sta on tb_user(profession , age , status);

紧接着,再执行前面相同的 SQL 查看执行计划。

  1. explain select profession , count(*) from tb_user group by profession ;

2445c25ac74943ca9161283ff57dee25.png

再执行如下的分组查询SQL,查看执行计划:

7062bf27c9a94a11bec2fbcfca869bc6.png

我们发现,如果仅仅根据 age 分组,就会出现 Using temporary ;而如果是 根据

profession,age 两个字段同时分组,则不会出现 Using temporary 。原因是因为对于分组操作,

在联合索引中,也是符合最左前缀法则的。

所以,在分组操作中,我们需要通过以下两点进行优化,以提升性能:

A. 在分组操作时,可以通过索引来提高效率。

B. 分组操作时,索引的使用也是满足最左前缀法则的。

5 limit**优化**

在数据量比较大时,如果进行 limit 分页查询,在查询时,越往后,分页查询效率越低。

我们一起来看看执行 limit 分页查询耗时对比:

2da8b4e661f9498c90c1b02d41305be4.png

通过测试我们会看到,越往后,分页查询效率越低,这就是分页查询的问题所在。

因为,当在进行分页查询时,如果执行 limit 2000000,10 ,此时需要 MySQL 排序前 2000010 记

录,仅仅返回 2000000 - 2000010 的记录,其他记录丢弃,查询排序的代价非常大 。

优化思路 : 一般分页查询时,通过创建 覆盖索引 能够比较好地提高性能,可以通过覆盖索引加子查

询形式进行优化.

  1. explain select * from tb_sku t , (select id from tb_sku order by id
  2. limit 2000000,10) a where t.id = a.id;

6 count**优化**

6.1 概述

  1. select count(*) from tb_user ;

在之前的测试中,我们发现,如果数据量很大,在执行 count 操作时,是非常耗时的。

MyISAM 引擎把一个表的总行数存在了磁盘上,因此执行 count(*) 的时候会直接返回这个

数,效率很高; 但是如果是带条件的 count , MyISAM 也慢。

InnoDB 引擎就麻烦了,它执行 count(*) 的时候,需要把数据一行一行地从引擎里面读出

来,然后累积计数。

如果说要大幅度提升 InnoDB 表的 count 效率,主要的优化思路:自己计数 ( 可以借助于 redis 这样的数据库进行 , 但是如果是带条件的 count 又比较麻烦了 ) 。

6.2 count**用法**

count() 是一个聚合函数,对于返回的结果集,一行行地判断,如果 count 函数的参数不是

NULL ,累计值就加 1 ,否则不加,最后返回累计值。

用法: count ( * )、 count (主键)、 count (字段)、 count (数字)

85aba4433e5b49a9841dee164c6289da.png

按照效率排序的话,count(字段) < count(主键 id) < count(1) ≈ count(*),所以尽

量使用 count(*) 。

7 update**优化**

我们主要需要注意一下 update 语句执行时的注意事项。

  1. update course set name = 'javaEE' where id = 1 ;

当我们在执行删除的 SQL 语句时,会锁定 id 为 1 这一行的数据,然后事务提交之后,行锁释放.

但是当我们在执行如下 SQL 时。

  1. update course set name = 'SpringBoot' where name = 'PHP' ;

当我们开启多个事务,在执行上述的 SQL 时,我们发现行锁升级为了表锁。 导致该 update 语句的性能大大降低。

InnoDB 的行锁是针对索引加的锁,不是针对记录加的锁 , 并且该索引不能失效,否则会从行锁升级为表锁

♥️关注,就是我创作的动力

♥️点赞,就是对我最大的认可

♥️这里是小刘,励志用心做好每一篇文章,谢谢大家

发表评论

表情:
评论列表 (有 0 条评论,19人围观)

还没有评论,来说两句吧...

相关阅读

    相关 DataOps详解 ()

    > 什么是数据运营?数据团队终极指南 微信搜索关注《Java学研大本营》,加入读者群,分享更多精彩 什么是 DataOps 可观察性? 在数据可观察性对于实时了解数据

    相关 mysqlsql执行顺序

    mysql语句的执行顺序问题 这是先执行ORDERBY语句,大多数的你想找前N条记录的时候LIMIT都会最后执行,因为如果不是这样的话就不会达到你想要的记录 本回答由提