SQL优化

r囧r小猫 2024-04-23 20:03 3阅读 0赞

### SQL优化 ###

#### 插入数据 ####

*  insert优化
    
     *  建议使用批量插入
    
        Insert into tb_test values(1,'Tom'),(2,'Cat'),(3,'Jerry');
    
     *  建议手动提交事务
    
        start transaction;
        insert into db_test values(1,'Tom'),(2,'Cat'),(3,'Bob');
        insert into db_test values(1,'Tom'),(2,'Cat'),(3,'Bob');
        insert into db_test values(1,'Tom'),(2,'Cat'),(3,'Bob');
        commit;
    
     *  建议主键顺序插入
    
        主键顺序插入，性能要高于乱序插入。
        主键乱序插入 : 8 1 9 21 88 2 4 15 89 5 7 3
        主键顺序插入 : 1 2 3 4 5 7 8 9 15 21 88 89
 *  大批量插入数据
    
    如果一次性需要插入大批量数据(比如: 几百万的记录)，使用insert语句插入性能较低，此时可以使用MySQL数据库提供的load指令进行插入。操作如下：
    
    ![在这里插入图片描述][035edf55ef754beb99468f0869c4a54a.png]
    
    可以执行如下指令，将数据脚本文件中的数据加载到表结构中：
    
        -- 客户端连接服务端时，加上参数 -–local-infile
        mysql –-local-infile -u root -p
        -- 设置全局参数local_infile为1，开启从本地加载文件导入数据的开关
        set global local_infile = 1;
        -- 执行load指令将准备好的数据，加载到表结构中
        load data local infile '/root/sql1.log' into table tb_user fields terminated by ',' 
        lines terminated by '\n' ;
    
    > 在load时，主键顺序插入性能高于乱序插入

#### 主键优化 ####

##### 数据组织方式 #####

在InnoDB存储引擎中，表数据都是根据主键顺序组织存放的，这种存储方式的表称为索引组织表（index organized table  IOT）。

![在这里插入图片描述][717f59fb93c04a669279a1c5800067d5.png]

行数据，都是存储在聚集索引的叶子节点上的。

**InnoDB的逻辑结构图：**

![在这里插入图片描述][1940f9d07eab4e46b4c8d0a4be1f8d18.png]

在InnoDB引擎中，数据行是记录在逻辑结构 page 页中的，而每一个页的大小是固定的，默认16K。那也就意味着， 一个页中所存储的行也是有限的，如果插入的数据行row在该页存储不小，将会存储到下一个页中，页与页之间会通过指针连接。

##### 页分裂 #####

页可以为空，也可以填充一半，也可以填充100%。每个页包含了2-N行数据（如果一行数据过大，会行溢出），根据主键排列。

###### 主键顺序插入效果 ######

1.从磁盘中申请页，主键顺序插入

![在这里插入图片描述][0e0d10de988e465183c764be527d2409.png]

2.第一个页没有满，继续往第一页插入

![在这里插入图片描述][1a7d497a49414296acf188fd46a48ff5.png]

3.当第一个页写满之后，再写入第二个页，页与页之间会通过指针连接  
![在这里插入图片描述][85c320aef0474ac5af33ce74b07007ac.png]

4.当第二页写满了，再往第三页写入

![在这里插入图片描述][6176f5961e6341f39b3cddd782cdcf5f.png]

###### 主键乱序插入效果 ######

1.假如1\#，2\#页都已经写满了，存放了如图所示的数据： ![在这里插入图片描述][5271206699794258872ebf4a38222f2c.png]

2.此时再插入id为50的记录，会再次开启一个页，写入新的页中吗？

![在这里插入图片描述][e9b0241807444a31a34ab3b0e0aceb94.png]

不会。因为，索引结构的叶子节点是有顺序的。按照顺序，应该存储在47之后。

![在这里插入图片描述][c256068a6e4c471dab57615450c8d59f.png]

但是47所在的1\#页，已经写满了，存储不了50对应的数据了。 那么此时会开辟一个新的页 3\#。

![在这里插入图片描述][6ce56e244e2041138f95427a353e4deb.png]

但是并不会直接将50存入3\#页，而是会将1\#页后一半的数据，移动到3\#页，然后在3\#页，插入50。

![在这里插入图片描述][cb8ee709615045298c8dabedccde3ecb.png]

移动数据，并插入id为50的数据之后，那么此时，这三个页之间的数据顺序是有问题的。 1\#的下一个

页，应该是3\#， 3\#的下一个页是2\#。 所以，此时，需要重新设置链表指针。

![在这里插入图片描述][dad49d78e2a14d559b392c2d88509ff7.png]

上述这种现象，就是发生了“页分离”，是比较耗费性能的操作。

##### 页合并 #####

假设目前表中已有数据的索引结构(叶子节点)如下：

![在这里插入图片描述][b02f3ac1101b474ba191e0a66c2c9339.png]

当我们对已有数据进行删除时，具体的效果如下:

当删除一行记录时，实际上记录并没有被物理删除，只是记录被标记（flaged）为删除并且它的空间变得允许被其他记录声明使用。

![在这里插入图片描述][01d9772e83e74b96b91104c041c5f87f.png]

当我们继续删除2\#的数据记录

![在这里插入图片描述][293611d509c245f4860a51cf8d412cdb.png]

当页中删除的记录达到 MERGE\_THRESHOLD（默认为页的50%），InnoDB会开始寻找最靠近的页（前或后）看看是否可以将两个页合并以优化空间使用。`MERGE_THRESHOLD：合并页的阈值，可以自己设置，在创建表或者创建索引时指定。`

![在这里插入图片描述][d73428d6c4cc47c9b0662dd35d6f9561.png]

删除数据，并将页合并之后，再次插入新的数据21，则直接插入3\#页

![在这里插入图片描述][0d419fdc5d0b4876ba14306dd1c31540.png]

上述这种现象，就是发生了“页合并”。

##### 索引设计原则 #####

*  满足业务需求的情况下，尽量降低主键的长度。
 *  插入数据时，尽量选择顺序插入，选择使用auto\_increment自增主键。
 *  尽量不要使用UUID做主键或者是其他自然主键，如身份证号。
 *  业务操作时，避免对主键的修改。

#### order by 优化 ####

##### MySQL的排序，有两种方式： #####

*  Using filesort：通过表的索引或全表扫描，读取满足条件的数据行，然后在排序缓冲区sort buffer中完成排序操作，所有不是通过索引直接返回排序结果的排序都叫 FileSort 排序。
 *  Using index：通过有序索引顺序扫描直接返回有序数据，这种情况即为 using index，不需要额外排序，操作效率高。

对于以上的两种排序方式，Using index的性能高，而Using filesort的性能低，我们在优化排序操作时，尽量要优化为 Using index。

##### order by优化原则: #####

*  根据排序字段建立合适的索引，多字段排序时，也遵循最左前缀法则。
 *  尽量使用覆盖索引。
 *  多字段排序, 一个升序一个降序，此时需要注意联合索引在创建时的规则（ASC/DESC）。

-- 按年龄升序排列，年龄相同时按手机号降序排列
    create index idx_user_age_phone_ad on tb_user(age asc ,phone desc);

*  如果不可避免的出现filesort，大数据量排序时，可以适当增大排序缓冲区大小sort\_buffer\_size(默认256k)。

#### group by 优化 ####

在分组操作中，我们需要通过以下两点进行优化，以提升性能：

*  在分组操作时，可以通过索引来提高效率。
 *  分组操作时，索引的使用也是满足最左前缀法则的。

#### limit 优化 ####

在数据量比较大时，如果进行limit分页查询，在查询时，越往后，分页查询效率越低。这就是分页查询的问题所在。

例如，当在进行分页查询时，如果执行 limit 2000000,10 ，此时需要MySQL排序前2000010 记录，仅仅返回 2000000 - 2000010 的记录，其他记录丢弃，查询排序的代价非常大 。

优化思路：一般分页查询时，通过创建 覆盖索引 能够比较好地提高性能，可以通过覆盖索引加子查询形式进行优化。

#### count 优化 ####

`select count(*) from tb_user ;` 如果数据量很大，在执行count操作时，是非常耗时的。

*  MyISAM 引擎把一个表的总行数存在了磁盘上，因此执行 count(\*) 的时候会直接返回这个数，效率很高； 但是如果是带条件的count，MyISAM也慢。
 *  InnoDB 引擎就麻烦了，它执行 count(\*) 的时候，需要把数据一行一行地从引擎里面读出来，然后累积计数。

如果说要大幅度提升InnoDB表的count效率，主要的优化思路：自己计数（可以借助于redis这样的数据库进行,但是如果是带条件的count又比较麻烦了）。

##### count用法 #####

count() 是一个聚合函数，对于返回的结果集，一行行地判断，如果 count 函数的参数不是NULL，累计值就加 1，否则不加，最后返回累计值。

用法：count（\*）、count（主键）、count（字段）、count（数字）

![在这里插入图片描述][f280b57679044931829486b285ad351e.png]

> 按照效率排序的话，count(字段) < count(主键 id) < count(1) ≈ count(\*)，所以尽量使用 count()。

#### update 优化 ####

尽量根据 主键/索引字段 进行数据更新

update course set name = 'javaEE' where id = 1 ;

当我们在执行这条SQL语句时，会锁定id为1这一行的数据，然后事务提交之后，行锁释放。

但是当我们在执行如下SQL时：

update course set name = 'SpringBoot' where name = 'PHP' ;

当我们开启多个事务，在执行上述的SQL时，我们发现行锁升级为了表锁。 导致该update语句的性能大大降低。

> InnoDB的行锁是针对索引加的锁，不是针对记录加的锁 ,并且该索引不能失效，否则会从行锁升级为表锁，一旦升级为表锁，并发性能就会降低。

但是当我们在执行如下SQL时：

update course set name = 'SpringBoot' where name = 'PHP' ;

当我们开启多个事务，在执行上述的SQL时，我们发现行锁升级为了表锁。 导致该update语句的性能大大降低。

> InnoDB的行锁是针对索引加的锁，不是针对记录加的锁 ,并且该索引不能失效，否则会从行锁升级为表锁，一旦升级为表锁，并发性能就会降低。

[035edf55ef754beb99468f0869c4a54a.png]: https://image.dandelioncloud.cn/pgy_files/images/2024/04/23/b0f4e3dc5974448cb301d5746b036ccc.png
[717f59fb93c04a669279a1c5800067d5.png]: https://image.dandelioncloud.cn/pgy_files/images/2024/04/23/cb67a805a187473da8bd6aafb2718dbb.png
[1940f9d07eab4e46b4c8d0a4be1f8d18.png]: https://image.dandelioncloud.cn/pgy_files/images/2024/04/23/f7959810979e4833bd8cda9803e49e7b.png
[0e0d10de988e465183c764be527d2409.png]: https://image.dandelioncloud.cn/pgy_files/images/2024/04/23/3ebc9fc0eaed4b3787b8407a82bb7f34.png
[1a7d497a49414296acf188fd46a48ff5.png]: https://image.dandelioncloud.cn/pgy_files/images/2024/04/23/70c0776a4e3a4a5b9cefe55eb361e2f1.png
[85c320aef0474ac5af33ce74b07007ac.png]: https://image.dandelioncloud.cn/pgy_files/images/2024/04/23/ea7004f8a0374048ace8638d721b48be.png
[6176f5961e6341f39b3cddd782cdcf5f.png]: https://image.dandelioncloud.cn/pgy_files/images/2024/04/23/cf18bb2829b043de82cf63e47cd6260b.png
[5271206699794258872ebf4a38222f2c.png]: https://image.dandelioncloud.cn/pgy_files/images/2024/04/23/3c14711d4f124cf7830ed201fcca71d9.png
[e9b0241807444a31a34ab3b0e0aceb94.png]: https://image.dandelioncloud.cn/pgy_files/images/2024/04/23/e838a20cfce74faf8fd24c11175b92cd.png
[c256068a6e4c471dab57615450c8d59f.png]: https://image.dandelioncloud.cn/pgy_files/images/2024/04/23/a242a3f747d643be946f3b79f7e3b747.png
[6ce56e244e2041138f95427a353e4deb.png]: https://image.dandelioncloud.cn/pgy_files/images/2024/04/23/3a3efc89b3d4459c81b5762d90252bf2.png
[cb8ee709615045298c8dabedccde3ecb.png]: https://image.dandelioncloud.cn/pgy_files/images/2024/04/23/bae58ccf033a4b818ec681fe85a6633b.png
[dad49d78e2a14d559b392c2d88509ff7.png]: https://image.dandelioncloud.cn/pgy_files/images/2024/04/23/710d80844eaf4315a4edde3f254a74e8.png
[b02f3ac1101b474ba191e0a66c2c9339.png]: https://image.dandelioncloud.cn/pgy_files/images/2024/04/23/f74c642c5af642b9bfa99d746b8f03bc.png
[01d9772e83e74b96b91104c041c5f87f.png]: https://image.dandelioncloud.cn/pgy_files/images/2024/04/23/c1c4cd59d25d411f832c846673375741.png
[293611d509c245f4860a51cf8d412cdb.png]: https://image.dandelioncloud.cn/pgy_files/images/2024/04/23/38b0aa5834484994b739cce774ee470f.png
[d73428d6c4cc47c9b0662dd35d6f9561.png]: https://image.dandelioncloud.cn/pgy_files/images/2024/04/23/8b1c5b47aa90420dacbac53d0ed68d82.png
[0d419fdc5d0b4876ba14306dd1c31540.png]: https://image.dandelioncloud.cn/pgy_files/images/2024/04/23/25a71c2e3a7a49b4bae7af331bc00e33.png
[f280b57679044931829486b285ad351e.png]: https://image.dandelioncloud.cn/pgy_files/images/2024/04/23/dc2542b4ca364b4dad533ea4b56aaa35.png