MYSQL学习笔记之选错索引
声明:本文章内容是根据极客时间中林晓斌的课程《MYSQL45讲》,经过学习,加以自己的理解形成的笔记。具体原文可以到官网进行阅读。如有侵权请,告知删除。
优化器
优化器的目的是选择索引。他会根据自己内部的判断,从而选择一个最优的执行方案。而判断是一个因素就是扫描行数,越少的扫描行数,就说明访问磁盘的数据次数越少,消耗的CPU资源也就越少。
1.扫描行数如何判断
MYSQL开始执行之前,并不能知道,满足这个条件的记录有多少,而只能采用统计的方法,进行预估。这个统计的结果就是索引的区分度。
索引区分度(基数)的统计机制:InnoDB 默认会选择 N 个数据页,统计这些页面上的不同值,得到一个平均值,然后乘以这个索引的页面数,就得到了这个索引的基数
在 MySQL 中,有两种存储索引统计的方式,可以通过设置参数 innodb_stats_persistent 的值来选择:设置为 on 的时候,表示统计信息会持久化存储。这时,
默认的 N 是 20,M 是 10。
设置为 off 的时候,表示统计信息只存储在内存中。这时,默认的 N 是 8,M 是 16。
这种统计方法很容易造成不准确。但是如果相差太大 可以采用 修正统计的方式 进行补救,也会有一定的改善
analyze table t
2.优化器误判
就算统计信息相对准确,优化器还是可能会误判。这个时候的解决方法:
- sql语法的变更,引导使用正确的索引
- 直接使用 force index 强制使用索引
- 直接删除,影响判断的索引
还没有评论,来说两句吧...