数据库索引的优化

发布时间：2021-04-22 10:35:12 所属栏目：评论来源：互联网

导读：我们可以看到优化器的位置。在SQL语句能够被真正执行之前，优化器必须首先确定如何访问数据。比如mysql会解析查询并创建解析树，然后对其进行各种优化，包括决定选择合适的索引，决定表的读取顺序。而谓词表达式是索引设计的主要入手点。如果一个索引能

我们可以看到优化器的位置。

在SQL语句能够被真正执行之前，优化器必须首先确定如何访问数据。比如mysql会解析查询并创建解析树，然后对其进行各种优化，包括决定选择合适的索引，决定表的读取顺序。

而谓词表达式是索引设计的主要入手点。如果一个索引能够满足SELECT查询语句的所有谓词表达式，那么优化器就很有可能建立起一个高效的访问路径。

索引片及匹配列

如果索引时以B+树的形式组织的，如果有谓词表达

所以访问路径的成本很大程度上取决于这个索引片的厚度，也就是谓词表达式确定的值域范围。索引片越厚，需要扫描的索引页就越多，需要处理的索引记录也就越多，但最大的开销还是来自于增加的对表的同步读操作，每次表页读取的I/O操作可能需要10ms。相应的，索引片比较窄，就会减少对表的同步读取。

索引过滤及过滤列

并不是所有的索引列都能够定义索引片的大小。有时候，列可能既存在于WHERE子句中，也存在于索引中，但这个列却不能参与索引片的定义，举个例子。表上有一联合索引(A,B,C,D)，有如下sql语句：们需要确定WHERE子句中的谓词是否能够确定索引片大小：

首先我们看在WHERE子句中，该列是否至少有一个足够简单的谓词与之对应? 如果有，那么这个列就是匹配列。如果没有，那么这个列及其后面的索引列都是非匹配列。
如果该谓词是一个范围谓词，那么剩余的索引列都是非匹配列。
对于最后一个匹配列之后的索引列，如果拥有一个足够简单的谓词与其对应，那么该列为过滤列。根据这个方法，我们可以判断出列A出现在一个等值谓词中，这是一个足够简单的谓词，因此A是匹配列，列B是一个范围谓词，也是匹配列。而B后面的列C无法定义索引片(无法让索引片变得更窄)，但它依旧可以参与索引片的过滤过程。也就是说我们通过列A和列B定义了索引片的大小，而列C不能，但是在访问表之前，依旧可以通过列C来过滤记录，能够减少不必要的表访问。列C就属于过滤列，它和列A列B一样重要。

总结：

上述WHERE子句有两个匹配列，列A和列B，他们定义了扫描的索引片。除此之外还有一个列C作为过滤列。所以只有当一行同时满足这三个谓词时才会访问表中的数据。

如果列B的谓词表达式是等值谓词，那么这三个列都可以作为匹配列。

如果取消列A的谓词表达式，那么索引片段就是整个索引的大小，列B和列C都仅仅只能用来过滤。

过滤因子

过滤因子描述的谓词的选择性，即表中满足谓词条件的记录行数所占的比例，它主要依赖于列值的分布情况。

计算过滤因子的公式为：

结果集数量/表行的数量

比如我们的一张用户表里有SEX这个字段，当加入一个女性用户，SEX=‘F’的过滤因子就会变大。

如果男性在表中占70%，那么SEX='M'的过滤因子就是70%，SEX='F'的过滤因子为30%，SEX列的最差情况下过滤因子为70%，平均过滤因子为50%。

如果男女比例一比一，那么列SEX最差情况下的过滤因子和平均过滤因子都是50%。

（编辑：PHP编程网 - 黄冈站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!