6.1数据库索引优化

Btree索引和Hash索引

mysql的索引是在存储引擎层实现的,而不是在mysql的服务器中实现的,不同的存储引擎可能索引工作的方式是不同的,即使是同一种类型的索引,在不同的存储引擎上底层实现也不尽相同

Mysql支持的索引类型

  • B-tree索引:通常我们说的索引就是指它

  • Hash索引

B-tree索引的特点:

  • B-tree索引使用B+树来存储数据

  • B-tree索引能够加快数据的查询速度

  • B-tree索引更适合进行范围查找

提示:在B+树中,每一个叶子节点都包含指向下一个叶子节点的指针,方便进行叶子节点之间的遍历

B+树是一个平衡的查找树,没一个叶子到根部的距离相同

所有的记录节点都是按照键值大小顺序存放的

叶子节点之间是使用指针进行连接的

对于不同的存储引擎,具体实现可能有所不同,例如MyISAM存储在叶子节点中通过数据的物理位置来引用索引的行的,而InnoDB是通过主键来引用索引的行的

指针定义了子节点中值的上限和下限

叶子节点的指针指向的是被索引的数据,而不是其他叶子节点

在MyISAM存储引擎中,指针指向的是数据的物理地址;在InnoDB存储引擎中,指针指向的是主键

B树索引的应用场景

  • 全值匹配的查询

    字段name=“sophia”

  • 匹配最左前缀的查询

    字段name和字段age的联合索引

  • 匹配列前缀查询

    字段name like “soph%”

  • 匹配范围值的查询

    6< age <18

  • 精确匹配左前列并范围匹配另外一列

  • 只访问索引的查询

Btree索引的使用限制

使用索引命中的数据占用了表中的大部分数据时,mysql的查询优化器可能认为使用全表扫描比使用索引性能更高,所以即使你在查询的字段上使用了索引,也不会使用索引的方式来查询数据

  • 如果不是按照索引最左列开始查找,则无法使用索引

  • 使用索引时不能跳过索引中的列

  • Not in 和 <> 操作无法使用索引

  • 如果查询中有某个列的范围查询,则其右边所有列都无法使用索引

Hash索引的特点

  • Hash索引是基于Hash表实现的,只有查询条件精确匹配Hash索引中的所有列时,才能够使用到Hash索引

  • 对于Hash索引中的所有列,存储引擎都会为每一行计算一个Hash码,Hash索引中存储的就是Hash码

Hash索引的限制

  • Hash索引必须进行两次查找

使用Hash索引查找需要需要进行两次读取,Hash索引中包括的只是键值和Hash码以及对应的行的指针,索引中并没有保存字段的值,使用Hash索引时需要,通过Hash索引找到对应的行→通过行号读取行数据

  • Hash索引无法用于排序

  • Hash索引不支持部分索引查找也不支持范围查找,只支持全值匹配查找

  • Hash索引中Hash码的计算可能存在Hash冲突

为什么要使用索引

  • 索引大大减少了存储引擎需要扫描的数据量(索引文件大小通常远远小于数据文件大小)

    InnoDB发生一次IO以页(16kb)为单位的

  • B-tree索引可以帮助我们进行排序以避免使用临时表

  • B-tree索引可以把随机I/O变为顺序I/O

索引是不是越多越好

  • 索引会增加写操作的成本

  • 大多的索引会增加查询优化器的选择时间

Last updated

Was this helpful?