6.1数据库索引优化

Btree索引和Hash索引

mysql的索引是在存储引擎层实现的，而不是在mysql的服务器中实现的，不同的存储引擎可能索引工作的方式是不同的，即使是同一种类型的索引，在不同的存储引擎上底层实现也不尽相同

Mysql支持的索引类型

B-tree索引：通常我们说的索引就是指它
Hash索引

B-tree索引的特点：

B-tree索引使用B+树来存储数据
B-tree索引能够加快数据的查询速度
B-tree索引更适合进行范围查找

提示：在B+树中，每一个叶子节点都包含指向下一个叶子节点的指针，方便进行叶子节点之间的遍历
B+树是一个平衡的查找树，没一个叶子到根部的距离相同
所有的记录节点都是按照键值大小顺序存放的
叶子节点之间是使用指针进行连接的
对于不同的存储引擎，具体实现可能有所不同，例如MyISAM存储在叶子节点中通过数据的物理位置来引用索引的行的，而InnoDB是通过主键来引用索引的行的
指针定义了子节点中值的上限和下限
叶子节点的指针指向的是被索引的数据，而不是其他叶子节点
在MyISAM存储引擎中，指针指向的是数据的物理地址；在InnoDB存储引擎中，指针指向的是主键

B树索引的应用场景

全值匹配的查询
字段name=“sophia”
匹配最左前缀的查询
字段name和字段age的联合索引
匹配列前缀查询
字段name like “soph%”
匹配范围值的查询
6< age <18
精确匹配左前列并范围匹配另外一列
只访问索引的查询

Btree索引的使用限制

使用索引命中的数据占用了表中的大部分数据时，mysql的查询优化器可能认为使用全表扫描比使用索引性能更高，所以即使你在查询的字段上使用了索引，也不会使用索引的方式来查询数据

如果不是按照索引最左列开始查找，则无法使用索引
使用索引时不能跳过索引中的列
Not in 和 <> 操作无法使用索引
如果查询中有某个列的范围查询，则其右边所有列都无法使用索引

Hash索引的特点

Hash索引是基于Hash表实现的，只有查询条件精确匹配Hash索引中的所有列时，才能够使用到Hash索引
对于Hash索引中的所有列，存储引擎都会为每一行计算一个Hash码，Hash索引中存储的就是Hash码

Hash索引的限制

Hash索引必须进行两次查找

使用Hash索引查找需要需要进行两次读取，Hash索引中包括的只是键值和Hash码以及对应的行的指针，索引中并没有保存字段的值，使用Hash索引时需要，通过Hash索引找到对应的行→通过行号读取行数据

Hash索引无法用于排序
Hash索引不支持部分索引查找也不支持范围查找，只支持全值匹配查找
Hash索引中Hash码的计算可能存在Hash冲突

为什么要使用索引

索引大大减少了存储引擎需要扫描的数据量（索引文件大小通常远远小于数据文件大小）
InnoDB发生一次IO以页（16kb）为单位的
B-tree索引可以帮助我们进行排序以避免使用临时表
B-tree索引可以把随机I/O变为顺序I/O

索引是不是越多越好

索引会增加写操作的成本
大多的索引会增加查询优化器的选择时间

Previous3.0基准测试 Next6.2安装演示数据库

Last updated 5 years ago