MySQL学习笔记(三):关于索引(一)

在MySQL中,索引的使用非常重要。当你的数据量小的时候,可以不需要考虑索引,甚至使用了索引之后不但占用了更多空间,还会使CURD操作都变慢了;但是当你的数据量逐渐增多时,哪怕只是千、万级的数据,使用适当的索引都能帮助你的接口的性能提升一个台阶。

如果把我们的数据库比作一个字典,那么索引就是字典前面的目录。当你的数据量小的时候,在其中进行查找操作可能还比较轻松;但是现象一下,如果你需要在一本没有目录的新华字典里面找一个字,那得是多么可怕的操作。

通过上面那个简单的例子,大家应该能够理解索引的重要性。使用了索引就像是把一个原本杂乱无章的字典,按照一定的顺序进行重编排,生成一份有顺序的副本,下次当我们需要查找数据的时候,就能够按照这些顺序进行快速地查找了。

不过,索引也是有代价的。如果原先的数据是杂乱无章的字典,此时对这本字典添加了一个拼音索引,那么就相当于产生了一本新的字典(副本);如果再添加一个笔画索引,那么就又产生了一本按笔画排序的新的字典。

这时候,索引的缺点就体现出来了:
1、需要占额外的空间,拿空间换时间
2、虽然提高了查找操作的效率,但是也降低了增删改操作的效率。(需要对多个副本同时更新)

由此可见,索引是一把双刃剑,在为我们提供便捷地同时,也可能产生额外的负担,那么如何恰当地使用索引,就显得尤为重要了。在我们正式学习如何使用索引之前,还需要了解一些索引的基础知识:

1、常用的索引结构有两种:BTree 索引和 Hash 索引。BTree 索引的适用场景更广,不过效率不如Hash索引,在MySQL数据库中,一般以BTree作为默认索引结构(两者的具体区别和具体实现等,就得深入到数据结构和算法了,以后有需要再去学习吧!)

2、索引的不是无限制的,一个表里索引的数量限制为 16 个,并且总索引长度限制为 256 个字节,一个索引最多可以包含 16 列。(不同的引擎不一样)

3、不是所有操作都能够使用索引,只有查询操作(SELECT)中的 WHERE、ORDER BY、GROUP BY 和 JOIN,以及SUM、AVG等函数能够使用。

4、遵从最左匹配原则:当索引为多列时即联合索引,比如建立了联合索引(A, B, C),则相当于建立了三个索引(A)、(A, B)和(A, B, C),但是在查询时必须从索引的最左列开始。所以我们在建立联合索引和进行查询操作时,都需要将最频繁查询的字段放在最左侧。

//比如以下的查询能够使用索引
select * from table where A='a';
select * from table where A='a' and B='b';
select * from table where A='a' and B='b' and C='c';
//但是以下查询就不能够使用索引
select * from table where B='b';
select * from table where A='a' and C='c';

接下来就可以正式地学习如何使用索引了。首先,我们常用的索引有三类:普通索引、主键索引、唯一索引。

普通索引需要实现的功能很简单,即加快查询数据的速度。
唯一索引在加快查询速度的同时还要求列的值唯一(可以有一个NULL)。
主键索引是唯一索引的特殊类型,在指定表的主键时会自动创建。与唯一索引的区别是,主键索引在一个表中只能有一个,且主健不可为NULL,唯一索引可以。

除了以上经常用到的索引之外,还有几种别的索引:
SPATIAL 空间索引——主要用于地理空间数据类型,比如GEOMETRY。
FULLTEXT 全文索引——用于CHAR、TEXT等字符串类型的全文检索。

我们在一般的开发中,通常有两种使用索引的方式,一种是直接添加一个单列的索引,另一种是添加多列的索引,即组合索引(或称联合索引)。组合索引的查询效率要远大于单独使用的索引,但是能够使用的场景较少,且占用的空间要远大于单个索引。

不知不觉就已经写了这么多了,却还没有说到如何去正确地使用索引,看来索引在数据库中的分量还是不少的,而且我相信大多数人应该都和我差不多,只是对它略知一二,还远远谈不上真正的会用。关于如何正确使用索引,还是留到下一篇博文吧。

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注