MySQL组合索引与最左匹配原则详解

2023-08-25 20:53:04 210

前言

之前在网上看到过很多关于mysql联合索引最左前缀匹配的文章，自以为就了解了其原理，最近面试时和面试官交流，发现遗漏了些东西，这里自己整理一下这方面的内容。

什么时候创建组合索引?

当我们的where查询存在多个条件查询的时候，我们需要对查询的列创建组合索引

为什么不对没一列创建索引

减少开销
覆盖索引
效率高

减少开销：假如对col1、col2、col3创建组合索引，相当于创建了（col1）、（col1，col2）、（col1，col2，col3）3个索引
覆盖索引：假如查询SELECTcol1,col2,col3FROM表名，由于查询的字段存在索引页中，那么可以从索引中直接获取，而不需要回表查询

效率高：对col1、col2、col3三列分别创建索引，MySQL只会选择辨识度高的一列作为索引。假设有100w的数据，一个索引筛选出10%的数据，那么可以筛选出10w的数据；对于组合索引而言，可以筛选出100w*10%*10%*10%=1000条数据

最左匹配原则

假设我们创建（col1，col2，col3）这样的一个组合索引，那么相当于对col1列进行排序，也就是我们创建组合索引，以最左边的为准，只要查询条件中带有最左边的列，那么查询就会使用到索引

创建测试表

CREATETABLE`student`(
`id`int(11)NOTNULL,
`name`varchar(10)NOTNULL,
`age`int(11)NOTNULL,
PRIMARYKEY(`id`),
KEY`idx_id_name_age`(`id`,`name`,`age`)
)ENGINE=InnoDBDEFAULTCHARSET=utf8

填充100w测试数据

DROPPROCEDUREpro10;
CREATEPROCEDUREpro10()
BEGIN
	DECLAREiINT;
	DECLAREchar_strvarchar(100)DEFAULT'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789';
	DECLAREreturn_strvarchar(255)DEFAULT'';
	DECLAREageINT;
	SETi=1;
	WHILEi<5000000do
		SETreturn_str=substring(char_str,FLOOR(1+RAND()*62),8);
		SETi=i+1;
		SETage=FLOOR(RAND()*100);
		INSERTINTOstudent(id,name,age)values(i,return_str,age);
	ENDWHILE;
END;

CALLpro10();

场景测试

EXPLAINSELECT*FROMstudentWHEREid=2;

可以看到该查询使用到了索引

EXPLAINSELECT*FROMstudentWHEREid=2ANDname='defghijk';

可以看到该查询使用到了索引

EXPLAINSELECT*FROMstudentWHEREid=2ANDname='defghijk'andage=8;

可以看到该查询使用到了索引

EXPLAINSELECT*FROMstudentWHEREid=2ANDage=8;

可以看到该查询使用到了索引

EXPLAINSELECT*FROMstudentWHEREname='defghijk'ANDage=8;

可以看到该查询没有使用到索引，类型为index，查询行数为4989449，几乎进行了全表扫描，由于组合索引只针对最左边的列进行了排序，对于name、age只能进行全部扫描

EXPLAINSELECT*FROMstudentWHEREname='defghijk'ANDid=2;

EXPLAINSELECT*FROMstudentWHEREage=8ANDid=2;

EXPLAINSELECT*FROMstudentWHEREname='defghijk'andage=8ANDid=2;

可以看到如上查询也使用到了索引，id放前面和放后面查询到的结果是一样的，MySQL会找出执行效率最高的一种查询方式，就是先根据id进行查询

总结

如上测试，可以看到只要查询条件的列中包含组合索引最左边的那一列，不管该列在查询条件中的位置，都会使用索引进行查询。

好了，以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，谢谢大家对毛票票的支持。

MySQL组合索引与最左匹配原则详解

热门推荐

随机推荐