西安弈聪浅谈SqlServer数据库的索引优化技巧

数据库索引，分为聚集索引(clustered index)和非聚集索引(nonclustered index)两种。

聚集索引，含有聚集索引的表，叫做聚集表，它的数据行的组织方式，是跟聚集索引的顺序是一致的。聚集索引覆盖的列，叫做聚集键。
用新华字典来比喻的话，正文的每一个字就是一个数据行，他们的组织顺序是根据拼音，如果拼音相同，就会根据笔画(不一定准确，见谅)，因此，新华字典里的聚集索引覆盖的列就是拼音和笔画。很容易理解的是，正文只能按照一种既定的顺序去排序，同理，在一张表里，只能有一个聚集索引，从而决定着数据行的组织方式。

聚集索引对查询性能影响非常大。聚集表中，非聚集索引是根据聚集键来定位的，而堆表中，非聚集索引是根据数据行号来定位的。这将有很大的性能区别，前者的性能大大优于后者。所以，建立合适的聚集索引，是非常必要的。一个好的建议是，使用小字段的且值唯一的列来建立索引，而且最好是单列，可以是代理键。因为如果字段太大太多，用来进行排序的开销将会很大，得不偿失;如果列值不唯一，数据库会为该重复值附加4字节的信息来标识重复值，增加了不必要的开销。

非聚集索引，用新华字典来比喻的话，就是字典正文之前的那些按拼音查找，按部首查找，按笔画查找的附录。它们描述了正文中的文字的排序位置，但是他们跟正文是分开的。非聚集索引，它跟数据的组织顺序是毫无关系的，它用一系列指针来指向数据行，从而来描述数据行的位置。

不含有聚集索引的表，叫做堆表，它的数据行组织顺序，是没有特定顺序的，类似于一堆书，增加一本书就放在这堆书的上面(在堆表中，具体实现方式可能不一样)。

通常，我们在创建表的时候会指定主键，如果不显式指定索引类型的话，将默认创建聚集索引。比如：add constraint pk_tbl primary key (sid)，将创建以sid为序的聚集索引。可以显式指定主键上的索引类型，比如，add constraint pk_tbl primary key nonclustered (sid)，将创建一个非聚集索引的主键。所以，在创建主键的时候，一定得小心了，有多主键的情况，要注意显式指定索引类型。索引能大幅度提高查询和排序性能，但是，在插入，删除，以及修改了主键的操作中，是需要维护索引顺序的。如果一张频繁变更的表，是不宜建立过多的索引的，索引带来的负面性能影响，将会得不偿失。

索引优化，是一个很考究的事情，它需要找到一个平衡点。一般来说，有以下几个建议来创建合适的索引：
聚集索引字段不能过多，最好是单字段，而且列值唯一;超过300行的数据表要创建索引(无视掉);如果查询中，查询的字段不多，可以考虑建立覆盖索引，将字段都包含在索引里，可以仅仅访问索引就能查询到所有数据，而不用表扫描。对于数据字段特别多的表，而且这些字段有很多出现在where中，不宜在每一个字段上建立单独的索引，而是创建组合索引。组合索引中，列的顺序是很讲究的，越是选择性大而且唯一的列要放在前面，这对查询优化器优化有很大的帮助。不宜在那些大量重复的列值上建立索引，比如在一个true，false的列上建索引，是毫无意义的。