聚簇索引与非聚簇索引的区别以及SQL Server查询优化技术

# re: 聚簇索引与非聚簇索引的区别以及SQL Server查询优化技术 2004-07-20 12:37 progame

非聚簇对于更新肯定是有优势的
而它在检索的性能损失也不会太大

所以能不用聚簇当然是最好的了
但是如果使用\order by的话　
聚簇的优势也应该是很明显的

楼主可以测试一下这方面的数据回复更多评论

# re: 聚簇索引与非聚簇索引的区别以及SQL Server查询优化技术 2004-07-20 12:41 progame

楼主的随笔中第二条论述说
非聚簇索引在排序上不输给聚簇索引多少

可是我记得，在数据库查询优化中有这样一个原则：
尽量避免在sql语句中使用order by

那么对于聚簇索引的话，我不需要order by，但我却得到了已经排序的结果，这其中的性能差异又有多大呢？回复更多评论

# re: 聚簇索引与非聚簇索引的区别以及SQL Server查询优化技术 2004-07-20 14:43 吕震宇

“对于聚簇索引的话，我不需要order by，但我却得到了已经排序的结果”对于这句话我想未必。微软从来没有保证过使用聚簇索引的查询一定按照聚簇索引的顺序。不要忘了，SQL Server支持文件组，当一个数据库表跨两个文件甚至更多文件时，你觉得结果会不会按聚簇索引顺序输出呢？
回复更多评论

# re: 聚簇索引与非聚簇索引的区别以及SQL Server查询优化技术 2004-07-20 15:28 吕震宇

还有一点在文中忘提到了，那就是复合查询。比如SELECT * FROM tabTest WHERE ID<100 AND unqValue >=...，检索条件涉及了ID与unqValue两个字段，那么如何利用索引呢？先过滤unqValue还是先过滤ID？非聚簇索引能够起到什么效果？所有这些就需要根据统计信息（数据密度、数据分布等）进行估算了。到那个时候，有可能非聚簇索引带来的效率提升比聚簇索引还要高。回复更多评论

# re: 聚簇索引与非聚簇索引的区别以及SQL Server查询优化技术 2005-01-27 13:34 hhh

关于：三、聚簇索引与非聚簇索引的本质区别
执行插入操作时
对于非聚簇索引，只需要检索20个页面中的16000个节点就知道是否有重复
但对于聚簇索引，索引节点仅仅包含了8000个中间节点，至于会不会出现重复必须检索另外8000个页数据节点才知道，那么相当于检索10+1000=1010个页面才知道是否有重复。

这段不懂，前面不是说“聚簇索引的叶节点就是数据节点”，怎么现在反倒聚簇索引还必须检索另外8000个页呢？回复更多评论

# re: 聚簇索引与非聚簇索引的区别以及SQL Server查询优化技术 2005-01-28 13:34 吕震宇

@hhh

对不起，我文章中的数字写错了。应当是“至于会不会出现重复必须检索另外1000个页数据节点才知道”。因为聚簇索引的页节点是数据节点。要想知道是否有重复，只有检索页节点才知道。所以聚簇索引的中间节点占10个页面，数据节点占1000个页面，共1010个页面。回复更多评论

# 其实我疑惑的倒不是1000或者8000个页节点 2005-01-31 11:40 hhh

我想了解的是,为什么
"对于非聚簇索引，只需要检索20个页面中的16000个节点就知道是否有重复，因为所有主键键值在这16000个索引节点中都包含了。但对于聚簇索引，索引节点仅仅包含了8000个中间节点，至于会不会出现重复必须检索另外1000个页数据节点才知道"

请问,聚簇索引不包含所有的主键键值吗?包含8000个中间节点有什么意义呢回复更多评论

# re: 聚簇索引与非聚簇索引的区别以及SQL Server查询优化技术 2005-02-01 15:21 吕震宇

@hhh

其实要想实际计算出访问多少个页面是很困难的事情，所以只能比喻一下。究竟访问多少个页面是个未知数。

记得当时学FOXBASE时，老师说，你可以将索引文件认为就是一张表，只是这张表中仅包含的索引关键字的值以及记录号两列。关于这点，可以参考http://www2.cnblogs.com/zhenyulu/articles/28418.html，《从Visual FoxPro中的记录号与逻辑删除谈起...》。比如说，我要找学号为100的记录是否存在于表中，我们不必去访问表，仅仅访问一下索引文件就行了。磁盘IO将大大减少。SQL Server的索引道理是一样的。

由于非聚簇索引中包含了所有主键的值（也叫做索引覆盖查询），所以当我们要找学号是100的人是否在表中，我们没有必要去访问数据页面，仅仅访问索引页面就OK了。因为非聚簇索引的索引页面包含了所有表中关键字段的值。

但对于聚簇索引就不一样了，要想知道学号为100的学生是否在数据库中，必须访问数据页面才行，因为聚簇索引的叶节点是数据节点。这样IO访问两就增大了不少。

在本文开始的两张图中，如果问Ota这个人是否在数据库中，你找找试试，看看哪个需要访问数据页面，哪个不需要，再算一下哪个的IO访问量会大一些。回复更多评论

# re: 我了解了 2005-02-02 08:21 hhh

忽然茅塞顿开,我明白了,楼主真强,了解的如此深入,而且对于我们这种初级问题还回答这么细致,不顶不行啊:) 回复更多评论

# re: 聚簇索引与非聚簇索引的区别以及SQL Server查询优化技术 2005-03-01 12:36 无情的雨

大家可以看看B-Tree,234Tree,理解后继续发言[从数据结构了解本质] 回复更多评论

# re: 聚簇索引与非聚簇索引的区别以及SQL Server查询优化技术 2005-06-09 13:15 dragonpro

我一定要搞得清清楚楚

非聚集索引在定位数据时不会依靠主键吧回复更多评论

# re: 聚簇索引与非聚簇索引的区别以及SQL Server查询优化技术 2005-06-14 07:47 我只能向您说声谢谢

我只能向您说声谢谢！
以后能否多讲些关于DAO.NET和SQL SERVER 回复更多评论

# 聚簇索引与非聚簇索引的区别以及SQL Server查询优化技术 2005-06-14 07:52 我只能向您说声谢谢

我只能向您说声谢谢！您真的好极了。
以后能否多讲些关于ADO.NET和SQL SERVER 回复更多评论

# re: 聚簇索引与非聚簇索引的区别以及SQL Server查询优化技术 2005-06-19 04:27 wuw

完全不懂B+树，完全不懂聚簇索引为什么放在树上。

比较中完全忽略了索引的基本结构——树，仅仅把他们当作两个顺序的集合，真是误人子弟。回复更多评论

# re: 聚簇索引与非聚簇索引的区别以及SQL Server查询优化技术 2005-06-19 04:48 wuw

“现在我们要从一个有8000条记录的表中检索符合某个条件的记录，如果没有索引的话，我们可能需要遍历8000条×1000字节/8K字节=1000个页面才能够找到结果。如果在检索字段上有上述索引的话，那么我们可以在8000条×10字节/8K字节=10个页面中就检索到满足条件的索引块”

假设每100多个索引为一组，那么顺着B+树搜索8000个记录中的一个只需要两次取得索引组，即使他们都在不同磁盘块上也只需要两次读磁盘。而楼主竟计算出10次。由于楼主完全忽略b+树结构，所以那些比较完全是胡乱解释。回复更多评论

# re: 聚簇索引与非聚簇索引的区别以及SQL Server查询优化技术 2005-07-19 10:59 一个拙劣的程序员

对楼主的水平有很大的怀疑！！！

“
记得当时学FOXBASE时，老师说，你可以将索引文件认为就是一张表，只是这张表中仅包含的索引关键字的值以及记录号两列。关于这点，可以参考http://www2.cnblogs.com/zhenyulu/articles/28418.html，《从Visual FoxPro中的记录号与逻辑删除谈起...》。比如说，我要找学号为100的记录是否存在于表中，我们不必去访问表，仅仅访问一下索引文件就行了。磁盘IO将大大减少。SQL Server的索引道理是一样的。

由于非聚簇索引中包含了所有主键的值（也叫做索引覆盖查询），所以当我们要找学号是100的人是否在表中，我们没有必要去访问数据页面，仅仅访问索引页面就OK了。因为非聚簇索引的索引页面包含了所有表中关键字段的值。

但对于聚簇索引就不一样了，要想知道学号为100的学生是否在数据库中，必须访问数据页面才行，因为聚簇索引的叶节点是数据节点。这样IO访问两就增大了不少。
”

1、如果对于聚簇索引，要想知道学号为100的学生是否在数据库中，就必须要访问数据页面才行的话。那么请问聚簇索引中是否记录着学号“100”和这条对应记录的地址呢？那么既然聚簇索引中都已经记录着学号“100”了，那为什么还要去访问数据页面才能知道是否有这个学生在数据库中呢？真是乱弹琴！

2、“由于非聚簇索引中包含了所有主键的值（也叫做索引覆盖查询）”！索引覆盖查询是这个意思吗！？严重吐血！！！

回复更多评论

# re: 聚簇索引与非聚簇索引的区别以及SQL Server查询优化技术 2005-07-20 19:17 求索者

首先感谢楼主无私的把自己的见解写出来，给后学者参考。
我感到困惑的内容其实与hhh提的内容差不多，只是他豁然开朗了，我还没明白。
假如利用聚簇索引检索，每次还要到另外的1000个页中去检索一遍，那效率跟不建索引有什么区别啊，数据库还辛辛苦苦将物理顺序按照聚簇索引排序了一把，难道是数据库设计者脑袋出了问题。
我觉得“索引的叶节点就是数据节点。而非聚簇索引的叶节点仍然是索引节点，只不过有一个指针指向对应的数据块”这句话这样理解是否更好一点啊。因为数据库中的记录已经按聚簇索引排好了序，所以聚簇索引叶节点只需要记录数据，至于它在数据库中的实际位置，可以按记录序号*记录长度+文件头地址，就如你在《从Visual FoxPro中的记录号与逻辑删除谈起...》中说的那样。而非聚簇索引就必须再加上数据对应地址才能真正确定位置。回复更多评论

# re: 聚簇索引与非聚簇索引的区别以及SQL Server查询优化技术 2005-07-23 18:01 吕震宇

@一个拙劣的程序员

关于你提出的第一个问题，你可以从本文第二个图中找找Ota是否在数据库中就知道是否要访问数据页面了。

关于你的第二个问题，我想是我的笔误，这可以我从后面的话推出“因为非聚簇索引的索引页面包含了所有表中关键字段的值”。我这里将关键字段误写成了主键，很严重的错误。这里的关键字（Key Words）指要查询的字段。回复更多评论

# 怎么样对uniqueidentifier数据类型的列进行优化呢？ 2005-07-25 17:29 两极狼

因为对uniqueidentifier来说，当数据量很大时，对它的查询将变得很慢，这时该如何实现对它的优化呢？？？

望高手指点回复更多评论

# re: 聚簇索引与非聚簇索引的区别以及SQL Server查询优化技术 2005-12-01 03:52 三水

其实楼主解释的很不错了,简单易懂,如果大家学了数据结构很快就能理解大概意思,自己再加工就行了,不必对楼主的笔误纠缠不休~ 回复更多评论

# re: 聚簇索引与非聚簇索引的区别以及SQL Server查询优化技术 2006-02-10 22:46 编程爱好者

严重支持吕老师~~
您写得'相当'之好啊:)
呵,套用了宋丹丹的'相当'
一词回复更多评论

# re: 聚簇索引与非聚簇索引的区别以及SQL Server查询优化技术 2006-03-23 03:52 素食

如果对于聚簇索引，要想知道学号为100的学生是否在数据库中，就必须要访问数据页面才行的话。那么请问聚簇索引中是否记录着学号“100”和这条对应记录的地址呢？那么既然聚簇索引中都已经记录着学号“100”了，那为什么还要去访问数据页面才能知道是否有这个学生在数据库中呢？真是乱弹琴！

答： [记录着学号“100”]这句话要格外的留意，因为混淆了2个概念，其一fox溪流数据存储方式中的行号对应于目前大型关系型数据库的oid （这个东西在sql server里被微软给藏起来了也很少有人知道，但是其他很多尤其开源的数据库都有这个东西的）
[聚簇索引中都已经记录着学号“100”]这句话重点是 '聚簇索引'是文件数据页面是runtime时候用于访问聚簇索引文件的数据部分当然了这部分内容多的时候也会在内存和磁盘上同时存在

说实话我特别想和微软说的就是"把oid还给我好么" 因为10多年前我fox ，5年前我posetgres都有这东西啊，不过没办法估计他们不会满足我这个过分的要求的 It's Unsafe 我替他们回答
回复更多评论

# re: 聚簇索引与非聚簇索引的区别以及SQL Server查询优化技术 2006-05-23 10:46 小刀

写的这么好还要被人说，唉~~~

吕老师也是人自然有疏忽的地方，而且SQL Server又不是他设计的，有点小错

误也是正常的，谈不上“误人子弟”这么严重。

我觉得技术交流应该心平气和，以切磋、相互提高为目的，正说n楼所说：“不必对楼主的笔误纠缠不休” 回复更多评论

# re: 聚簇索引与非聚簇索引的区别以及SQL Server查询优化技术 2006-07-23 23:30 SSWSD

"“现在我们要从一个有8000条记录的表中检索符合某个条件的记录，如果没有索引的话，我们可能需要遍历8000条×1000字节/8K字节=1000个页面才能够找到结果。如果在检索字段上有上述索引的话，那么我们可以在8000条×10字节/8K字节=10个页面中就检索到满足条件的索引块”

假设每100多个索引为一组，那么顺着B+树搜索8000个记录中的一个只需要两次取得索引组，即使他们都在不同磁盘块上也只需要两次读磁盘。而楼主竟计算出10次。由于楼主完全忽略b+树结构，所以那些比较完全是胡乱解释。"
楼住年怎么解释啊

回复更多评论

# re: 聚簇索引与非聚簇索引的区别以及SQL Server查询优化技术 2006-08-01 09:50 姓名

@SSWSD
这是一个大问题，既然谈到了B+tree索引，怎么能不考虑b+的基本查询原理？怎么会是全扫描？就是顺序表也可以用二分法，lnn/ln2的次数就可以了回复更多评论

# re: 聚簇索引与非聚簇索引的区别以及SQL Server查询优化技术 2006-08-11 16:15 wonder

个人感觉设不设索引...设什么索引...
应该要看实际的情况而定回复更多评论

# re: 聚簇索引与非聚簇索引的区别以及SQL Server查询优化技术 2006-08-11 16:16 wonder

建议大家看看这片文章:
http://www.cnblogs.com/fanrsh/archive/2006/06/27/436618.html 回复更多评论