1、经过测试发现当聚集索引新建或者重建时,会按照逻辑顺序重新排列数据页和数据页内的数据行的物理顺序。
2、但修改表时,无论是聚集索引还是堆的数据页都是按自然顺序向后插入数据,页面上的偏移量可以证明。因为数据库的最小读取单元是页,所以页内的物理顺序无关紧要,只需要维护好页内数据的逻辑顺序。
聚集表中插入数据时会根据索引找到相应数据页进行自然顺序插入(内部填充因子,使得数据页保留一定的空闲空间),
如果数据页满,将分页(数据按一定比例挪到新数据页,插入行在挪动完毕后自然顺序插入。新页的物理顺序与逻辑顺序可能不一致)。
3、然后聚集索引的数据页和索引页的逻辑顺序会调整,可以通过dbcc page 的row offset array(slot array)证明。
4、基于以上理论,碎片的产生就合理了。因为是逻辑上的调整,所以当在表中插入数据时,可能或产生物理顺序与逻辑顺序不一致的页面。
5、基于第一点,当表的碎片大时,可以选择重建索引。
6、索引有重建和重组之分。碎片有外部碎片(数据在插入,更新等操作时,索引的逻辑顺序与物理顺序不一致)和内部碎片(由于页面拆分时产生,由填充因子控制)之分。
----------------------------------------------------
实验涉及到的命令:
DBCC IND ( { 'dbname' | dbid }, { 'objname' | objid }, { nonclustered indid | 1 | 0 | -1 | -2 } [, partition_number] )
获取页号,文件号,页数(每一条数据代表一页)
-- 1:显示所有分页的信息,包括IAM分页,数据分页,所有存在的LOB分页和行溢出页,索引分页
-- -1: 显示所有IAM、数据分页、及指定对象上全部索引的索引分页.
-- -2: 显示指定对象的所有IAM分页
--- nonclustered indid:显示所有的IAM、数据分页以及一个索引的索引分页信息
----------------------------------------------------------
属性说明:
46 --{'dbname'|dbid}表示数据库名或者数据库ID 47 -- 48 --{'objectname'|objectID}表示对象名或者对象ID 49 -- 50 --{nonclustered indid|1|0|-1|-2}表示显示行内数据分页及指定对象的行内IAM分页信息 51 -- 52 -- 1:显示所有分页的信息,包括IAM分页,数据分页,所有存在的LOB分页和行溢出页,索引分页 53 -- 54 -- -1: 显示所有IAM、数据分页、及指定对象上全部索引的索引分页. 55 -- 56 -- -2: 显示指定对象的所有IAM分页 57 -- 58 -- nonclustered indid:显示所有的IAM、数据分页以及一个索引的索引分页信息。 59 -- 60 -- {partition_number}->可选,为了与中的DBCC IND命令向前兼容.它指定了一个特定分区号,如果不指定,显示所有分区的信息。 --以下是DBCC IND命令输出结果的字段描述: 字段名称 字段描述 PageFID 页面文件的ID PagePID 页面编号 IAMFID 管理该页面的IAM页面所在的文件ID IAMPID 管理该页面的IAM页面编号 ObjectID 表对象ID IndexID 索引ID,0 代表堆, 1 代表聚集索引, 2-250 代表非聚集索引 大于250就是text或image字段 书本P18 PartitionNumber 表或索引所在的分区号码 PartitionID 包含该分页的分区ID iam_chain_type 该页所属分配单元类型;行内数据、行溢出数据或Lob数据 PageType 分页类型:1:数据页面;2:索引页面;3:Lob_mixed_page;4:Lob_tree_page;10:IAM页面 IndexLevel 索引层级,0 代表叶级别分页 ;>0 代表非叶级别层次; NULL 代表IAM分页 NextPageFID 本层下一个分页所在的文件ID NextPageFID 本层下一个分页ID PrevPageFID 本层上一个分页所在的文件ID PrevPageFID 本层上一个分页ID
--必须启用此表示才能查看page的详细情况
dbcc traceon(3604)
go
-------------------------------------------------
DBCC PAGE ( ['database name'|database id], file number, page number, print option = [0|1|2|3] )
获取页内行数据的偏移量
第一个参数是数据库名或数据库ID
第二个参数指定文件号
第二个参数指定页号
Print opt参数可选; 可以使用以下值:
0 默认值; 输出buffer header 和 page header信息
1 输出 buffer header, page header, 分别输出每行信息, 行偏移表
2 输出 buffer header, page header, 整页数据, 行偏移表
3 输出 buffer header, page header, 别输出每行信息, 行偏移表; 分别列出每列的值
----------------------------------------------------------------------
page属性说明:
PAGE HEADER部分,即该页面的前96个字节。 141 142 m_pageId = (1:106) 当前页面号码 143 144 m_headerVersion = 1 版本号,始终为1 145 146 m_type = 10 当前页面类型,m_type=1表示数据页面 10:IAM页 147 148 m_typeFlagBits = 0x0 数据页和索引页为4,其他页为0 149 150 m_level = 0 该页在索引页(B树)中的级数,0表示为叶子节点 151 152 m_flagBits = 0x0 页面标志 153 154 m_objId (AllocUnitId.idObj) = 277576027 对象id 表id 155 156 m_indexId (AllocUnitId.idInd) = 1 索引ID,0 代表堆, 1 代表聚集索引, 2-250 代表非聚集索引 大于250就是text或image字段 书本P18 157 158 Metadata: AllocUnitId = 299666199216128 储单元的ID,sys.allocation_units.allocation_unit_id 159 160 Metadata: PartitionId = 299666199216128 数据页所在的分区号,sys.partitions.partition_id 161 162 Metadata: IndexId = 1 跟m_indexId一样 对象的索引号,sys.objects.object_id&sys.indexes.index_id 163 164 Metadata: ObjectId = 277576027 跟m_objId 一样 该页面所属的对象的id,sys.objects.object_id 165 166 m_prevPage = (0:0) 该数据页的前一页面 167 168 m_nextPage = (0:0) 该数据页的后一页面 169 170 pminlen = 90 定长数据所占的字节数为90个字节 171 172 m_slotCnt = 2 页面中的数据的行数,每页2条记录 173 174 m_freeCnt = 6 页面中剩余的空间,还剩6字节的空间 176 m_freeData = 8182 页面空闲空间的位置在8182这个位置 一个页面8KB约等于8192字节 页面空闲空间的位置在8182 177 说明这个页面已经放不下数据了 179 m_reservedCnt = 0 活动事务释放的字节数
181 m_lsn = (6:524:11) 日志记录号
184 m_xactReserved = 0 最新加入到m_reservedCnt领域的字节数
187 m_xdesId = (0:0) 添加到m_reservedCnt的最近的事务id
190 m_ghostRecCnt = 0 幻影数据的行数
193 m_tornBits = 1 页的校验位或者被由数据库页面保护形式决定页面保护位取代
... 行偏移数组
8176-8177 slot7
672-8175 空余空间
7 (0x7) - 607 (0x25f) 607-671
6 (0x6) - 542 (0x21e) 542-606
5 (0x5) - 467 (0x1d3) 467-541
4 (0x4) - 388 (0x184) 388-466
3 (0x3) - 309 (0x135) 309-387
2 (0x2) - 236 (0xec) 236-308
1 (0x1) - 165 (0xa5) 165-235
0 (0x0) - 96 (0x60) 96-164
0-95 pageheader
DBCC 执行完毕。如果 DBCC 输出了错误信息,请与系统管理员联系。