• MS SQLSERVER 数据库表存储结构


    实际上最重要的数据库对象的存储结构来之于两张SQLServer支持的系统视图,即sys.partitions和sys.allocation_units,还有一张SQLServer尚未公开支持的系统视图sys.system_internals_allocation_units。

      Sys.partitions视图,数据库中所有表和索引的每个分区在表中各对应一行;因此可以理解为与sys.indexes为一对多的关系,完全取决于表和索引的分区数。该视图结构如下:

    序号 列名 说明
    1 partition_id 分区的 ID。在数据库中是唯一的。
    2 object_id 此分区所属的对象的 ID。每个表或视图都至少包含一个分区。
    3 index_id 此分区所属的对象内的索引的 ID。
    4 partition_number 所属索引或堆中的从 1 开始的分区号。对于未分区的表和索引,此列的值为 1。
    5 hobt_id 包含此分区的行的数据堆或 B 树的 ID。
    6 rows 此分区中的大约行数。
    7 database_fragment_id 标识为仅供参考。不提供支持。不保证以后的兼容性。
    8 data_compression 指示每个分区的压缩状态:
    0 = NONE
    1 = ROW
    2 = PAGE
     
    9 data_compression_desc 指示每个分区的压缩状态。可能的值为 NONE、ROW 和 PAGE

      sys.allocation_units视图,数据库中的每个分配单元都在表中占一行;一个表可有4种分配单元类型:已删除、行内数据、LOB数据、行溢出数据,这取决于表的结构和行数据分布情况;同时如sys.partitions视图所述,表和索引又可能包括若干分区;因此一个表的分配单元数量=表和索引情况*分区数*包含的分配单元类型;sys.allocation_units与sys.partitions也是一对多的关系。

      同时分配单元视图中还包括了该分配单元所分配、已使用和数据使用的页面数量。

    序号 列名 说明
    1 allocation_unit_id 分配单元的 ID。在数据库中是唯一的。
    2 type 分配单元的类型:
    0 = 已删除
    1 = 行内数据(所有数据类型,但 LOB 数据类型除外)
    2 = 大型对象 (LOB) 数据
    3 = 行溢出数据
     
    3 type_desc 对分配单元类型的说明:
    DROPPED
    IN_ROW_DATA
    LOB_DATA
    ROW_OVERFLOW_DATA
     
    4 container_id 与分配单元关联的存储容器的 ID。
    如果 type = 1 或 3,
    则 container_id = sys.partitions.hobt_id。
    如果 type 为 2,
    则 container_id = sys.partitions.partition_id。
    0 = 标记为要延迟删除的分配单元
     
    5 data_space_id 该分配单元所在文件组的 ID。
    6 total_pages 该分配单元分配或保留的总页数。
    7 used_pages 实际使用的总页数。
    8 data_pages 包含下列数据的已使用页的数目:
    行内数据
    LOB 数据
    行溢出数据
    返回的值排除了内部索引页和分配管理页。
     
    9 database_fragment_id 标识为仅供参考。不提供支持。不保证以后的兼容性

      sys.system_internals_allocation_units视图,用法与sys.allocation_units完全一样,不过在sys.allocation_units的基础上增加了对分配单元的跟踪管理的页面地址信息,关于first_page,root_page,first_iam_page的概念,会在后续的章节中介绍。

    序号 列名 说明
    1 allocation_unit_id 同sys.allocation_units
    2 type 同sys.allocation_units
    3 type_desc 同sys.allocation_units
    4 container_id 同sys.allocation_units
    5 filegroup_id 同sys.allocation_units
    6 total_pages 同sys.allocation_units
    7 used_pages 同sys.allocation_units
    8 data_pages 同sys.allocation_units
    9 first_page 首页的地址(文件号+页号)
    10 root_page 索引根节点的地址(文件号+页号)
    11 first_iam_page Iam页的地址(文件号+页号)

    附带查询数据库表结构实例SQL:

    select object_schema_name(p.[object_id])+'.'+object_name(p.[object_id]) obj_name,
    sum(a.total_pages)*8 [total(KB)],
    sum(a.used_pages)*8 [used(KB)]
    from sys.partitions p join sys.allocation_units a
    on (a.[type]=2 and p.partition_id=a.container_id)
    or (a.[type] in (1,3) and p.hobt_id=a.container_id)
    group by object_schema_name(p.[object_id])+'.'+object_name(p.[object_id])
    order by 3 desc 

    --语句分析:

    --系统视图1:sys.partitions
    --数据库中所有表和索引的每个分区在表中各对应一行;因此可以理解为与sys.indexes为一对多的关系,完全取决于表和索引的分区数
    --系统视图2:sys.allocation_units
    --数据库中的每个分配单元都在表中占一行;一个表可有4种分配单元类型:已删除、行内数据、LOB数据、行溢出数据,
    --这取决于表的结构和行数据分布情况;同时如sys.partitions视图所述,表和索引又可能包括若干分区;
    --因此一个表的分配单元数量=表和索引情况*分区数*包含的分配单元类型;sys.allocation_units与sys.partitions也是一对多的关系。
    --同时分配单元视图中还包括了该分配单元所分配、已使用和数据使用的页面数量

    --object_schema_name 项目架构名称(object_schema_name(p.[object_id])-此例为当前id的项目名称dbo)
    --object_name 项目名称(object_name(p.[object_id])-此例为当前id的表名称)
    --object_id  此分区所属的对象的 ID。每个表或视图都至少包含一个分区
    --total_pages 该分配单元分配或保留的总页数。
    --used_pages 实际使用的总页数。

  • 相关阅读:
    HDFS snapshot操作实战
    不是技术牛人,如何拿到国内IT巨头的Offer(转载)
    HBase的RowKey设计原则
    hbase shell 基本命令总结
    13_Python数据类型字符串加强_Python编程之路
    监督学习与无监督学习的区别_机器学习
    12_Python的(匿名函数)Lambda表达式_Python编程之路
    Python数据挖掘_Python2模块Spynner的安装(安装失败)
    06_Linux目录文件操作命令3查找命令_我的Linux之路
    python数据挖掘_Json结构分析
  • 原文地址:https://www.cnblogs.com/anuoruibo/p/2957019.html
Copyright © 2020-2023  润新知