• 《Microsoft Sql server 2008 Internal》读书笔记第七章Special Storage(2)


    《Microsoft Sql server 2008 Interna》读书笔记订阅地址:
    http://www.cnblogs.com/downmoon/category/230397.html/rss

    《Microsoft Sql server 2008 Interna》索引目录:

    《Microsoft Sql server 2008 Internal》读书笔记--目录索引

    上文简单介绍了限制长度的Large Object Data存储形式,本文将介绍不限长度的Large Object Data存储形式。

    不限长度的大对象数据

     如果一个表包含老的数据类型如text/ntext/image等,默认的实际数据是没有存储在常规数据页,与行溢出数据类似,LOB也存储在自相关的页面中。对LOB列,SQL Server存储一个16字节的指针指向数据的实际页。不过,SQL Server允许你修改默认表选项,以使LOB数据存储在数据行中,只要数据足够小。注意只有表选项,没有数据库或服务器选项来设置。

     默认的LOB数据没有存储在数据行,数据行仅仅存储了16字节的指针。指针指向的页是8kb大小。一个text/ntext/image页可能存放来自多个列或多个行的数据,但必须来自同一个单表。

    这些组成LOB列的8KB页的集合并不需要位置相邻。页面在b树结构中是逻辑排序的。因此,操作LOB中间开始的部分效率最高。

    邀月工作室 

     如果LOB列的数据小于32kB,数据行的文本指针指向一个84字节的文本根结构,这构成了B树结构的根节点。这个根节点指向 text.ntext.image页。尽管LOB数据在b树结构中是逻辑排序,但是在根节点和所有的独立数据块中是在整个表的LOB页中物理扩展,且大小不定。如果数据小于64字节,将被存放在根结构中。

    如果大于32kb,SQL Server开始在根节点有和数据块之间建立一些中间节点,中间节点的数据页并不共享,即每个存储中间节点的页中仅仅包含一个数据行的某个text或image的列的中间节点。

    SQL Server能存储LOB根和LOB实际数据在两种不同类型的页。如果其中的一种,引用为Text_Mixed,允许来自多行的LOB数据共享同一个页。然而,一旦文本数据大于40KB,SQL Server开始将整个页投入到一个单个的LOB值。这个页被引用作Text_data页。

    我们看一个例子:

    IF EXISTS (SELECT * FROM sys.tables        
                
    WHERE name = 'textdata')
        
    DROP TABLE textdata;
    GO
    CREATE TABLE textdata
     (bigcol 
    text);
    GO
    INSERT INTO textdata
       
    SELECT REPLICATE(convert(varchar(MAX), 'a'), 38000);
    GO
    TRUNCATE TABLE sp_tablepages;
    GO
    INSERT INTO sp_tablepages
      
    EXEC('DBCC IND(testdb, textdata, -1)');
    GO
    SELECT PageFID, PagePID, ObjectID, IAM_chain_type, PageType
    FROM sp_tablepages;
    GO

    邀月工作室

    INSERT INTO textdata
       
    SELECT REPLICATE(convert(varchar(MAX), 'a'), 41000);
    GO
    TRUNCATE TABLE sp_tablepages;
    GO
    INSERT INTO sp_tablepages
      
    EXEC('DBCC IND(testdb, textdata, -1)');
    GO
    SELECT PageFID, PagePID, ObjectID, IAM_chain_type, PageType
    FROM sp_tablepages;

    邀月工作室 

    存储在数据行的LOB数据

    如果你存储LOB数据类型值在常规数据页外,SQL Server每次在访问数据时必须执行额外的页读取,这与行溢出页非常类似。有时候,你可以将LOB数据存储在数据行以提高性能。表设置为"text in row"为ON即可。

    例如下列命令将小于500字节的LOB数据存储在Employee表的常规数据行中:

    EXEC sp_tableoption employee, 'text in row', 500; 

     注意:如果是Ntext型将只能是250字节。如果用ON代替500,默认值为256。禁用该选项,可以用OFF或0。

    察看当前选项状态,可以通过目录视图sys.tables:

    SELECT name, text_in_row_limit
    FROM sys.tables
    WHERE name = 'employee';

    --name    text_in_row_limit
    --
    Employee    0 

    我们再看一个例子:

    CREATE TABLE HasText  
    (
    Col1 
    char(3)       NOT NULL,
    Col2 
    varchar(5)    NOT NULL,
    Col3 
    text          NOT NULL,
    Col4 
    varchar(20)   NOT NULL
    );
    INSERT HasText VALUES  
        (
    'AAA''BBB'REPLICATE('X'250), 'CCC');

     邀月工作室

     邀月工作室

    我们启用行内文本数据,上限为500字节。

    EXEC sp_tableoption HasText, 'text in row'500

    启用选项后并没有强制文本数据移动到行内。我们必须强制移动数据:

    UPDATE HasText  
    SET col3 =  REPLICATE('Z'250);

    此时,两个LOB页变成一个,并且数据移到行内:
    邀月工作室
    很多人会问另一个问题:如果我此时将text in row的最大长度设为一个较小的值,比如50,会如何?

    EXEC sp_tableoption HasText, 'text in row'50;

    正如大多数人预料的那样,此时,SQL Server自动增加一个LOB页。

     注意:

    1、一个根结构至少24字节,所以,行内数据最小为24字节,所以下面的命令EXEC sp_tableoption HasText, 'text in row', 20;并不会执行。

    2、变量列的增长优于行内的LOB数据存储。

    3、SQL Server记录所有LOB数据的移动,因此,对一个大表来说,减少行内数据限制或OFF时将会消耗较长的时间。

     在很多情况下,我们不得不使用readtext.writetext和updatetext等重新排序,此时需要处理偏移和数据长度值。SQL Server 2005以上,你不得不决定是否需要限定列为8000字节或用其他方式处理大数据列和短列。SQL Ser2005/2008提供了很好的解决文案。我们后面会提到。

  • 相关阅读:
    LeetCode 078. 子集 dfs
    LeetCode 404. 左叶子之和 树遍历
    LeetCode 226. 翻转二叉树 递归
    C# String.Format大全 去 decimal 后面的 0
    HTML readyState 属性 iframe onreadystatechange事件
    crm 4 IFRAME 元素隐藏
    在MS CRM 4.0中引用JS文件
    crm 4 隐藏自定义 toolbar
    crm 4 UserHasRole
    微信JSSDK上传多张图片
  • 原文地址:https://www.cnblogs.com/downmoon/p/1726765.html
Copyright © 2020-2023  润新知