分区管理 - 润新知

分区管理
对表分区，对数据库有很多好处，通常来说，分区的好处有两个：减少产生死锁的竞争条件，和删除分区的数据。由于分区之间是相互独立的，因此，对一个分区加X锁，不会对其他分区产生竞争，这是避免死锁（dead lock）的一种方式。对大数据表进行数据删除操作时，可以使用分区切换，使用少量的IO，从分区表中删除海量的数据。

在实际的项目中，有如下的分区函数和分区架构（ Partition Scheme）：
CREATE PARTITION FUNCTION [funcPartition_int_DataSourceID](int) AS RANGE LEFT FOR VALUES (1, 2, 3) CREATE PARTITION SCHEME [schePartition_int_DataSourceID] AS PARTITION [funcPartition_DataSourceID] TO ([PRIMARY], [PRIMARY], [PRIMARY], [PRIMARY]) create table dbo.dt_test ( ...More column definition DataSourceID int ) on [schePartition_int_DataSourceID](DataSourceID)
View Code
一，减少产生死锁的竞争条件

查看ETL的执行日志，日志中记录Package执行的消息，某些Package会因为发送死锁，作为死锁牺牲品（victim）而失败。查看这些Package，发现产生死锁的根本原因是：不同的Package同时更新同一张表，导致竞争，产生死循环而发生死锁。深入分析发生死锁的TSQL脚本，两个Package都使用 DataSourceID 作为过滤条件。推测，可能的原因是这两个DataSourceID位于同一个分区：

1，验证边界值

分区函数设置的边界值是执行分区的依据，验证边界值，能够确定分区列是否处于相同的分区中：
```
select prv.function_id,pf.name,pf.boundary_value_on_right,prv.value as BoundaryValue
from sys.partition_range_values prv
inner join sys.partition_functions pf
    on prv.function_id=pf.function_id
where pf.name='funcPartition_int_DataSourceID'
```
边界值小于当前 DataSourceID的最大值，因此，产生竞争的两个DataSourceID 都是在最右边的分区中。缺少分区的管理计划，这会导致额外增加的分区列（DataSourceID）都被分配到同一个分区中。

2，管理分区计划

对表表去，不仅要有效地避免死锁，减少产生死锁的竞争条件，还要在删除大表数据时，使用少量IO实现海量数据的移动，通过分区切换（switch）和数据表截断（truncate），快速删除数据。分区切换是把整个分区切换到零时表中，这就要求，该分区列必须足够小，能够全部删除。管理分区计划的最佳实践，合理选择分区列，并预留空分区。

如果一个分区是非空的，那么分区拆分（split range）会导致数据的移动，这可能是一个非常耗费IO的一个操作，为了避免密集的数据移动，最好是预留一个空的分区，一般是最右边的分区，该分区号最大，每次都把最右边的分区拆分成两个分区：
declare @CurrentMaxBoundaryValue int declare @ExistingMaxDataSourceID int declare @BoudaryValue int declare @sql_prefix nvarchar(max) declare @sql nvarchar(max) set @sql_prefix=N' alter partition scheme [schePartition_int_DataSourceID] next used [primary] alter partition function [funcPartition_int_DataSourceID]() split range (' select @ExistingMaxDataSourceID = max(ds.DataSourceID) from dbo.dt_DataSource ds with(nolock) select @CurrentMaxBoundaryValue= max(cast(prv.value as int)) from sys.partition_functions pf inner join sys.partition_range_values prv on pf.function_id=prv.function_id where pf.name='funcPartition_int_DataSourceID' -- add new boundary value if @CurrentMaxBoundaryValue<@ExistingMaxDataSourceID+1 begin set @BoudaryValue=@CurrentMaxBoundaryValue+1 while @BoudaryValue<=@ExistingMaxDataSourceID+1 begin select @sql = @sql_prefix+ cast(@BoudaryValue as varchar(10))+ N')' exec(@sql) set @BoudaryValue=@BoudaryValue+1 end end
View Code
二，可能出现的错误

1，SET选项错误

在执行分区脚本对索引进行分区的，可能会遇到SET选项错误，根据错误消息，启用想用的SET选项：

UNKNOWN TOKEN failed because the following SET options have incorrect settings: 'QUOTED_IDENTIFIER'. Verify that SET options are correct for use with indexed views and/or indexes on computed columns and/or filtered indexes and/or query notifications and/or XML data type methods and/or spatial index operations. [SQLSTATE 42000] (Error 1934).

上述消息表面当前数据库的QUOTED_IDENTIFIER设置错误，使用SET命令启用QUOTED_IDENTIFIER选项：
```
SET QUOTED_IDENTIFIER  ON
```
参考文档：

SET QUOTED_IDENTIFIER (Transact-SQL)
相关阅读:
猫与老鼠的故事（委托）
返回类型协变和参数类型逆变
 HTTP 方法：GET 对比 POST
Ajax
django(未解决的问题）
mysql开机启动
 apache的不同路径conf/httpd.conf有什么区别【转载】
Apache部署Django过程中遇到的一些问题
 执行django-admin.py startproject XXX报错的问题
 yum安装软件的过程中出现的一些问题
原文地址：https://www.cnblogs.com/ljhdo/p/5070031.html