Snapshot agent负责收集publication database的信息,将article的内容存储在snapshot文件中。而distribuiton cleanup job(后文简称清除作业)则负责删除这些文件。清除作业默认每15分钟运行一次,但并不是每一次都会去删除这些文件。那么其中有什么规律吗?
实际上这取决与您的设定。如果您的publication启用了immeidate_sync,那么清除作业会一直保留这些文件,直到达到了 max distribution retention(这个值可以通过运行sp_Helpdistributor查看到)。如果没有启用immediate_sync,那么distribuiton agent将snapshot应用到订阅数据库之后,这些文件就可以被删除了。
您可能会好奇为什么会有这样的设定:
当immediate_sync为false是,理论上来说,只要msrepl_transactoins和msrepl_commands中的数据已经被同步到了订阅,那么这些数据是可以被立即删除的。那就是说,我们无法通过当前的snapshot和msrepl_transactions/msrepl_commands中的数据来还原(初始化)一个的subscriptoin database,所以也就没有必要保留这些文件了。
如果immediate_sync为true,那么只有当到达了max distribution retention, msrepl_transactoins和msrepl_commands中的数据才会被删除。在这之前,SQL Server可以通过snapshot+msrepl_transactions/msrepl_commands来初始化一个订阅数据库的。所以这些文件也就不会被提前删除了。
实际上这个设定也影响到了重新初始化操作(reinitializtion), 当immedate_sync为false是,您必须使用一个新的快照;反之您可以选择使用现存的快照文件。
下面是一个重新初始化的截图(immediate_sync为false),您可以看到“Use the current snapshot”的按钮是禁用的。
注意:
在有些情况下,由于metadata不完整,清除作业无法查找到snapshot文件,也无法将其删除。您手动地将这些文件删除即可。