背景:
这个问题由来已久了,有时经常发现一盘我认为是正常的磁带莫名其妙处于Frozen状态了,经观察是在该磁带被磁带驱动器调用的时候Frozen的,于是怀疑是不是磁带物理损坏导致无法被磁带机调用,最后终于发现不是的。
解决过程:
1. 这次我选用了一盘非HP的LTO4磁带,认为应该都是通用的(结果也的确是通用的),但是很悲剧的发现出现在大连的Frozen问题也很不幸的出现在了杭州的机器上。不同的磁带出现同样的问题,果断假设硬件层面没有问题。
2. 有一件巧合的事情是这两盘磁带都不是新磁带,都是被其他备份软件和磁带机调用过,于是考虑是否有"格式化磁带"的方法使之成为一盘"全新"磁带。于是乎开始尝试NBU的Long Erase,Quick Erase,结果全部失败(不明白原因)。
3. 然后想是否可以通过使用GE的单一磁带机结合Win2003原生存储介质控制界面进行格式化磁带,但是因为周末在家没办法物理接触设备,所以只能尝试使用HP磁带库进行操作了。
4. 也托了这次排错福,让我又深入了解了磁带库的操作:可以通过WebGUI移动某个槽位的磁带至驱动器!(但这个发现和本次排错没多大关系)
5. 由于在WebGUI中并未找到任何"格式化"按钮,所以只能回到最"原始"的Win2003原生存储介质控制界面,去这里面执行格式化操作。一进去,Libraries下面的磁带库,驱动器照例处于向下红色箭头的Disable状态。先将它们全部启用,之后想看看哪里可以看到这23盘磁带,结果没发现,继续执行Inventory操作,若干分钟之后,所有磁带出现在Contents里面。
6. 终于看到这盘问题磁带了,001509L4。于是右键执行Free操作,对他执行格式化。但不幸的事情又来了,我在Work Queue中看到了失败的信息。如下:
7. 错误提示此磁带属于HP磁带库,那就想办法让它不属于。联想到GE磁带机的磁带都是处于Standalone,又联想到HP磁带库中被替换掉的磁带都是被自动转移到Standalone。于是决定在NBU中手动Move它到Standalone。
8. 挪走磁带后,继续回到Win2003界面,继续执行Free操作,成功了!
9. 然后有个小细节,磁带状态变成Available了,之前是New。
10. 回到NBU,把该磁带继续Move回CCTV Pool,启动备份作业。但是NBU却又提示我:机械臂被占用或无可用机械臂,奇怪了,状态都是绿色箭头,重启了也一样。灵感又来了,在Win2003中手动Disable磁带库和驱动器,估计就是这个原因导致设备被占用,这也解释了为什么每次来看这个地方的时候都是红色向下箭头。
11. 最后再次启动备份作业,OK!不过还有个小细节解释了我之前对于磁带容量的疑惑:为什么深圳的磁带容量可以比杭州、大连多出一个数量级?下面这张图里面的第一盘磁带是001508L4,当时CCTV Pool中只有它和001509L4处于Active状态,被调用顺序是先08,再09(因为08里面已经有一部分数据,09则是全新)。由于之前09的Frozen问题,我在排错中又执行了一次备份作业,导致08算上最后一次成功的备份,一共有三份数据了。但似乎NBU对于这种情况没办法纠正容量,亦或是磁带介质的特殊性,只能一味的叠加上去,导致现在看到的这个超大容量。