环境部署:
hbase 采用azure的虚机,存储采用azure的blockblob。
问题:
生产碰到过几次,hbase master无法启动的问题,这种情况下是可以正常读写,但是如果这个时候,发生master切换,集群是无法正常工作的,后果是灾难性的。
此时 hbase master 界面无法访问,原因是hbase 在获取元数据时,出现超时,造成master界面无法打开
原因:
1.azure的存储文件存在bug,azure的解释 https://docs.microsoft.com/zh-cn/azure/hdinsight/hbase/hbase-troubleshoot-start-fails
目前发现发生此问题的几个操作
1.部署的kylin,在kylin进行build的时候,进行kylin数据的文件删除,会偶尔发生此问题
2.当hbase的集群,删除大文件,比如3t以上,这个时候,如果发现删除的时间过长,可能出现了此问题
azure 的存储管理界面