最近在做数据分析,就把 hbase 里数据挖出来晒晒。
挖之前先看看 池子有多大,哈哈哈
查看hbase表大小。
进入 hbase 所在服务器
# hbase shell 进入 hbase 库
# list_namespace 列出所有命名空间
# describe_namspace 'hbase' 查看指定命名空间
# list_namespace_table 'default' 查看指定命名空间下的表
也可以
# list 列出所有表名
查看 hbase指定表大小
网上有句 # hdfs dfs -du -h /apps/hbase/data/data/default/
我在服务器上试了试,
但是我这里并没有 /apps 文件,于是查找了 hbase安装目录
# whereis hbase
查了 hbase 所在 的三个文件下都没有 /data/default 文件。
还有个命令 #hdfs dfs -du -h / 查看总占用空间,执行有效果
第一列:目录下总文件大小
第二列:目录下所有文件在集群上的总存储大小,和集群数量有关
第三列:查询目录
在第一列竟然找到 /hbase 地址了、
再次执行命令 # hdfs dfs -du -h /hbase/data/data/default/
没反应?
偶然又查到另一个命令
# hadoop fs -du /hbase/data/default -- 亲测可用 哈哈,不过显示的 是 kb
# hadoop fs -du -h /hbase/data/default -- 加上 -h 加单位显示。
可以看到我的hbase 表 ,当前 htable_historical_track 表和 xny_data_hbase 占用空间较多。
后面就是查看 hbase 表数据量、每日增长量之类的事情了。