1、显示文件大小命令
hadoop fs -du -h hdfs://./type11/ #显示该文件夹type11 下面所有文件的大小 ,自动给出最合适的单位,比如t,G等 比如:
642.7 G 1.9 T hdfs://./20161228
640.7 G 1.9 T hdfs://./20161229
656.0 G 1.9 T hdfs://./20161230
hadoop fs -du -s hdfs://./type11/ #显示该文件夹总的大小 但是不是自动调节大小的 ,返回:
195226540263591 585679620790773 hdfs://./type11
2、查看文件夹大小
统计总数大小
du -sh xmldb/
du -sm * | sort -n //统计当前目录大小 并安大小 排序
du -sk * | sort -n
du -sk * | grep guojf //看一个人的大小
du -m | cut -d "/" -f 2 //看第二个/ 字符前的文字
查看此文件夹有多少文件 * 有多少文件
du xmldb/
du xmldb* |wc -l
40752
解释:
wc [-lmw]
参数说明:
-l :多少行
-m:多少字符
-w:多少字
3、分隔文件
linenum=`wc -l httperr8007.log| awk '{print $1}'`
n1=1
file=1
while [ $n1 -lt $linenum ]
do
n2=`expr $n1 + 999`
sed -n "${n1}, ${n2}p" httperr8007.log > file_$file.log
n1=`expr $n2 + 1`
file=`expr $file + 1`
done
-b :后面可接欲分割成的档案大小,可加单位,例如 b, k, m 等;
-l :以行数来进行分割;
-
tar命令
解包:tar zxvf FileName.tar
打包:tar czvf FileName.tar DirName
-
gz命令
解压1:gunzip FileName.gz
解压2:gzip -d FileName.gz
压缩:gzip FileName
.tar.gz 和 .tgz
解压:tar zxvf FileName.tar.gz
压缩:tar zcvf FileName.tar.gz DirNam