• HDFS 命令大全


    概要

    HDFS 文件系统的常用操作和普通 Linux 文件系统非常相似,如读取文件,新建目录,移动文件,删除数据,列出目录等。

    本文只列出常用的 HDFS 命名,要查看完整的命令行列表,可点击 这里

    所有的 HDFS 命令都是调用 bin/hdfs 脚本完成的,它的基本用法如下

    hdfs [SHELL_OPTIONS] COMMAND [GENERIC_OPTIONS] [COMMAND_OPTIONS]
    

    hdfs 命令分成 3 种类型,分别是

    • 用户命令
    • 集群管理员命令
    • 调试命令(集群管理员使用)

    在命令中会有一些 URI 参数,其中 URI 的前缀是由 core-site.xml 中的 fs.defaultFS 决定的,通过该属性就可以知道 namenode 在哪里运行进而连接到它。例如:

    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://hadoop2cluster</value>
      </property>
    

    而如果在本机操作,就可以省略 URI 前缀。

    用户命令

    dfs 命令

    hdfs dfs [COMMAND [COMMAND_OPTIONS]]
    

    hadoop 所支持的文件系统命令,其中 COMMAND_OPTIONS 可在 File System Shell Guide 查看。

    hdfs dfs 命令前缀与 hadoop fs 效果相同。

    追加文件内容

    -appendToFile <localsrc> ... <dst>
    

    实例

    hdfs dfs -appendToFile hdfs-site.xml /tmp/tests/test.txt
    

    查看文件内容

    -cat URI [URI ...]
    

    实例

    hdfs dfs -cat /tmp/tests/test.txt
    

    得到文件的校验信息

    -checksum URI
    

    实例

    hdfs dfs -checksum /tmp/tests/test.txt
    

    修改用户组

    -chgrp [-R] GROUP URI [URI ...]
    

    Change group association of files. The user must be the owner of files, or else a super-user. Additional information is in the Permissions Guide.

    修改文件权限

    -chmod [-R] <MODE[,MODE]... | OCTALMODE> URI [URI ...]
    

    修改文件所属用户

     -chown [-R] [OWNER][:[GROUP]] URI [URI ]
    

    本地拷贝到 hdfs

    -copyFromLocal <localsrc> URI
    

    hdfs 拷贝到本地

    -copyToLocal [-ignorecrc] [-crc] URI <localdst>
    

    获取目录,文件数量及大小

    -count [-q] [-h] [-v] <paths>
    

    举例

     hdfs dfs -count /tmp/tests/
    

    得到结果

               1            1               3513 /tmp/tests
    

    其中

    • 列 1 表示 目录数量
    • 列 2 表示 文件数量
    • 列 3 表示 文件总大小(字节)

    hdfs 内拷贝

    -cp [-f] [-p | -p[topax]] URI [URI ...] <dest>
    
    • -f 表示如果文件已存在,会覆盖原文件
    • -p 表示会保留文件属性(时间错,owner,权限, ACL 等)

    createSnapshot 创建快照

    See HDFS Snapshots Guide.

    deleteSnapshot 删除快照

    See HDFS Snapshots Guide.

    显示空闲空间

    -df [-h] URI [URI ...]
    
    • -h 选项会以人类友好的方式来显示,如 64M 而不是多少字节

    显示文件和目录大小

    -du [-s] [-h] URI [URI ...]
    
    • The -s option will result in an aggregate summary of file lengths being displayed, rather than the individual files.
    • The -h option will format file sizes in a “human-readable” fashion (e.g 64.0m instead of 67108864)

    清空回收站

    -expunge
    

    Empty the Trash. Refer to the HDFS Architecture Guide for more information on the Trash feature.

    查找文件

    -find <path> ... <expression> ...
    

    显示目录或文件的访问控制列表

    -getfacl [-R] <path>
    

    显示文件或目录的扩展信息

    -getfattr [-R] -n name | -d [-e en] <path>
    
    • -R: Recursively list the attributes for all files and directories.
    • -n name: Dump the named extended attribute value.
    • -d: Dump all extended attribute values associated with pathname.
    • -e encoding: Encode values after retrieving them. Valid encodings are “text”, “hex”, and “base64”. Values encoded as text strings are enclosed in double quotes ("), and values encoded as hexadecimal and base64 are prefixed with 0x and 0s, respectively.
    • path: The file or directory.

    ls

    -ls [-d] [-h] [-R] [-t] [-S] [-r] [-u] <args>
    
    • -d: Directories are listed as plain files.
    • -h: Format file sizes in a human-readable fashion (eg 64.0m instead of 67108864).
    • -R: Recursively list subdirectories encountered.
    • -t: Sort output by modification time (most recent first).
    • -S: Sort output by file size.
    • -r: Reverse the sort order.
    • -u: Use access time rather than modification time for display and sorting.

    mkdir

    -mkdir [-p] <paths>
    

    moveFromLocal

    -moveFromLocal <localsrc> <dst>
    

    moveToLocal

    -moveToLocal [-crc] <src> <dst>
    

    mv

    -mv URI [URI ...] <dest>
    

    rm

    -rm [-f] [-r |-R] [-skipTrash] URI [URI ...]
    
    • The -f option will not display a diagnostic message or modify the exit status to reflect an error if the file does not exist.
    • The -R option deletes the directory and any content under it recursively.
    • The -r option is equivalent to -R.
    • The -skipTrash option will bypass trash, if enabled, and delete the specified file(s) immediately. This can be useful when it is necessary to delete files from an over-quota directory.

    test

    -test -[defsz] URI
    
    • -d: f the path is a directory, return 0.
    • -e: if the path exists, return 0.
    • -f: if the path is a file, return 0.
    • -s: if the path is not empty, return 0.
    • -z: if the file is zero length, return 0.

    tail

    -tail [-f] URI
    

    显示文件的最后的字节

    • The -f option will output appended data as the file grows, as in Unix.

    usage

    显示命令的用法

    -usage command
    

    参考文档

  • 相关阅读:
    Windwos堆管理体系以及溢出利用
    Python利用ctypes实现C库函数调用
    Windows异常分发
    初探Windows用户态调试机制
    HTTP协议
    《格蠹汇编》调试笔记
    IDT系统中断描述表以及绕过Xurtr检测的HOOK姿势
    C++ 各种构造函数
    PsSetCreateProcessNotifyRoutineEx 创建回调函数
    导出函数与未导出函数
  • 原文地址:https://www.cnblogs.com/reycg-blog/p/10087021.html
Copyright © 2020-2023  润新知