• Hadoop记录-Yarn命令


    概述

    YARN命令是调用bin/yarn脚本文件,如果运行yarn脚本没有带任何参数,则会打印yarn所有命令的描述。

    使用: yarn [--config confdir] COMMAND [--loglevel loglevel] [GENERIC_OPTIONS] [COMMAND_OPTIONS]

    YARN有一个参数解析框架,采用解析泛型参数以及运行类。

    命令参数描述
    --config confdir 指定一个默认的配置文件目录,默认值是: ${HADOOP_PREFIX}/conf.
    --loglevel loglevel 重载Log级别。有效的日志级别包含:FATAL, ERROR, WARN, INFO, DEBUG, and TRACE。默认是INFO。
    GENERIC_OPTIONS YARN支持表A的通用命令项。
    COMMAND COMMAND_OPTIONS YARN分为用户命令和管理员命令。

    表A:

    通用项Description
    -archives <comma separated list of archives> 用逗号分隔计算中未归档的文件。 仅仅针对JOB。
    -conf <configuration file> 制定应用程序的配置文件。
    -D <property>=<value> 使用给定的属性值。
    -files <comma separated list of files> 用逗号分隔的文件,拷贝到Map reduce机器,仅仅针对JOB
    -jt <local> or <resourcemanager:port> 指定一个ResourceManager. 仅仅针对JOB。
    -libjars <comma seperated list of jars> 将用逗号分隔的jar路径包含到classpath中去,仅仅针对JOB。

    用户命令:

    对于Hadoop集群用户很有用的命令:

    application

    使用: yarn application [options]

     
    命令选项描述
    -appStates <States> 使用-list命令,基于应用程序的状态来过滤应用程序。如果应用程序的状态有多个,用逗号分隔。 有效的应用程序状态包含
    如下: ALL, NEW, NEW_SAVING, SUBMITTED, ACCEPTED, RUNNING, FINISHED, FAILED, KILLED
    -appTypes <Types> 使用-list命令,基于应用程序类型来过滤应用程序。如果应用程序的类型有多个,用逗号分隔。
    -list 从RM返回的应用程序列表,使用-appTypes参数,支持基于应用程序类型的过滤,使用-appStates参数,支持对应用程序状态的过滤。
    -kill <ApplicationId> kill掉指定的应用程序。
    -status <ApplicationId> 打印应用程序的状态。

    applicationattempt

    使用: yarn applicationattempt [options]

    命令选项描述
    -help 帮助
    -list <ApplicationId> 获取到应用程序尝试的列表,其返回值ApplicationAttempt-Id 等于 <Application Attempt Id>
    -status <Application Attempt Id> 打印应用程序尝试的状态。

    classpath

    使用: yarn classpath

    打印需要得到Hadoop的jar和所需要的lib包路径

    container

    使用: yarn container [options]

    命令选项描述
    -help 帮助
    -list <Application Attempt Id> 应用程序尝试的Containers列表
    -status <ContainerId> 打印Container的状态

    jar

    使用: yarn jar <jar> [mainClass] args...

    运行jar文件,用户可以将写好的YARN代码打包成jar文件,用这个命令去运行它。

    logs

    使用: yarn logs -applicationId <application ID> [options]

    注:应用程序没有完成,该命令是不能打印日志的。

    命令选项描述
    -applicationId <application ID> 指定应用程序ID,应用程序的ID可以在yarn.resourcemanager.webapp.address配置的路径查看(即:ID)
    -appOwner <AppOwner> 应用的所有者(如果没有指定就是当前用户)应用程序的ID可以在yarn.resourcemanager.webapp.address配置的路径查看(即:User
    -containerId <ContainerId> Container Id
    -help 帮助
    -nodeAddress <NodeAddress> 节点地址的格式:nodename:port (端口是配置文件中:yarn.nodemanager.webapp.address参数指定)

    node

    使用: yarn node [options]

    命令选项描述
    -all 所有的节点,不管是什么状态的。
    -list 列出所有RUNNING状态的节点。支持-states选项过滤指定的状态,节点的状态包
    含:NEW,RUNNING,UNHEALTHY,DECOMMISSIONED,LOST,REBOOTED。支持--all显示所有的节点。
    -states <States> 和-list配合使用,用逗号分隔节点状态,只显示这些状态的节点信息。
    -status <NodeId> 打印指定节点的状态。

    queue

    使用: yarn queue [options]

    命令选项描述
    -help 帮助
    -status <QueueName> 打印队列的状态

    打印队列信息。

    version

    使用: yarn version

    管理员命令:

    下列这些命令对hadoop集群的管理员是非常有用的。

    daemonlog

    使用:

       yarn daemonlog -getlevel <host:httpport> <classname> 
       yarn daemonlog -setlevel <host:httpport> <classname> <level>
    
    参数选项描述
    -getlevel <host:httpport> <classname> 打印运行在<host:port>的守护进程的日志级别。这个命令内部会连接http://<host:port>/logLevel?log=<name>
    -setlevel <host:httpport> <classname> <level> 设置运行在<host:port>的守护进程的日志级别。这个命令内部会连接http://<host:port>/logLevel?log=<name>

    针对指定的守护进程,获取/设置日志级别.

    nodemanager

    使用: yarn nodemanager

    启动NodeManager

    proxyserver

    使用: yarn proxyserver

    启动web proxy server

    resourcemanager

    使用: yarn resourcemanager [-format-state-store]

    参数选项描述
    -format-state-store RMStateStore的格式. 如果过去的应用程序不再需要,则清理RMStateStore, RMStateStore仅仅在ResourceManager没有运行的时候,才运行RMStateStore

    启动ResourceManager

    rmadmin

    使用:

      yarn rmadmin [-refreshQueues]
                   [-refreshNodes]
                   [-refreshUserToGroupsMapping] 
                   [-refreshSuperUserGroupsConfiguration]
                   [-refreshAdminAcls] 
                   [-refreshServiceAcl]
                   [-getGroups [username]]
                   [-transitionToActive [--forceactive] [--forcemanual] <serviceId>]
                   [-transitionToStandby [--forcemanual] <serviceId>]
                   [-failover [--forcefence] [--forceactive] <serviceId1> <serviceId2>]
                   [-getServiceState <serviceId>]
                   [-checkHealth <serviceId>]
                   [-help [cmd]]
    
    参数选项描述
    -refreshQueues 重载队列的ACL,状态和调度器特定的属性,ResourceManager将重载mapred-queues配置文件
    -refreshNodes 动态刷新dfs.hosts和dfs.hosts.exclude配置,无需重启NameNode。
    dfs.hosts:列出了允许连入NameNode的datanode清单(IP或者机器名)
    dfs.hosts.exclude:列出了禁止连入NameNode的datanode清单(IP或者机器名)
    重新读取hosts和exclude文件,更新允许连到Namenode的或那些需要退出或入编的Datanode的集合。
    -refreshUserToGroupsMappings 刷新用户到组的映射。
    -refreshSuperUserGroupsConfiguration 刷新用户组的配置
    -refreshAdminAcls 刷新ResourceManager的ACL管理
    -refreshServiceAcl ResourceManager重载服务级别的授权文件。
    -getGroups [username] 获取指定用户所属的组。
    -transitionToActive [–forceactive] [–forcemanual] <serviceId> 尝试将目标服务转为 Active 状态。如果使用了–forceactive选项,不需要核对非Active节点。如果采用了自动故障转移,这个命令不能使用。虽然你可以重写–forcemanual选项,你需要谨慎。
    -transitionToStandby [–forcemanual] <serviceId> 将服务转为 Standby 状态. 如果采用了自动故障转移,这个命令不能使用。虽然你可以重写–forcemanual选项,你需要谨慎。
    -failover [–forceactive] <serviceId1> <serviceId2> 启动从serviceId1 到 serviceId2的故障转移。如果使用了-forceactive选项,即使服务没有准备,也会尝试故障转移到目标服务。如果采用了自动故障转移,这个命令不能使用。
    -getServiceState <serviceId> 返回服务的状态。(注:ResourceManager不是HA的时候,时不能运行该命令的)
    -checkHealth <serviceId> 请求服务器执行健康检查,如果检查失败,RMAdmin将用一个非零标示退出。(注:ResourceManager不是HA的时候,时不能运行该命令的)
    -help [cmd] 显示指定命令的帮助,如果没有指定,则显示命令的帮助。

    scmadmin

    使用: yarn scmadmin [options]

    参数选项描述
    -help Help
    -runCleanerTask Runs the cleaner task

    Runs Shared Cache Manager admin client

    sharedcachemanager

    使用: yarn sharedcachemanager

    启动Shared Cache Manager

    timelineserver

    之前yarn运行框架只有Job history server,这是hadoop2.4版本之后加的通用Job History Server,命令为Application Timeline Server,详情请看:The YARN Timeline Server

    使用: yarn timelineserver

    启动TimeLineServer

  • 相关阅读:
    2015腾讯暑期实习笔试题目
    二叉树的优点和缺点
    pandas对象保存到mysql出错提示“BLOB/TEXT column used in key specification without a key length”解决办法
    事务的隔离机制
    Flink Sink定制开发
    Presto实现定时从配置文件读取配置
    LDAP与Sentry API使用
    Presto压测报告
    PrestoSPI安全扩展
    项目重构总结
  • 原文地址:https://www.cnblogs.com/xinfang520/p/10495415.html
Copyright © 2020-2023  润新知