• 【大数据】Spark On Yarn


    Spark在YARN中有yarn-cluster和yarn-client两种运行模式:

     I. Yarn client

    在yarn-client模式下,Driver运行在Client上,通过ApplicationMaster向RM获取资源。本地Driver负责与所有的executor container进行交互,并将最后的结果汇总。

     执行流程 

    - 1.客户端提交一个Application,在客户端启动一个Driver进程。 
    - 2.Driver进程会向RS(ResourceManager)发送请求,启动AM(ApplicationMaster)的资源。 
    - 3.RS收到请求,随机选择一台NM(NodeManager)启动AM。这里的NM相当于Standalone中的Worker节点。 
    - 4.AM启动后,会向RS请求一批container资源,用于启动Executor. 
    - 5.RS会找到一批NM返回给AM,用于启动Executor。 
    - 6.AM会向NM发送命令启动Executor。 
    - 7.Executor启动后,会反向注册给Driver,Driver发送task到Executor,执行情况和结果返回给Driver端。

    总结

    1.Yarn-client模式同样是适用于测试,因为Driver运行在本地,Driver会与yarn集群中的Executor进行大量的通信,会造成客户机网卡流量的大量增加.

    2.ApplicationMaster的作用: 

    • 为当前的Application申请资源 
    • 给NodeManager发送消息启动Executor。

    II. Yarn Cluster

    Spark Driver作为一个ApplicationMaster在YARN集群中启动,客户端提交给ResourceManager的每一个job都会在集群的worker节点上分配一个唯一的ApplicationMaster,由该ApplicationMaster管理全生命周期的应用。因为Driver程序在YARN中运行,所以事先不用启动Spark Master/Client,应用的运行结果不能在客户端显示(可以在history server中查看),所以最好将结果保存在HDFS而非stdout输出,客户端的终端显示的是作为YARN的job的简单运行状况。

    执行流程

    • 1.客户机提交Application应用程序,发送请求到RS(ResourceManager),请求启动AM(ApplicationMaster)。
    • 1.RS收到请求后随机在一台NM(NodeManager)上启动AM(相当于Driver端)。
    • 2.AM启动,AM发送请求到RS,请求一批container用于启动Executor。
    • 3.RS返回一批NM节点给AM。
    • 4.AM连接到NM,发送请求到NM启动Executor。
    • 5.Executor反向注册到AM所在的节点的Driver。Driver发送task到Executor。

    总结

    1.Yarn-Cluster主要用于生产环境中,因为Driver运行在Yarn集群中某一台nodeManager中,每次提交任务的Driver所在的机器都是随机的,不会产生某一台机器网卡流量激增的现象,缺点是任务提交后不能看到日志。只能通过yarn查看日志。

    2.ApplicationMaster的作用: 

    • 当前的Application申请资源 
    • 给nodemanager发送消息 启动Excutor。 
    • 任务调度。(这里和client模式的区别是AM具有调度能力,因为其就是Driver端,包含Driver进程)

    3.停止集群任务命令:yarn application -kill applicationID

    二者区别

    它们的区别就是ApplicationMaster的区别

    yarn-cluster中ApplicationMaster不仅负责申请资源,并负责监控Task的运行状况,因此可以关掉client;

    yarn-client中ApplicationMaster仅负责申请资源,由client中的driver来监控调度Task的运行,因此不能关掉client。

    参考:

    https://www.cnblogs.com/ITtangtang/p/7967386.html

    https://blog.csdn.net/huojiao2006/article/details/80563112

  • 相关阅读:
    POJ 1753
    POJ 3669
    POJ 1979
    HDU 1372
    Codeforces 761D
    response下载csv文件内容乱码问题
    只要没有给String[]数组new 空间,那么他就只是一个引用
    servlet中的“/”代表当前项目,html中的“/”代表当前服务器
    onkeyup的死循环问题
    OPGL+VS2017+GLFW+GLEW配置详细步骤
  • 原文地址:https://www.cnblogs.com/zeze/p/11531857.html
Copyright © 2020-2023  润新知