• azkaban平台的使用


    最近接触一些大数据的测试,有些hadoop/spark任务在服务器测试不太方便,会放到azkaban上跑

    简单写下azkaband的使用流程:包括任务的上传和提交任务到hadoop集群

    一 登陆azkaban,点击右上角,新建一个project

    二  上传测试任务

    此处有两种上传方式

    1 手动压缩上传

       ①将自己的任务压缩成zip文件

       ②进入project,点击右上角的Upload,上传自己的压缩包

    2 我偷了一个上传脚本,好吧,贴不过来,当我没说得了= =

    三 执行任务

    1 上传后在项目的Flow列表就会出现可执行任务,点开

    2 点开后可以看到好多job,每个job后有两个参数,一个是Run Job,一个是Run with dependency,选取后者会先执行该任务的依赖任务

    3 点击Run Job,可以看到只有要执行的任务是有效状态,点击左侧的Flow Parameters -- > Add Row,添加运行需要的参数

    4 执行右下角的Excute,即可成功提交任务到hadoop集群

    若任务较为简单,也可以直接在linux服务器上执行sh yourshell.sh,也可以提交到服务器配置的hadoop集群

     四 问题与解决

     1 不同账号间可以共享同名的project,注意需要配置权限

        进入project --> Pemissions --> User & Proxy User权限可以Add

    话说我这样不算侵权或者泄密吧,不要有坏人看到哟

       

        

  • 相关阅读:
    PHP框架 CI与TP之MVC比较
    多线程设计要点
    BigPipe 的工作原理
    Linux yum命令的使用技巧
    java 乱码问题
    win7或xp下常用命令
    不同场景下JVM参数的设置
    win7笔记本创建wifi热点
    maven编译出现Java heap space
    Curling 2.0——蛋疼的一道题
  • 原文地址:https://www.cnblogs.com/zhaoxd07/p/7351448.html
Copyright © 2020-2023  润新知