• Azkaban使用


    1、shell command调度

    创建job描述文件

    vi command.job

    1. type=command
    2. command=echo 'hello'

    将job资源文件打包成zip文件

    zip command.job

    通过azkaban的web管理平台创建project并上传job压缩包

    首先创建Project

    上传zip包 

    启动执行该job 

     

    2、job依赖调度

    第一个job:foo.job

    1. type=command
    2. command=echo 'foo'

    第二个job:bar.job依赖foo.job

    1. type=command
    2. dependencies=foo
    3. command=echo 'bar'

    将所有job资源文件打到一个zip包中

    在azkaban的web管理理界面创建工程并上传zip包 

    启动工作流flow

    3、HDFS任务调度

    创建job描述文件 fs.job

    1. type=command
    2. command=/opt/lagou/servers/hadoop-2.9.2/bin/hadoop fs -mkdir /azkaban

    将job资源文件打包成zip文件

    通过azkaban的web管理平台创建project并上传job压缩包 

    启动执行该job

    4、MAPREDUCE任务调度

    mr任务依然可以使用command的job类型来执行

    创建job描述文件,及mr程序jar包(示例中直接使用hadoop自带的example jar)

    mrwc.job

    1. type=command
    2. command=/opt/lagou/servers/hadoop-2.9.2/bin/hadoop jar hadoop-mapreduceexamples-2.9.2.jar wordcount /wordcount/input /wordcount/azout

    将所有job资源文件打到一个zip包中

    在azkaban的web管理界面创建工程并上传zip包

    启动job

    遇到虚拟机内存不足情况:

    • 增大机器器内存
    • 使用清除系统缓存命令,暂时释放一些内存
    1. [root@linux123 mapreduce]# echo 1 >/proc/sys/vm/drop_caches
    2. [root@linux123 mapreduce]# echo 2 >/proc/sys/vm/drop_caches
    3. [root@linux123 mapreduce]# echo 3 >/proc/sys/vm/drop_caches

    5、HIVE脚本任务调度

    创建job描述文件和hive脚本

    Hive脚本: test.sql

    1. use default;
    2. drop table aztest;
    3. create table aztest(id int,name string) row format delimited fields terminated by ',';

    Job描述文件:hivef.job

    hivef.job

    1. type=command
    2. command=/opt/lagou/servers/hive-2.3.7/bin/hive -f 'test.sql'

    将所有job资源文件打到一个zip包中创建工程并上传zip包,启动job

    6、定时任务调度

    除了手动立即执行工作流任务外,azkaban也支持配置定时任务调度。开启方式如下:

    • 首页选择待处理的project
    • 选择左边schedule表示配置定时调度信息,选择右边execute表示立即执行工作流任务。

    注意:这里面填写的是Cron表达式,如果不会可以参考下面这个网站进行生成。

    quartz/Cron/Crontab表达式在线生成工具-BeJSON.com 

  • 相关阅读:
    2月26日做题总结(C/C++真题)
    一文详解反转二叉树
    【计组】总线系统
    VP Atcoder Beginner Contest 265
    [附源码]Python计算机毕业设计SSM科技项目在线评审系统(程序+LW)
    getid3 获取视频时长
    2023学习计划
    剖析 Vue.js 内部运行机制
    Go 语言 设计模式-工厂模式
    авито/avito ru 代表什么意思?投放广告的时候需要加入关键词中吗?
  • 原文地址:https://blog.csdn.net/weixin_52851967/article/details/127640827