一个完整的数据分析系统通常都是由大量任务单元组成:
各任务单元之间存在时间先后及前后依赖关系。
为了很好地组织起这样的复杂执行计划,需要一个工作流调度系统来调度执行。
简单的任务调度:直接使用 Linux 的 Crontab 来定义。
复杂的任务调度:开发调度平台或使用现成的开源调度系统,比如 Ooize、Azkaban、Airflow、DolphinScheduler 等。
总体来说,Ooize 相比 Azkaban 是一个重量级的任务调度系统,功能全面,但配置使用也更复杂。如果可以不在意某些功能的缺失,轻量级调度器 Azkaban 是很不错的候选对象。