• (三十一)大数据实战——一键式DolphinScheduler高可用工作流任务调度系统部署安装


    前言

    DolphinScheduler(Dolphin Scheduler)是一个分布式、易扩展的开源 DAG(有向无环图)工作流任务调度系统,可用于构建大规模数据处理、数据仓库、ETL 等复杂的数据处理和数据分析场景。DolphinScheduler 支持多种任务类型,包括 Shell、SQL、Spark、Python、Sub-Process、HTTP、Flink 等,同时也支持用户自定义任务类型。本节内容我们完成DolphinScheduler工作流系统的搭建。

    正文

    ①集群服务规划

    - 关于jdk、zookeeper、hadoop、mysql等安装部署内容这里不再介绍,请查看作者往期博客内容。

    DS集群服务规划
    hadoop101hadoop102hadoop103
    jdkjdkjdk
    zookeeperzookeeperzookeeper
    hadoophadoophadoop
    DolphinScheduler-masterDolphinScheduler-masterDolphinScheduler-master
    DolphinScheduler-workerDolphinScheduler-workerDolphinScheduler-worker

    ②分别在hadoop101、hadoop102、hadoop103安装psmisc

     sudo yum install -y psmisc

    ③上传DolphinScheduler安装包到hadoop101服务器/opt/software目录

    ④将此安装包解压到当前目录

    tar -zxvf apache-dolphinscheduler-2.0.5-bin.tar.gz

    ⑤创建dolphinscheduler的元数据库及用户,这里使用mysql数据库

    - 创建数据库

    1. CREATE DATABASE dolphinscheduler DEFAULT CHARACTER SET utf8
    2. DEFAULT COLLATE utf8_general_ci;

    - 创建用户,出现错误,修改密码等级权限

    1. CREATE USER 'dolphinscheduler'@'%' IDENTIFIED BY
    2. 'dolphinscheduler';

    - 修改密码等级并重新创建用户

    1. set global validate_password_policy=0;
    2. set global validate_password_length=4;

    - 授权用户

    1. GRANT ALL PRIVILEGES ON dolphinscheduler.* TO
    2. 'dolphinscheduler'@'%';

    - 刷新用户权限

     flush privileges;
    

    ⑥ 通过修改DolphinScheduler部署脚本,一键式部署DolphinScheduler

    - 进入dolphinscheduler解压目录/opt/software/apache-dolphinscheduler-2.0.5-bin/conf/config下,修改部署脚本

    - 修改ips服务器配置参数

    - 修改masters主节点配置参数

    - 修改workers节点配置参数

    - 配置告警服务所在服务器主机名

    - 配置api服务所在服务器主机名

    - 配置dolphinscheduler安装路径,如果不存在会创建,这里的安装路径配置为/opt/module/dolphinscheduler

    - 部署用户配置,任务执行服务是以 sudo -u {linux-user} 切换不同 Linux 用户的方式来实现多租户运行作业,因此该用户必须有免密的sudo 权限,这里使用hadoop账号

    - 配置JAVA_HOME路径

    - 配置mysql数据库连接

    - 配置zookeeper注册中心

    - 配置hdfs存储资源

    - yarn配置,yarn的resource节点在hadoop102

    ⑦ 上传mysql驱动到mysql-connector-java-8.0.16.jar到dolphinscheduler解压目录lib下

    ⑧在/opt/software/apache-dolphinscheduler-2.0.5-bin/script目录下执行dolphinscheduler的数据库初始化脚本

    ⑨启动zookeeper集群、mysql、以及hadoop集群

    - 启动zookeeper

    - 启动mysql

    - 启动hadoop

    ⑩ 在/opt/software/apache-dolphinscheduler-2.0.5-bin目录下执行一键式部署安装脚本install.sh

     ⑪查看dolphinscheduler服务进程

    ⑫使用客户端连接dolphinscheduler

    ⑬dolphinscheduler服务的启停

    - 在dolphinscheduler的安装目录/opt/module/dolphinscheduler/bin下有启动脚本

    - 启停 Master

    1. ./bin/dolphinscheduler-daemon.sh start master-server
    2. ./bin/dolphinscheduler-daemon.sh stop master-server

    - 启停 Worker

    1. ./bin/dolphinscheduler-daemon.sh start worker-server
    2. ./bin/dolphinscheduler-daemon.sh stop worker-server

    - 启停 Api Server

    1. ./bin/dolphinscheduler-daemon.sh start api-server
    2. ./bin/dolphinscheduler-daemon.sh stop api-server

    - 启停 Logger

    1. ./bin/dolphinscheduler-daemon.sh start logger-server
    2. ./bin/dolphinscheduler-daemon.sh stop logger-server

    - 启停 Alert

    1. ./bin/dolphinscheduler-daemon.sh start alert-server
    2. ./bin/dolphinscheduler-daemon.sh stop alert-server

    - 集群启停

    1. ./bin/start-all.sh
    2. ./bin/stop-all.sh

    结语

    至此,关于一键式DolphinScheduler高可用工作流任务调度系统部署安装到这里就结束了,我们下期见。。。。。。

  • 相关阅读:
    LeetCode第20题:有效的括号
    计算机网络(第一弹) --- 一篇关于协议的博客
    93.(后端)分类参数增加接口实现——flask框架使用蓝图与restful发送请求添加数据
    考研408深度分析+全年规划
    .NET(C#) 如何配置用户首选项及保存用户设置
    git使用整理
    JD-怎样获取别人家店铺商品的API接口呢??
    Android init.rc 解析
    快速解决“msvcp110.dll丢失”问题,msvcp110.dll丢失修复分享
    淘宝店铺订单解密接口/淘宝店铺订单插旗接口/淘宝店铺订单交易接口/淘宝店铺商品上传接口/淘宝店铺订单明文接口/代码对接分享
  • 原文地址:https://blog.csdn.net/yprufeng/article/details/132921540