码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 大数据培训-DolphinScheduler(二)


    Apache DolphinScheduler是一个分布式去中心化,易扩展的可视化DAG工作流任务调度系统。致力于解决数据处理流程中错综复杂的依赖关系,使调度系统在数据处理流程中开箱即用。

    一、快速上手

    1、使用admin用户登录,密码是dophinscheduler123,创建队列。

    2、创建租户,创建租户前要确保HDFS的根目录下所属者都是hdfs,与DS配置文件保持一致,否则会创建失败。

    3、创建普通用户。

    4、创建告警组。

    5、创建token令牌。

    6、退出账号,切换test用户。

    7、创建项目。

    8、点击项目名称,进入项目首页,创建工作流。

    9、创建三个简单的工作任务,执行简单输出,输出hello world。

    10、选中箭头,将节点进行连接,建立任务间的执行顺序,点击保存,设置DAG图名称。

    11、测试,上线,需要先点击上线,再点击执行,执行前需要配置一些参数。

    基于DolphinScheduler构建大数据调度平台
    rar 0星 超过10%的资源 712.0B
    下载

    12、执行完成之后,查看是否成功和日志。

    二、资源中心

    资源中心用于上传文件和udf函数,所有上传的文件和资源都会被存储到hdfs上(在安装时配置了相关参数),将jar包上传上去,用于后面测试。

    三、Spark节点

    1、创建hdfs(需要和hdf路径上的owner对应)租户。

    2、创建atguigu用户。

    3、切换成atguigu用户,在项目管理中新创建项目test-project。

    4、在新建的项目中创建新的工作流,在工作流创建画布上选择spark节点图标,创建spark任务,使用我们事先已经上传到资源中心的jar包,配置必要的参数。

    新一代大数据任务调度 - Apache DolphinScheduler功能深度解析
    pptx 0星 超过10%的资源 14.55MB
    下载

    5、以此类推,分别创建出dwd层、dws层和ads层的任务流,并使用箭头连接,确定三个任务的先后执行顺序。

    6、上线、执行,进行测试。

    7、执行完成后,可以查看甘特图和日志等信息。

    四、创建HIve数据源

    1、点击数据源中心,点击创建数据源。

    2、选择数据源类型是HIVE/IMPALA,并配置必要参数。

  • 相关阅读:
    node24-nodejs模块化的开发导出另一种方式
    [云原生] 二进制安装K8S(中)部署网络插件和DNS
    MySQL主从复制的实现步骤(超级详细哦)
    有关于torch.autograd.grad
    重学 vue3 中的 computed
    数据预处理
    GEE案例——计算指定区域的云量所占的面积占比(以2019年-2022年北京市为例)
    基金的基本概念和原理
    解决使用react devtools调试工具时无法显示组件名称的问题
    SystemC入门学习-第5章 同步逻辑建模
  • 原文地址:https://blog.csdn.net/zjjcchina/article/details/126119161
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号