码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • cdh6,使用oozie进行spark的jar任务调度


    首先准备1个jar

    然后保证他丢到服务器,能用spark-submit /sparkTest.jar跑。

    不会打包spark的可参考:linux上spark运行scala的jar包_我要用代码向我喜欢的女孩表白的博客-CSDN博客

    首先你得有oozie和hue,安装好了,才行

    下面是jar在hue的oozie中的应用

    切换文档为操作action

    将那个星星,也就是spark程序,托过来

    然后上传你的spark.jar到hdfs上,因为他只能读取hdfs的jar

    打开一台机器

    hadoop fs -mkdir /sparkNews

    hadoop fs -put /sparkTest.jar /sparkNews

    其中/sparkTest.jar是我本地jar包的路径

    开启权限

    hadoop fs -chmod -R 777 /sparkNews

     选择你的jar位置

    然后保存

     

    点击提交,播放的那个标识,三角形

     提交,点击试运行,出现问题

    不得不说网上的菜雕,写文章真是太shift了,我还根据下面安装了半天?

    然后我CDH直接搞定

    简书 这篇文章是真好,csdn的文章鱼龙混杂,鱼目混珠。

    安装完成之后,直接就有lib

    之后,进行中,一直卡在百分之50,打开oozie日志发现

     没有log4j2文件,但是我有log4j.xml,难道还得加1个log4j2?,我直接启动spark都没有这种情况。我加上试一下

    先在集群上直接测试,丢到oozie上测试

    然后点击运行:发现一直卡在50%

     去oozie查看日志

    点击oozie选择oozie web ui

    先看这条running的,然后点击橙色,跳转到日志界面

    拉到最下面查看日志,点他,和点logs,这2个id的,logs都要看

     他说我没有设置hadoop的环境变量

    添加环境变量(分发到所有机器)

    vi /etc/profile

    export HADOOP_HOME=/opt/cloudera/parcels/CDH-6.3.2-1.cdh6.3.2.p0.1605554/lib/hadoop
    export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
    export SPARK_DIST_CLASSPATH=$(hadoop classpath)

     source /etc/profile(所有机器)

    或者在代码使用

    System.setProperty("HADOOP_USER_NAME","root")
    System.setProperty("HADOOP_HOME","/opt/cloudera/parcels/CDH-6.3.2-1.cdh6.3.2.p0.1605554/lib/hadoop")

    配置的时候一定要

    Files 和jar/py.name保持一致

    与代码中要执行的类,保持一致

    点击设置:

    AppName改成代码里的名称

     默认的客户端模式,我配置了集群,所以写集群模式

    集群模式定义之前,spark一定要开启集群模式





    ​​​​​​​如何使用Hue创建Spark2的Oozie工作流_worldchinalee的博客-CSDN博客_hue oozie spark

    以上是使用Spark2

    如果用cluster模式,代码中不能有master。因为cluster模式,是将driver提交到其中一台机器上执行,然后交给集群执行

    client模式,是本地driver交给集群执行,网速好的情况,当然使用client模式

    错误示范直接跳过

    通过命令"hadoop fs -ls /user"命令查看文件目录,确实不存在/user/oozie路径,说明oozie的sharelib没有放到hdfs上,我们现在要做的就是将oozie的share lib放到Hadoop的对应目录中

     hadoop fs -mkdir -p /user/oozie/share/lib

    没有,我就创建一个空的呗,然后再次运行

    org.apache.oozie.action.ActionExecutorException: Could not locate Oozie sharelib
    

    参考:Oozie 报错的解决方法_qqliang1314的博客-CSDN博客t

    他说在做一个本地映射,找到oozie的lib目录

    /opt/cloudera/parcels/CDH-6.3.2-1.cdh6.3.2.p0.1605554/lib/oozie

    解决参考:安装Oozie共享库并添加Spark2_gmHappy的博客-CSDN博客

  • 相关阅读:
    @SentinelResource(4)
    Flutter笔记:目录与文件存储以及在Flutter中的使用(下)
    真正理解浏览器渲染更新流程
    蚂蚁三面滑铁卢!遭分布式截胡,靠这些笔记潜修 30 天,挺进京东
    生产升级JDK 17 必读手册
    如何在IDEA 中设置背景图片
    【数据结构】Map和Set
    探索大模型技术在运维方向的应用前景
    C#毕业设计——基于C#+asp.net+sqlserver的学生成绩管理系统设计与实现(毕业论文+程序源码)——成绩管理系统
    [附源码]Python计算机毕业设计Django网上书城网站
  • 原文地址:https://blog.csdn.net/qq_38403590/article/details/126191455
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号