码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 【hadoop | hive】hive on spark教程


    官网

    Hive on Spark

    Hive on Spark: Getting Started
    官方版本兼容
    在这里插入图片描述

    Spark on Hive 和 Hive on Spark区别

    Spark on Hive 和 Hive on Spark的区别与实现
    spark安装以及hive on spark和spark on hive 的配置

    本文实践是采用hive3.1.2和spark3.1.2版本,由于不兼容,故出现一系列问题

    判断hive的引擎方式,设置spark引擎

    –默认方式是mapreduce
    set hive.execution.engine=spark;

    实践中的问题

    hive on spark问题记录

    TODO只能重新编译hive

    2022.8.6
    【hadoop | hive兼容spark3】重新编译hive3兼容spark3

    blog的教程,参考价值较低


    Hive on Spark配置
    Hive on Spark配置 相同(多了填坑的记录)
    hive_spark的配置 雷同
    Hive on Spark配置 雷同,但是有系列文章
    Hive(十三)【Hive on Spark 部署搭建】 雷同,但是有系列文章
    Hive On Spark

    如下为博文中大致步骤

    编译hive源码,指定兼容spark版本

    博文中有提到进行hive源码编译,但没教程。

    上传纯净版spark-jars到hdfs

    由于spark-3.1.2-bin-without-hadoop.tgz已经是纯净版的,仅包含必须的hive-storage-api-2.7.2.jar

    hive中加spark-defaults.conf配置文件,两者独立部署可跳过

    #使用在hive中创建spark配置文件spark-defaults.conf,加入相关配置
    spark.master yarn
    spark.eventLog.enabled true
    spark.eventLog.dir hdfs://192.168.200.177:9820/spark-history
    spark.executor.memory 1g
    spark.driver.memory 1g
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6

    在hive的hive-site.xml中配置spark引擎

    添加如下内容
    
    <property>
        <name>spark.yarn.jarsname>
        <value>hdfs://192.168.200.177:9820/spark-jars/*value>
    property>
      
    
    <property>
        <name>hive.execution.enginename>
        <value>sparkvalue>
    property>
    
    
    <property>
        <name>hive.spark.client.connect.timeoutname>
        <value>10000msvalue>
    property>
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19

    Hive on Spark on YARN配置整理
    多了spark.home配置,可不配置

    <property>
             <name>spark.homename>
             <value>/usr/local/sparkvalue>
         property>
    
    • 1
    • 2
    • 3
    • 4

    8.hive安装 和 Hive环境准备 (hive on Spark 、Yarn队列配置) 多了Yarn配置

    Hive on Spark on Yarn
    采用的是将hive-site.xml复制到spark conf下,但是在hive-site.xml上配置也是可以的。

    Hive On Spark
    多了spark.home配置

    实战中主要是版本不兼容导致一直出现的问题

    hive> create table student(id int, name string);
    OK
    Time taken: 1.847 seconds
    hive> insert into table student values(1,'abc');
    Query ID = root_20220728143930_0f99cf8e-a7ff-4599-a60f-db5f6c207a72
    Total jobs = 1
    Launching Job 1 out of 1
    In order to change the average load for a reducer (in bytes):
      set hive.exec.reducers.bytes.per.reducer=<number>
    In order to limit the maximum number of reducers:
      set hive.exec.reducers.max=<number>
    In order to set a constant number of reducers:
      set mapreduce.job.reduces=<number>
    Failed to execute spark task, with exception 'org.apache.hadoop.hive.ql.metadata.HiveException(Failed to create Spark client for Spark session d6008ccf-f2fe-4403-8536-8b437fd95fe4)'
    FAILED: Execution Error, return code 30041 from org.apache.hadoop.hive.ql.exec.spark.SparkTask. Failed to create Spark client for Spark session d6008ccf-f2fe-4403-8536-8b437fd95fe4
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16

    具体问题如下

    hive on spark问题记录

    简单的依赖包缺失参考解决问题方式

    hive on spark :Failed to execute spark task, 'org.apache.hadoop.hive.ql.metadata.HiveException

    <property>
      <name>spark.homename>
      <value>/soft/sparkvalue>
    property>
    
    • 1
    • 2
    • 3
    • 4

    Spark 使用过程中遇见的问题

  • 相关阅读:
    数据结构与算法C语言版学习笔记(3)-线性表的链式结构:链表
    ventory做U盘启动,使用vmware进行测试U盘系统盘是否制作成功
    Faster R-CNN详解
    ubuntu安装lua
    ISIS协议的基础配置实验,原来做ISIS基础配置还可以这么有趣
    java计算机毕业设计WEB儿童运动馆业务信息系统MyBatis+系统+LW文档+源码+调试部署
    CMIP6数据处理方法与典型案例分析
    Opengl ES之YUV数据渲染
    Java NIO :如何为通道注册多个事件及多线程处理 Accetp 请求
    如何快速通过PMP考试?
  • 原文地址:https://blog.csdn.net/pingyufeng/article/details/126045658
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号