码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • SparkSQL 与 Hive 如何整合?关键步骤有哪些?


    根据原理,就是Spark能够连接上Hive的MetaStore就可以了。所以:

    1.MetaStore需要存在并开机

    2.Spark知道MetaStore在哪里(IP端口号)

    SparkSQL 和 Hive整合关键四步骤

    第一步:将hive-site.xml拷贝到spark安装路径conf目录

    第二步:将mysql的连接驱动包拷贝到spark的jars目录下

    第三步:Hive开启MetaStore服务

    第四步:测试SparkSQL整合Hive是否成功

    Spark on Hive原理和配置

    第一步:将hive-site.xml拷贝到spark安装路径conf目录

    node1执行以下命令来拷贝hive-site.xml到所有的spark安装服务器上面去

    1. cd /export/server/hive/conf
    2. cp hive-site.xml /export/server/spark/conf/
    3. scp hive-site.xml root@node2:/export/server/spark/conf/
    4. scp hive-site.xml root@node3:/export/server/spark/conf/

    第二步:将mysql的连接驱动包拷贝到spark的jars目录下

    node1执行以下命令将连接驱动包拷贝到spark的jars目录下,三台机器都要进行拷贝

    1. cd /export/server/hive/lib
    2. cp mysql-connector-java-5.1.32.jar  /export/server/spark/jars/
    3. scp mysql-connector-java-5.1.32.jar  root@node2:/export/server/spark/jars/
    4. scp mysql-connector-java-5.1.32.jar  root@node3:/export/server/spark/jars/

    第三步:Hive开启MetaStore服务

    (1)修改 hive/conf/hive-site.xml新增如下配置

    远程模式部署metastore 服务地址

    1. <?xml version="1.0"?>
    2. <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
    3. <configuration>
    4.     <property>
    5.         <name>hive.metastore.uris</name>
    6.         <value>thrift://node1:9083</value>
    7.     </property>
    8. </configuration>

    (2) 后台启动 Hive MetaStore服务

    1. nohup /export/server/hive/bin/hive --service metastore 2>&1 >> /var/log.log &

    第四步:测试SparkSQL整合Hive是否成功

    [方式1]Spark-SQL方式测试

    1. cd /export/server/spark
    2. bin/spark-sql --master local[2] --executor-memory 512m --total-executor-cores 1

    执行成功后的界面:进入到spark-sql 客户端命令行界面

    查看当前有哪些数据库, 并创建数据库

    1. show databases;
    2. create database sparkhive;

    [方式2]PySpark-Shell方式启动:

    1. bin/spark-shell --master local[3] 或bin/pyspark --master local[2]
    2. spark.sql("show databases").show()

     

  • 相关阅读:
    C++入门(2)—函数重载、引用
    四种静态查找方法(c代码解析)
    树莓派使用docker搭建owncloud私有云--外挂硬盘
    巴西队提前出线,预定大力神杯?数据分析告诉你,到底谁才是冠军
    拥抱 Spring 全新 OAuth 解决方案
    平行哲学与智能技术:平行产业与智慧社会的对偶方程与测试基础
    elementUI el-table+树形结构子节点选中后没有打勾?(element版本问题 已解决)
    A1078 Hashing(25分)PAT 甲级(Advanced Level) Practice(C++)满分题解【哈希表】
    测试的分类
    Java堆内存溢出问题分析和解决
  • 原文地址:https://blog.csdn.net/Blue92120/article/details/130820436
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号