码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • Flink SQL --Flink 整合 hive


    1、整合
    1. # 1、将依赖包上传到flink的lib目录下
    2. flink-sql-connector-hive-3.1.2_2.12-1.15.2.jar
    3. # 2、重启flink集群
    4. yarn application -list
    5. yarn application -kill application_1699579932721_0003
    6. yarn-session.sh -d
    7. # 3、重新进入sql命令行
    8. sql-client.sh
    2、Hive catalog

    catalog(元数据) ---> database ---> table ---> 数据 --- > 列

    1. -- 1、开启hive的元数据服务
    2. nohup hive --service metastore &
    3. -- 2、创建hive catalog
    4. CREATE CATALOG myhive WITH (
    5. 'type' = 'hive',
    6. 'hive-conf-dir' = '/usr/local/soft/hive-3.1.2/conf'
    7. );
    8. -- 查看所有的catalog
    9. -- default_catalog: 默认的元数据,将元数据保存在内存中
    10. show catalogs;
    11. --3、切换catalog
    12. use catalog myhive;
    13. --4、在flink中就可以使用hive中已经创建好的表
    14. select * from student;
    15. -- 可以从catalog开始定位一张表
    16. select * from myhive.`default`.student;
    17. -- 将flink的表结构保存到hive catalog中
    18. -- hive中可以看到flink创建的流表,但是在hive中不能查询flink的流表
    19. create database flink;
    20. use flink;
    21. -- 创建flink动态表
    22. CREATE TABLE students_kafka (
    23. `offset` BIGINT METADATA VIRTUAL, -- 偏移量
    24. `event_time` TIMESTAMP(3) METADATA FROM 'timestamp', --数据进入kafka的时间,可以当作事件时间使用
    25. sid STRING,
    26. name STRING,
    27. age INT,
    28. sex STRING,
    29. clazz STRING
    30. ) WITH (
    31. 'connector' = 'kafka',
    32. 'topic' = 'students', -- 数据的topic
    33. 'properties.bootstrap.servers' = 'master:9092,node1:9092,node2:9092', -- broker 列表
    34. 'properties.group.id' = 'testGroup', -- 消费者组
    35. 'scan.startup.mode' = 'earliest-offset', -- 读取数据的位置earliest-offset latest-offset
    36. 'format' = 'csv' -- 读取数据的格式
    37. );
    3、Hive functions

    在Flink中的使用hive中的函数:

    1. -- 加载hive函数
    2. LOAD MODULE hive WITH ('hive-version' = '3.1.2');
    3. -- 使用hive的函数
    4. select split('java,spark',',');

  • 相关阅读:
    Win10安装TensorRT
    2023 | 组蛋白乳酸化如何影响免疫、自噬最新发现!
    新能源行业经销商在线系统:轻松掌握经销商,优化分销渠道链
    shell算数运算指令、shell的if分支结构使用场景及相关代码
    S-Clustr(影子集群)僵尸网络@Мартин.
    Spring Boot进阶(55):SpringBoot之集成MongoDB及实战使用 | 超级详细,建议收藏
    这五个bug,论文绘图时千万别碰!
    持续集成部署-k8s-部署利器-Helm
    Python截取视频帧
    Netty模型
  • 原文地址:https://blog.csdn.net/m0_62078954/article/details/134386036
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号