码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 文件系统类数据读取与保存HBase_大数据培训


    HBase

    由于 org.apache.hadoop.hbase.mapreduce.TableInputFormat 类的实现,Spark 可以通过Hadoop输入格式访问HBase。这个输入格式会返回键值对数据,其中键的类型为org. apache.hadoop.hbase.io.ImmutableBytesWritable,而值的类型为org.apache.hadoop.hbase.client.

    Result。

    (1)添加依赖

    (2)从HBase读取数据

    package com.atguigu

    import org.apache.hadoop.conf.Configuration

    import org.apache.hadoop.hbase.HBaseConfiguration

    import org.apache.hadoop.hbase.client.Result

    import org.apache.hadoop.hbase.io.ImmutableBytesWritable

    import org.apache.hadoop.hbase.mapreduce.TableInputFormat

    import org.apache.spark.rdd.RDD

    import org.apache.spark.{SparkConf, SparkContext}

    import org.apache.hadoop.hbase.util.Bytes

    object HBaseSpark {

      def main(args: Array[String]): Unit = {

        //创建spark配置信息

        val sparkConf: SparkConf = new SparkConf().setMaster(“local[*]”).setAppName(“JdbcRDD”)

        //创建SparkContext

        val sc = new SparkContext(sparkConf)

        //构建HBase配置信息

        val conf: Configuration = HBaseConfiguration.create()

        conf.set(“hbase.zookeeper.quorum”, “hadoop102,hadoop103,hadoop104”)

        conf.set(TableInputFormat.INPUT_TABLE, “rddtable”)

        //从HBase读取数据形成RDD

        val hbaseRDD: RDD[(ImmutableBytesWritable, Result)] = sc.newAPIHadoopRDD(

          conf,

          classOf[TableInputFormat],

          classOf[ImmutableBytesWritable],

          classOf[Result])

        val count: Long = hbaseRDD.count()

        println(count)

        //对hbaseRDD进行处理

        hbaseRDD.foreach {

          case (_, result) =>

            val key: String = Bytes.toString(result.getRow)

            val name: String = Bytes.toString(result.getValue(Bytes.toBytes(“info”), Bytes.toBytes(“name”)))

            val color: String = Bytes.toString(result.getValue(Bytes.toBytes(“info”), Bytes.toBytes(“color”)))

            println(“RowKey:” + key + “,Name:” + name + “,Color:” + color)

        }

        //关闭连接

        sc.stop()

      }

    }

    3)往HBase写入

  • 相关阅读:
    23软考备考已开始,网络工程师知识点速记~(2)
    某程序员:30岁了,老婆管钱,背着我买了50万股票,亏了20w,强制她清仓后又买了36万
    windos本地文件上传到ubuntu
    【深度学习21天学习挑战赛】6、使用VGG16模型实现卷积神经网——识别眼睛状态
    单调栈题目:接雨水
    烟台专利的类型个人申请专利有哪些好处?
    卷积神经网络 图像识别,卷积神经网络图像增强
    惊了!10万字的Spark全文!
    RUP生命周期在时间上分为4个顺序阶段,分别是:初始阶段、细化阶段、构建阶段和交付阶段
    Node Sass version 9.0.0 is incompatible with ^4.0.0.
  • 原文地址:https://blog.csdn.net/zjjcchina/article/details/126370584
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号