码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • Spark Rdd之mapToPair,flatMapToPair


    文章目录

    • spark.api.java
      • mapToPair
      • flatMapToPair
    • spark.api.scala

    spark.api.java

    mapToPair

    此函数会对一个RDD中的每个元素调用f函数,调用f函数后会进行一定的操作把每个元素都转换成一个类型的对象

    • 源码
      /**
       * Return a new RDD by applying a function to all elements of this RDD.
       */
      def mapToPair[K2, V2](f: PairFunction[T, K2, V2]): JavaPairRDD[K2, V2] = {
        def cm: ClassTag[(K2, V2)] = implicitly[ClassTag[(K2, V2)]]
        new JavaPairRDD(rdd.map[(K2, V2)](f)(cm))(fakeClassTag[K2], fakeClassTag[V2])
      }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • demo
    val rdd: RDD[String] = sc.makeRDD(Seq("java", "scala", "rdd"))
    
        val javaPairRdd: JavaPairRDD[String, Int] = rdd.toJavaRDD().mapToPair(f => {
          (f, 1)
        })
        javaPairRdd.foreach(println)
        //(java,1)
        //(scala,1)
        //(rdd,1)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9

    flatMapToPair

    函数相对于mapToPair多了个flatMap的功能,它能够将元素拆分后在转换成键值对

    • 源码
      /**
       *  Return a new RDD by first applying a function to all elements of this
       *  RDD, and then flattening the results.
       */
      def flatMapToPair[K2, V2](f: PairFlatMapFunction[T, K2, V2]): JavaPairRDD[K2, V2] = {
        def fn: (T) => Iterator[(K2, V2)] = (x: T) => f.call(x).asScala
        def cm: ClassTag[(K2, V2)] = implicitly[ClassTag[(K2, V2)]]
        JavaPairRDD.fromRDD(rdd.flatMap(fn)(cm))(fakeClassTag[K2], fakeClassTag[V2])
      }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • demo
     val flatMapPairRdd: JavaPairRDD[String, Int] = rdd.toJavaRDD().flatMapToPair(f => {
          val arrayList = new util.ArrayList[(String, Int)]()
          arrayList.add((f, 1))
          arrayList.iterator()
        })
    
        flatMapPairRdd.foreach(println)
        //(java,1)
        //(scala,1)
        //(rdd,1)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10

    spark.api.scala

    scala 无这两个算子,以下是代替方案(麻烦),建议还是转javaRdd吧
    maptoPair = map
    flatMapToPair = flatMap + map

  • 相关阅读:
    一文教你搞懂Go中栈操作
    zKSync 2.0 新特征解析
    危重病入院镁浓度与乳酸酸中毒的关系
    Abbkine通用型免疫荧光工具箱(抗小鼠Dylight 488)方案
    EN 1504-5混凝土结构保护和修理用产品混凝土喷射—CE认证
    ③【Docker】Docker部署Nginx
    Linux ARM平台开发系列讲解(IPCF异核通信) 2.11.2 IPCF异核通信框架分析
    基于一种新颖强化学习 (RL) 的电机控制与电力驱动控制研究(Python代码实现)
    Python爬虫——爬取某网站的视频
    连PostgreSQL问题:expected authentication request from server, but received v
  • 原文地址:https://blog.csdn.net/Lzx116/article/details/126609419
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号