码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 数据处理生产环境_利用MurmurHash3算法在Spark和Scala中生成随机颜色


    需求

            根据给定的轨迹编号在这一列后面生成随机颜色_16

    代码

    1. package test
    2. import org.apache.spark.sql.SparkSession
    3. import org.apache.spark.sql.functions._
    4. import scala.util.hashing.MurmurHash3
    5. object randomV2 {
    6. def main(args: Array[String]): Unit = {
    7. val spark = SparkSession.builder()
    8. .appName("ColorGeneration")
    9. .master("local[*]")
    10. .getOrCreate()
    11. import spark.implicits._
    12. // 创建DataFrame使用提供的数据,这里是测试数据,
    13. //生产环境中我们一般是读取的上一个节点传来的dataframe,直接调下面的方法,自定义函数即可,
    14. //完全可以实现我们想要的功能,可根据我们的具体虚修再做修改
    15. //val df = spark.read.csv("xxx.csv", header = true, inferSchema = true),
    16. val data = Seq(
    17. ("吃饭", "睡觉"),
    18. ("吃饭", "宋江"),
    19. ("郭靖", "宋江"),
    20. ("杨过", "奥特曼")
    21. )
    22. val df1 = data.toDF("a1", "a2")
    23. // 定义基于种子的随机颜色生成函数
    24. def getRandomColorFromSeed(seed: String): String = {
    25. val hashed = MurmurHash3.stringHash(seed) // 使用MurmurHash3生成种子的哈希值
    26. val r = (hashed & 0xFF0000) >> 16
    27. val g = (hashed & 0x00FF00) >> 8
    28. val b = hashed & 0x0000FF
    29. f"#$r%02x$g%02x$b%02x"
    30. }
    31. val getRandomColorWithSeedUDF = udf((seed: String) => getRandomColorFromSeed(seed))
    32. val dfWithColor = df1.withColumn("c1", getRandomColorWithSeedUDF($"a1"))
    33. dfWithColor.show() // 显示包含使用相同随机种子生成的新 "c1" 列的 DataFrame
    34. }
    35. }

  • 相关阅读:
    用python实现基本数据结构【03/4】
    博菱电器创业板过会:收入依赖单一客户,“创二代”袁琪本科肄业
    RocketMQ如何保证消息被有序消费
    分布式系统中的相关概念
    三星SSD硬盘性能压测报告
    传输层 TCP连接管理 优化关闭连接时的TIME-WAIT状态
    1026 Table Tennis
    Git学习笔记10
    工作需要,JAVAer自学python
    什么是Redux?它的核心概念有哪些?
  • 原文地址:https://blog.csdn.net/qq_52128187/article/details/134462982
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号