码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • spark sql如何行转列


    在数据仓库中,行转列通常称为”变形”(Pivoting) 或 “透视”(Pivoting),可使用Spark SQL的pivot语句实现。下面是一个简单的示例:

    假设我们有如下表格:

    1. +-------+-------+------+
    2. | name | brand | year |
    3. +-------+-------+------+
    4. | Alice | BMW | 2017 |
    5. | Bob | Tesla | 2018 |
    6. | Alice | Tesla | 2019 |
    7. | Bob | BMW | 2020 |
    8. +-------+-------+------+

    我们想要把该表中的品牌列转换为4列,分别表示不同的品牌,而值则为对应品牌的年份。具体操作如下:

    1. SELECT name,
    2. COALESCE(BMW, 0) AS BMW,
    3. COALESCE(Tesla, 0) AS Tesla
    4. FROM (
    5. SELECT name,
    6. brand,
    7. year
    8. FROM my_table
    9. ) T
    10. PIVOT (
    11. MAX(year)
    12. FOR brand IN ('BMW', 'Tesla')
    13. )

    运行上面的代码,得到的结果如下所示:

    1. +-------+------+------+
    2. | name | BMW | Tesla|
    3. +-------+------+------+
    4. | Alice | 2017 | 2019 |
    5. | Bob | 2020 | 2018 |
    6. +-------+------+------+

    可以看到,原本的品牌列已经被转换成了两个新的列,并且对于每个人名,都有对应的品牌年份信息填充其中。这就是典型的行转列操作。其中,COALESCE函数用于处理可能存在的空值情况。

     

  • 相关阅读:
    Centos根目录空间占满的解决思路
    redis哨兵机制
    【网络编程】网络层——IP协议
    情人节---快来学习一下程序员的专属浪漫吧
    SPA项目开发之表单验证&增删改功能
    基于python下django框架 实现校园教室实验室预约系统详细设计
    想跟大家说点心里话~(希望大家都看一下谢谢各位 !!)
    【计算机视觉 | 目标检测】arxiv 计算机视觉关于目标检测的学术速递(8 月 24 日论文合集)
    Spark学习(7)-SparkSQL函数定义
    使用Redis完成商品秒杀业务
  • 原文地址:https://blog.csdn.net/linweidong/article/details/133721206
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号