• # ODS及DWD层自动化构建##, 220731,


     

     

     

    OracleMetaUtil:根据表名从Oracle中获取这张表的元数据

     限定元素类型,,

    stored as orc

     

    ODS层建表的时候不用指定列

    Avro格式的Schema文件

    hdfs放文件,自动映射,,

    普通表:表的目录下就是文件

     

     

    手动将数据同步到HDFS

    实现自动化建表:表对应HDFS地址

    申明分区

     

    修改partition(dt=),修改hdfs,,

    为什么没有数据??怎么添加数据??

    为了避免读取整张表的所有数据,只读取这个分区的数据

    HiveSQL来生成分区

    load xxx into table partition

    insert into table partition (dt) select …… dt from table

    数据清洗(Data cleaning)是对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供数据一致性。空值,,重复值,,

     

     

    class是关键词,,

     list[学生对象]

     

     

     

     

     

     dwd字段提取思路????????

    表名

    字段名

    select

    for

    元数据对象,,添加对象,

    注释,

    列表推导式

    flatmap

     

     

    int:整形

    float:浮点型

     

     

    自动化就是1拼接字段,2schma文件格式,,,

    难点就是封装类,模块,

    读文件可以复用一个工具类,,

    指定了分区的值:叫做静态

    根据一列的值自动划分:叫做动态

     

     差一列,就注意动态分区和静态分区问题,,,

    review,,,,,,

    视频注释???

    有时间总结一下大致思路,总的+细节难点,,

     ods层

    获取数据库连接,创建库,

    表名列表循环创建表,全量增量表,

    拼接SQL,(获取连接,表名),(拼接建表语句,),获取表的注释通过Oracle,通过表名对应存储格式,location中判断分层  全量增量表  表名前缀  表名,

    游标执行SQL(.join),

    ods映射表流程,申明分区,

     说明分区位置,

    1msck修复分区,

    2alter xxx partition(dt=20210101),循环拼接SQL,alter xxx partition(dt=20210101),修改location修改所在的hdfs地址,

     dwd层,

    建表,select,for每一行遍历各个列,获取到字段信息,表名,注释,

    全量增量表区分,sqoop数据同步不一样,,Oracle数据类型和sparkSQL不一样,

    步骤

    SparkSQL连接,

     拼接建库语句,库名变量,

    获取表名,append拼接,

    获取Oracle字段,

    数据类型,(if判断,timestamp--long,精度为0或1--bigint或decimal,string),pop(-1)删除最后一位,,

    dwd的hdfs路径,,

    自动化建表,循环表名,拼接SQL,游标执行,

    抽取数据,,partition固定值抽取数据要少一个,,

     preview

     

     

     

  • 相关阅读:
    【多服务场景化解决方案】AR虚拟技术助力智能家装
    AJAX基础语法
    【Java杂谈】#1 【MCA JAVA后端架构师】
    详谈跨域问题
    Win10如何彻底关闭wsappx进程?
    小柏实战学习Liunx(图文教程二十一)
    【Django-Docker】Sqlite3.db读取权限不够attempt to write a readonly database-20220803
    腾讯的老照片修复算法,我把它搬到网上,随便玩
    数据结构:树
    大模型RLHF算法更新换代,DeepMind提出自训练离线强化学习框架ReST
  • 原文地址:https://blog.csdn.net/m0_48941160/article/details/126081636