• 【Datahub】一站式元数据管理平台:Datahub宝典


    通过本文档,可以快速的入门Datahub,成功的搭建Datahub并且获取到数据库的元数据信息。是从0到1的入门文档,更多Datahub的高级功能,可以关注后续的文章更新。

    文档共分为6个部分,层级结构如下图所示。

    图片

    一、数据治理与元数据管理

    背景

    为什么要做数据治理?业务繁多,数据繁多,业务数据不断迭代。人员流动,文档不全,逻辑不清楚,对于数据很难直观理解,后期很难维护。

    在大数据研发中,原始数据就有着非常多的数据库,数据表。

    而经过数据的聚合以后,又会有很多的维度表。

    近几年来数据的量级在疯狂的增长,由此带来了系列的问题。作为对人工智能团队的数据支撑,我们听到的最多的质疑是 “正确的数据集”,他们需要正确的数据用于他们的分析。我们开始意识到,虽然我们构建了高度可扩展的数据存储,实时计算等等能力,但是我们的团队仍然在浪费时间寻找合适的数据集来进行分析。

    也就是我们缺乏对数据资产的管理。事实上,有很多公司都提供了开源的解决方案来解决上述问题,这也就是数据发现与元数据管理工具。

    元数据管理

    简单地说,元数据管理是为了对数据资产进行有效的组织。它使用元数据来帮助管理他们的数据。它还可以帮助数据专业人员收集、组织、访问和丰富元数据,以支持数据治理。

    三十年前,数据资产可能是 Oracle 数据库中的一张表。然而,

  • 相关阅读:
    List集合
    java.lang.unsupportedClassVersionError
    OpenWRT配置SFTP远程文件传输,实现数据安全保护
    在 Python 中使用 Selenium 从下拉菜单中选择选项
    第七章:最新版零基础学习 PYTHON 教程—Python 列表(第五节 -检查Python列表中是否存在元素)
    C语言预处理
    Centos7修改主机名hostname
    2024.6.12 作业 xyt
    6面向对象中的继承
    flowable工作流所有业务概念
  • 原文地址:https://blog.csdn.net/m0_54252387/article/details/126171360