• 也谈数据治理


    1.数据治理的概念

    数据治理,对于有数据的企业来说,是一个非常重要的内容。数据治理,之所以重要,是因为当前,数据已成为一种重要的资产,是组织进行管理、生产和行动的重要职称。

    笔者结合了多方资料,给数据治理定义如下:数据治理是指为确保数据安全、合理所有、准确、可用和易用所执行的所有操作。它包括人们必须采取的行动、必须遵循的流程以及在整个数据生命周期中为其提供支持的技术。[1]

    从这个意义上来讲,任何有数据的组织,都会有数据治理,但数据治理的水平有高低之分。数据治理的水平,体现为数据使用的便利,以及数据使用的安全。

    2.数据治理的要点

    一般来说,数据治理会涉及两点:(1)数据使用是否方便;(2)数据是否安全。这两点,是数据治理的核心要点。笔者也看了很多数据治理的博文,但其实对组织来说,数据治理的核心依然是使用数据和确保数据安全。

    2.1 数据使用的便利性

    数据使用的便利性,是数据治理的基础。对于使用数据的组织来说,如果使用数据不能带来便利,也就意味着不可能再进行数据相关的工作;与之相应的,数据治理也就无从谈起。

    数据的使用,一定是带来便利的。在数据带来便利的基础上,可以进行的事情是:

    (1)让数据带来更多便利;

    (2)确保数据的整体性和通畅性,避免数据孤岛;

    (3)读数据进行整理和清洗。

    2.2 数据的安全性

    数据治理的另一个要点是安全性。只有安全使用数据,数据才能真正有价值。

    数据安全不等于什么都要管,或什么都不管。数据安全的要点其实要达到两个要点:(1)既方便使用者使用;(2)又不让不安全的事情发生、

    数据安全性的规则为:

    (1)宏观和整体的安全;

    (2)分权的安全。

    这两条规则是相辅相成的。宏观和整体的安全是基础;对于组织外部来说,数据不会被随意侵占;基础数据的保存和安全规则是长期和持续存在的。同时,数据是属于公司整体所有,分部门和权限让不同部门和权限所有者进行管理。在使用数据时,不同部门和权限所有者需要按照规则使用数据。

    正是由于数据按照不同部门和不同权限所有者使用,按照合理规则使用,才让数据具有了治理属性。数据治理这一词,才更准确。

    3.数据治理的实现路径

    数据治理如何实现,其实是数据拥有组织最关心的内容。

    一般来说,数据治理实现的思路是:在标准和安全、质量的两个基本规则的限制之下,由基础的硬件设施、搭建数据治理平台,再到建立良好的数据治理规则和核心体系。

    基于该方法,数据治理的结构图一般都会如下所示:

    这其中,让数据变得通畅,建立合理的数据使用规则,是最重要的事情。

    当然,在实际操作的时候,一定要注意:数据治理对于组织来说,就是一次权力的再分配。这其实意味着:(1)数据治理从来都是一把手工程;(2)数据治理直接负责人,一定要合理的协调能力,协调各方,并最终建立数据治理规则。

    4.数据治理的误区

    数据治理的误区主要如下:

    (1)认为数据治理不重要。实际上,数据治理很重要。任何有数据的组织都存在数据治理。正常情况下,数据治理水平高的组织,其效率和安全性就更高。

    (2)认为数据治理最重要。实际上,数据治理是效率提升,但前提是必须有效率。

    (3)组织内不同部门把自有数据当做自己的“自留地”,信息孤岛广泛存在;

    (4)数据治理的规则同一化。而实际上,没有一个统一的数据治理规则。但让数据高效和安全使用是任何组织进行数据治理提升的根本目的。

    (5)认为数据治理可以一劳永逸。实际上,数据治理永远在路上。

    5.数据治理的涉及技术

    数据治理涉及的技术一般如下:

    (1)数据库技术。数据治理的基础是数据,数据存储的载体一般是数据库。目前主流的数据库有Oracle、MySQL、SQLServer、HBase、MongoDB等。

    (2)数据加密技术。数据加密主要有加密算法,主要有对称加密和不对称加密。数据加密算法一般为RSA、MD5等。

    (3)数据分析技术。数据分析技术一般是指对数据使用进行分析,从而让数据高效。比较常见的数据分析技术为常见的统计方法和机器学习方法。数据分析技术的工具有Excel、Stata、EViews等。

    6.数据治理的改进和持续优化

    数据治理需要持续优化和改进的。数据治理的改进和持续优化应该明确如下规则:

    (1)明确数据治理的规则;

    (2)进行持续的改进。

    参考资料

    [1]https://cloud.google.com/learn/what-is-data-governance?hl=zh-cn

    [2]数据治理怎么做?这篇万字长文终于讲清楚了! - 知乎

    [3]数据治理工具和解决方案 | IBM

    [4]什么是加密? 数据加密定义 | IBM

  • 相关阅读:
    2022 年牛客多校第六场补题记录
    紧跟热点:教你如何快速掌握ChatGPT
    圆弧插补-逐点比较法
    网站如何部署到阿里云服务器教程
    以太坊实现、语言模型应用与实用工具 | 开源日报 0817
    北大惠普金融指数-匹配企业绿色创新指数2011-2020年:企业名称、年份、行业分类等多指标数据
    黄金分割算法的一个简单实现
    Reading Note(10)——AutoBridge
    【汇编】内存中字的存储、用DS和[address]实现字的传送、DS与数据段
    ArduPilot开源飞控之AP_Baro_ExternalAHRS
  • 原文地址:https://blog.csdn.net/wangzhezhilu001/article/details/125991910