主数据是有关业务实体(如雇员、客户、产品、金融结构、资产和位置等)的数据,这些实体为业务交易和分析提供了语境信息。并且主数据应该代表与关键业务实体有关的权威的、最准确的数据。
一般组织的主数据包括下列事物的数据:
参与方。个人和组织,以及他们所扮演的角色,如客户、公民、病人、厂商、供应商、代理商、商业伙伴、竞争者、雇员或学生等。
产品和服务,包括内部和外部的产品及服务。
财务体系,如合同、总账、成本中心、利润中心。
位置信息。如地址和GPS坐标。
针对于主数据的识别方法,可以参考石秀峰石老师在他的书《一本书讲透数据治理》里写的“主数据特征识别法”:
哪些角色、组织、地点和事物被反复引用。
哪些数据被用来描述人、组织、地点和事物。
这些数据是否能体现业务核心价值?这一点非常非常重要!
这些数据是否描述的是独立的实体?
这些数据是否相对稳定的?
这些数据是否会在其他系统共享?
这些数据是否具有唯一性,并且可以被唯一标识?
这些数据是否长期有效?(如果是短期使用,一般不作为主数据。但是这个长期短期和业务有关)