一、ODS
操作型数据仓库,最早的数据仓库模型。特点是数据模型采取了贴源设计,业务系统数据库数据结构是怎样的,ODS数据库的结构就是怎样的。所不同的是ODS数据库可以提供数据变化的历史,所以ODS数据库中每张表都会增加一个日期类型,表示数据的时点,将每天数据的变化情况都存下来,这样有利于数据的分析。
二、数据仓库
简称EDW,企业级数据仓库,现在大家都在说的就是这个。所不同的是每个行业的EDW都有一个通用的数据模型,结构精简,扩展性强,应用性强,数据模型不像ODS乃样会有很大的冗余。
主要有两种分类:
(1)操作型数据库,具有的特点:业务支撑、细节数据、日常收录、量少频率高,如mysql
(2)分析型数据库,具有的特点:历史数据、汇总数据、定期更新、量大频率低,如hive
数据仓库特点:
1.面向主题:决策关心的重点领域,一个主题,多个操作型数据库
2.集成:多个数据源→汇总,具有一致关联性
3.相对稳定:长期保存,大量查询,少量更新
4.反映历史变化:几年以上的数据、过去时间分析、将来预测
其基本组成如下:


相关的概念工具如下:

三、数据集市
简称DM,以某个应用为出发点而建设的局部DW,为什么这么说,DM只关心自己需要的数据。不会全盘考虑企业整体的数据架构和应用,每个应用都有自己的DM。所以DM可以基于仓库建设也可以独立建设。
四、DW与ODS的区别


本文整理参考自以下网站: