码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 12(第十一章,数据仓库和商务智能)


    目录

    概述

    目标和原则

    基本概念

    商务智能

    数据仓库

    数据仓库建设方法

    数据仓库架构组件

    加载处理方式

    1、历史数据

    2、批量变更数据捕获(CDC)

    3、准实时和实时数据加载

    活动

    运营分析应用

    方法

    数据仓库构建

    架构演进

    数据处理过程

    数据清洗

    转换集成

    ETL结果

    数据仓库

    星型模型

    雪花模型

    数据聚合

    数据域

    度量指标


    概述

    本文的标题中,数据仓库(Data Warehouse,DW)是后端,商务智能则是前端。

    目标和原则

    数据仓库的建设应该遵循如下知道原则

    基本概念

    商务智能

    商务智能这个术语有两层含义,第一层含义是商务智能指一种理解组织诉求和寻求机会的数据分析活动。第二层含义是商务智能指支持这类数据分析活动的技术集合。

    数据仓库

    数据仓库有两个重要组成部分,一个集成的决策支持数据库和与之相关的用于收集、清理、转换和存储来自各种操作和外部数据源数据的软件程序。

    数据仓库建设方法

    Inmon 把数据仓库定义为“面向主题的、整合的、随时间变化的、相对稳定的支持管理决策的数据集合”,用规范化的关系模型来存储和管理数据。而Kimball则把数据仓库定义为“为查询和分析定制的交易数据的副本”。

    虽然 Inmon 和 Kimball 提的数据仓库建设方法不同,但他们遵循的核心理念相似:

    1. 数据仓库存储的数据来自其他系统。
    2. 存储行为包括以提升数据价值的方式整合数据。
    3. 数据仓库便于数据被访问和分析使用。
    4. 组织建设数据仓库,因为他们需要让授权的利益相关方访问到可靠的、集成的数据。
    5. 数据仓库数据建设有很多目的,涵盖工作流支持、运营管理和预测分析。

    数据仓库架构组件

    源系统,即数据源。

    数据集成ETL。

    数据存储区域。数据存储区域又包括多个不同用途的存储区域:暂存区、参考数据和主数据一致性维度、中央数据仓库、操作性数据存储(ODS)、数据集市、数据立方体(Cubes)。

    加载处理方式

    数据仓库涉及两种主要的数据集成处理类型:历史数据加载和持续不断的数据更新。历史数据通常只需要加载一次,或者为了处理数据问题加载有限的几次,然后再也不会加载。

    1、历史数据

    2、批量变更数据捕获(CDC)

    3、准实时和实时数据加载

    活动

    运营分析应用

    三种经典的OLAP实现方法:

    1. 关系型联机分析处理(ROLAP)。ROLAP 通过在关系数据库 (RDBMS) 的二维表中使用多维技术来支持 OLAP。星型架构是 ROLAP 环境中常用的数据库设计技术。
    2. 多维矩阵型联机分析处理(MOLAP)。MOLAP 通过使用专门的多维数据库技术支持 OLAP
    3. 混合型联机分析处理 (HOLAP)。它是 RLAP 和 MOLAP 的结合。HOLAP 实现允许部分数据以MOLAP 形式存储,而另一部分数据存储在 ROLAP 中。控件的实现方式各不相同,设计师对分区的组合也各有不同。

    方法

    书上写的偏概念,可能重点比较少,这里我举一个简单的例子,以后有事件,单独搞一个相关的规范分享,项目上实际的构建过程。

    数据仓库构建

    架构演进

    数据处理过程

    数据清洗

    转换集成

    ETL结果

    数据仓库

    星型模型

    雪花模型

    数据聚合

    数据域

    度量指标

    • 使用指标
    • 主题域覆盖率
    • 响应事件和性能指标
  • 相关阅读:
    微服务从代码到k8s部署应有尽有系列(十四、部署环境搭建)
    vuInhub靶场实战系列--Kioptrix Level #4
    【THREEJS】如何使用THREEJS展示车辆效果
    Uni-APP 安卓环境本地打包
    java数据结构与算法刷题-----LeetCode572. 另一棵树的子树(经典题,树字符串化KMP)
    Java中如何实现定时任务?
    欧科云链:角力Web3.0,香港如何为合规设线?
    python_data_analysis_and_mining_action-master-8
    B+树索引(7)之索引适用场景(上)
    【Vue】开发实现 Vue 中的自定义指令(2)
  • 原文地址:https://blog.csdn.net/qq_30168227/article/details/138194178
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号