• 数据仓库与数据挖掘的第三章课后习题


    第三章习题

    1.SQL Server SSAS提供了所有业务数据的统一整合视图,可以作为传统报表、  在线分析处理(OLAP)分析、关键性能指示器记分卡和数据挖掘的基础。

    2.数据仓库的概念模型通常采用信息包图法来进行设计,要求将其5个组成部分(包括 名称、维度类别、层次和 度量)全面地描述出来。

    3.数据仓库的逻辑模型通常釆用星型图法来进行设计,要求将星型图的各类逻辑实体完整地描述出来。

    4.按照事实表中度量的可加性情况,可以把事实表对应的事实分为4种类型: 事务事实快照事实线性项目事实和事件事实。

    5.确定了数据仓库的粒度模型以后,为提高数据仓库的使用性能,还需要根据用户需求设计聚合

    6.在项目实施时,根据事实表的特点和用户的查询需求,可以选用时间、业务类 型、区域和下属组织等多种数据分割类型。

    7.当维表中的主键在事实表中没有与外键关联时,这样的维称为退化维。它与事实表并无关系,但有时在査询限制条件(如订单号码、出货单编号等)中需要用到。

    8. 维度可以根据其变化快慢分为无变化维度、缓慢变化维度和剧烈变化维度三类。

    9.数据仓库的数据量通常较大,旦数据一般很少更新,可以通过设计和优化索引结构来提高数据存取性能。

    10.数据仓库数据库常见的存储优化方法包括表的归并与簇文件、反向规范化,引入冗余、表的物理 分割(分区)。

    11.什么是信息包图法?它为什么适用于数据仓库的概念模型的设计?

    答:信息包图法,也叫用户信息需求表,就是在一张平面表格上描述元素的多维性,其中的每一个维度用平面表格的一列表示,通常的维度如时间、地点、产品和顾客等;而细化本列的对象就是类别,例如时间维度的类别可以细化到年、月、日,甚至小时;平面表格的最后一行(代表超立方体中的单元格)即为指标度量值,例如,某年在某销售点的某类产品的实际销售额。创建信息包图时需要确定最高层和最低层的信息需求,以便最终设计出包含各个层次需要的数据仓库 总之,信息包图法是一种自上而下的数据建模方法,即从用户的观点开始设计(用户的观点是通过与用户交流得到的),站在管理者的角度把焦点集中在企业的一个或几个主题上,着重分析主题所涉及数据的多维特性,这种自上而下的方法几乎考虑了所有的信息源,以及这些信息源影响业务活动的方式。

    12.简述数据仓库系统设计过程。

    答:收集、分析和确认业务分析需求,分析和理解主题和元数据、事实及其量度、粒度和维度的选择与设计、数据仓库的物理存储方式的设计等。

    13.一个数据仓库系统的建立通常需要经过哪些步骤?

    答:(1)收集和分析业务需求; (2)建立数据模型和数据仓库的物理设计; (3)定义数据源; (4)选择数据仓库技术和平台; (5)从操作型数据库中抽取、清洗及转换数据到数据仓库; (6)选择访问和报表工具,选择数据库连接软件,选择数据分析和数据展示软件; (7)更新数据仓库。

    14.运行SQL Server的Adventure Works DW示例数据库,建立多维数据模型练习。

    答:参考 3.3 节的过程。

  • 相关阅读:
    Cortex-M3如何跳出BusFault,跳过出错代码,程序往下执行
    钉钉统计部门个人请假次数go
    多线程扒取MAVEN中央仓所有jar的小程序
    【通义千问】Qwen从本地加载分词器报错‘‘tokenizer class not exist‘‘
    HARQ即混合自动重传请求(Hybrid Automatic Repeat reQuest)
    用Rust写个猜数字的游戏(详解)
    NOIP2023模拟5联测26 零
    梯度引导的分子生成扩散模型- GaUDI 评测
    Lumiprobe 活性染料丨氨基染料:花青5胺
    MySQL表字段的约束与默认值设置方法
  • 原文地址:https://blog.csdn.net/qq_51165234/article/details/126918924