- 静态转储:冷备份;不允许存取修改;快速备份、容易归档(直接物理复制操作);只能提供某一时间点的恢复
- 动态转储:热备份;允许存取修改;转储和用户事务可并发执行;可秒级修复;禁止出错,备份不成功,结果几乎无效
- 即局部数据库位于不同物理位置,使用一个全局DBMS将所有局部数据库联网管理;逻辑上是一个整体
- 集中式数据库:所有数据库集中在同一个地方
- 一个面向主题的、集成的、非易失的、且随时间变化的数据集合,用于支持管理决策
- 数据库:同源,如学生信息和教师信息分别为一个数据库
- 数据仓库:则无论是学生还是教师都放在一起
- 数据源:(基础,数据源泉)
- 数据的存储与管理:(核心)
- OLAP(联机分析处理)服务器:(分析工具)
- 前端工具:(开发工具)
- 四个主要阶段:
- 数据预处理:抽取、转换、加载(ETL)
- 建立数据库
- 数据分析:关键;一般采用OLAP和数据挖掘技术
- 数据展现:保障分析结果的可视化
- 降低冗余,提高性能
- 规范化程度到3NF最佳
- 可能造成数据重复存储;数据完整性问题;降低修改速度
- 传统数据一般存储于数据库,大数据一般存储于数据仓库
- 处理大数据,一般使用集群平台,称为大数据处理系统
- π:投影;列 ——> select:选择;列
- from:默认做笛卡尔积,则需从自然连接转换为笛卡尔积;即取属性列相同且值相同
- R∞S ——> R x S 即 R.B = S.B 和 R.C = S.C