(1)数据库的演变 (1.1 数据库的简要发展史,1.2 数据库的由来和发展)
(2)数据模型 (1.3 数据描述,1.4 数据抽象的级别)
(3)数据库系统 (1.5 数据库管理系统,1.6 数据库系统)
1.1 数据库的简要发展史
数据库技术探索阶段(1959~1967) 20世纪50年代出现“数据库”(DataBase)这个名词。 1963年,美国Honeywell公司的IDS(Integrated Data Store)系统投入运行,揭开了数据库技术的序幕。
数据库技术确立阶段(1968~1975) 20世纪70年代是数据库蓬勃发展的年代,网状系统和层次系统占据了整个数据库商用市场,而关系系统仅处于实验阶段。
数据库技术的成熟阶段(1976~1980s前期) 关系理论日臻完善,关系数据库系统迅速发展。
数据库技术的深化发展阶段(1985年以后) 数据库方法逐步理论化 新型数据库系统,数据库技术+其它计算机技术结合
1.2 数据库的由来和发展
数据库技术是应数据管理任务的需要而产生的。
数据管理:数据的收集、整理、组织、存储、维护、检索、传送等操作。
数据管理随着计算机软硬件的发展而不断发展,经历了以下四个阶段:
人工管理阶段 文件系统阶段 数据库阶段 高级数据库阶段
数据库应用中的术语
DBS=DBMS+DB
数据库 数据库管理系统 数据库系统
数据库( Database,简记为DB)DB是长期存储在计算机内、有组织的、统一管理的相关数据的集合。 DB的特点: 为各种用户共享, 具有较小冗余度, 较高的数据独立性。
数据库管理系统(Database Management System,简记为DBMS)DBMS是位于用户与操作系统(OS)之间的一层数据管理软件,它为用户或应用程序提供访问DB的方法,包括 DB的建立 查询、更新 各种数据控制。
数据库系统 (Database System,简记为DBS)DBS是采用数据库技术的计算机系统。主要包括四个部分:数据、硬件、软件和用户。
1.3 数据描述
从客观事物的特性到计算机中的具体表示有一个抽象的过程,经历了三个世界: 现实世界 信息世界 机器世界
1.3.1 概念设计(信息世界)中的数据描述
实体(entity): 客观存在,可以相互区别的事物 实体可以是具体对象也可以是抽象对象
实体集(entity set): 性质相同的同类实体的集合
属性(attribute): 实体所具有的某一特性
实体标识符(identifier): 能惟一标识实体的属性或属性集。也称为关键码(key),或简称为键。
1.3.2 逻辑设计(机器世界)中的数据描述
文件(file) 同一类记录的集合称为文件。
记录(record) 字段的有序集合称为记录。
字段(field) 标记实体属性的命名单位称为字段,或数据项。它是可以命名的最小信息单位。
关键码(key) 能惟一标识文件中每个记录的字段或字段集,称为记录的关键码(简称为键)。
1.3.3 物理设计中的数据描述
位(bit) 字节(byte) 字(word) 块(block) 桶(bucket) 卷(volume)
1.3.4 数据联系的描述
联系(relationship) 实体之间的相互关系。 与一个联系有关的实体集个数,称为联系的元数。
一元联系、二元联系、三元联系
二元联系的三种类型: 一对一联系 一对多联系 多对多联系
一对一联系(1:1) 如果实体集E1中每个实体至多和实体集E2中的一个实体有联系,反之亦然,那么实体集E1和E2的联系称为“一对一联系” 。 实例 座位与乘客之间的联系
一对多联系(1:n) 如果实体集E1中每个实体可以与实体集E2中任意个(零个或多个)实体间有联系,而E2中每个实体至多和E1中一个实体有联系,那么称E1对E2的联系是“一对多联系” 。 实例 车间与工人之间的联系 班级与学生之间的联系
多对多联系(m:n) 如果实体集E1中每个实体可以与实体集E2中任意个(零个或多个)实体有联系,反之亦然,那么称E1和E2的联系是“多对多联系” 。 实例 课程与学生之间的联系
1.4 数据抽象的级别
数据模型
数据模型是对现实世界的抽象,表示事物及事物之间的联系,使之能存放到计算机中,并通过计算机软件进行处理。
目前广泛使用的两种数据模型:
概念数据模型 是按用户的观点来对数据建模。
逻辑数据模型 是按计算机系统的观点对数据建模。
1.4.1 数据抽象的过程
1.4.2 概念模型
概念模型的特点
从用户需求的观点出发对数据建模
独立于软件硬件
数据库设计人员和用户之间进行交流的工具
实体联系模型
从现实世界抽象出实体类型及实体间联系,然后用实体联系图(ER图)表示数据模型。
1.4.3逻辑模型
逻辑模型的特点
从数据库实现的观点出发对数据库建模
独立于硬件,但依赖于软件(DBMS)
是数据库设计人员与应用程序员之间进行交流的工具。
典型的逻辑数据模型包括:层次、网状、关系和面向对象模型。
1.4.4 外模型和内模型
外模型的特点
外模型是逻辑模型的一个子集
反应用户使用数据库的观点
外模型的优点
简化用户观点,数据库的安全性
内模型 数据在磁盘的存储方式(文件结构、存取设备(外存空间分配)和存取方法(索引)等
与软件硬件紧密相连
1.4.5 三层模式两级映像
数据库的三级体系结构
外部级:某一用户看到与处理的数据
逻辑级:从全局角度理解、管理数据
内部级:存储在介质上的数据
模型与模式
外模式是用户与数据库系统的接口,是用户用到的那部分数据的描述。
逻辑模式是数据库中全部数据的整体逻辑结构的描述。
内模式是数据库在物理存储方面的描述,定义所有内部记录类型、索引和文件的组织方式,以及数据控制方面的细节。
模式/内模式映象存在于概念级和内部级之间,用于定义概念模式和内模式之间的对应性。
外模式/模式映象存在于外部级和概念级之间,用于定义外模式和概念模式之间的对应性。
1.4.6 两级数据独立性
数据独立性(data independence)是指应用程序和数据库的数据结构之间相互独立,不受影响。 逻辑数据独立性 物理数据独立性
1.5 数据库管理系统
1.5.1 DBMS的工作模式(用户角度)
接受应用程序的数据请求和处理请求
将用户的数据请求(高级指令)转换成复杂的机器代码(低层指令)
实现对数据库的操作
从对数据库的操作中接受查询结果
对查询结果进行处理(格式转换)
将处理结果返回给用户
1.5.2 DBMS的主要功能
数据库的定义功能
数据库的操纵功能
数据库的保护功能
数据库的维护功能
数据字典
1.6 数据库系统
数据库系统(Database System,简记为DBS) 是采用数据库技术的计算机系统。主要包括四个部分:数据、硬件、软件和用户。