好久不见,甚是想念。
笔者最近有时间整理关于大数据的一些基础知识点,整理的目不在于能提升多少技能,关键在于巩固一些很基础的知识点,毕竟互联网就是基础略稳固的人比较有优势,在遇到或发现一些技术问题时,从底层科学的去理解这些问题,说不定会有另一片天下。
那么本期带来大数据面是:关系型数据库
关系型数据库是建立在关系模型基础上的数据库,借助于集合代数等数学概念和方法来处理数据库中的数据。现实世界中的各种实体以及实体之芹源间的各种联系均用关系模型来表示。关系模型是由埃德加・科德于1970年首旦液先提出的,并配合“科德十二定律”。关系模型由关系数据结构、关系操作集合、关系完整性约束三部分组成。
它使用表格的形式来存储数据。每个表格由行和列组成,每一行代表一个记录,每一列代表一个字段。
关系型数据库的底层实现主要包括以下几个方面:
1、数据存储
关系型数据库的数据存储方式是基于表格的。每个表格由一组列组成,每列定义了该列的数据类型和约束条件。表中的每一行表示一个记录,包含该行中所有列的值。在关系型数据库中,数据以二维表格的形式存储在磁盘上。
2、索引
索引是关系型数据库中用于快速访问数据的机制。索引可以加快查询速度,但也会增加数据插入、更新和删除的成本。常见的索引类型包括主键索引、唯一索引、普通索引等。
3、SQL语言
SQL(Structured Query Language)是一种用于管理关系型数据库的标准语言。通过SQL语言,用户可以对数据库进行增删改查等操作。SQL语言包括DDL(Data Definition Language)、DML(Data Manipulation Language)和DCL(Data Control Language)三种类型的语句。
4、事务处理
事务是一组原子性的操作序列,它们要么全部成功执行,要么全部失败回滚。事务处理是关系型数据库中非常重要的一个概念,它可以确保数据的一致性和完整性。事务处理包括ACID特性(Atomicity、Consistency、Isolation、Durability),它们是事务处理的基本要求。
5、数据库管理系统(DBMS)
数据库管理系统是关系型数据库的核心组件之一,它是用户与数据库之间的接口。DBMS负责管理数据库的物理结构、逻辑结构和数据操作等功能。常见的DBMS有Oracle、MySQL、Microsoft SQL Server等。
关系型数据库底层实现涉及到多个方面,包括数据存储、索引、SQL语言、事务处理和数据库管理系统等。这些方面的设计和实现都是非常重要的,它们直接影响到数据库的性能和可用性。
1、 关系型数据库有以下这些:
1、大型的有:oracle、sqlserver、db2、infomix、Sybase等。
2、开源的有:MySQL、Postpresql等。
3、文件型的有:Access、SQLAnywhere、sqlite、interbase等。
2、 国内的关系型数据库主要有:
1、阿里云的PolarDB。
2、腾讯云的TDSQL。
3、PingCAP的TiDB。
4、人大金仓的Kingbase。
关系型数据库可以处理大量的数据,而且可以通过SQL语言进行数据的查询和分析。此外,关系型数据库还可以通过分区、索引等方式来提高数据处理的效率。
在大数据中应用中主要就是在数仓分层后数据服务层,将有价值、频繁使用的数据按照一定的标准将业务数据存储在关系型数据库中,方便业务人员或者应用开发团队通过库表或者接口间接、直接的访问数据。