本篇介绍SQL:2016(ISO/IEC 9075:2016)标准中定义的序列生成器(Sequence generator)和相关操作,以及六种主流数据库中的实现及差异:Oracle、MySQL、Microsoft SQL Server、PostgreSQL、Db2、SQLite。
在 SQL 中,序列生成器(简称序列)用于自动生成一系列不重复的数字。序列的数据类型通常是整数,包含一个最小值,一个最大值,一个起始值,一个增量值,以及一个循环使用选项。
如果序列的增量是一个正整数,称为升序序列,例如 1,3,5,7,…(增量为 2);如果序列的增量是一个负整数,称为降序序列,例如2,1,0,-1,…(增量为 -1)。
由于序列可以生成不重复的值,因此通常用于主键值的生成;由于序列的值具有递增特性,因此可以用于记录各个操作发生的先后顺序。
序列可以通过两种方式进行定义:使用CREATE SEQUENCE
语句创建一个外部序列;或者通过一个标识列(identity column)或自动增长列(auto increment column)隐式创建一个内部序列。
本文先介绍外部序列相关的操作,包括序列的创建、使用、修改和删除;最后介绍六种数据库中实现的标识列或自增列功能。
在 SQL 中使用CREATE SEQUENCE
创建一个外部序列,标准语法如下:
CREATE SEQUENCE seq_name
[ AS data_type ]
[ START WITH s ]
[ INCREMENT BY i ]
[ MAXVALUE M | NO MAXVALUE ]
[ MINVALUE m | NO MINVALUE ]
[ CYCLE | NO CYCLE ]
;
其中,只有序列名称 seq_name 是必须的参数;其他可选参数的意义如下:
AS data_type
指定序列的数据类型,只能是整数类型;START WITH s
指定序列的初始值,s 是一个数值常量。默认为序列的最小值或者最大值;INCREMENT BY i
指定序列的增量值,i 是一个数值常量,负数表示降序序列。默认值为 1;MAXVALUE M
指定序列允许的最大值;NO MAXVALUE
表示不指定最大值,通常由序列的数据类型或者数据库产品自定义一个最大值;MINVALUE m
指定序列允许的最小值;NO MINVALUE
表示不指定最小值,通常由序列的数据类型或者数据库产品自定义一个最小值;CYCLE
表示当序列的取值到达最大值(最小值)时,是否重新循环使用;NO CYCLE
表示当序列到达最大值(最小值)时,无法生成新的序列值。默认为NO CYCLE
。MySQL 和 SQLite 目前还不支持创建序列对象。
Oracle 不支持指定序列的数据类型,默认使用 NUMBER 类型。
以下示例使用默认值创建一个名为 seq1 的序列:
-- For Oracle, SQL Server, PostgreSQL and Db2
CREATE SEQUENCE seq1;
对于 Oracle,以上语句创建一个从 1 开始,增量为 1,最小值为 1,最大值为 1028 - 1 的非循环序列。
对于 SQL Server,以上语句创建一个从 -263 开始,增量为 1,最小值为 -263,最大值为 263 - 1 的非循环序列。
对于 PostgreSQL,以上语句创建一个从 1 开始,增量为 1,最小值为 1,最大值为 263 - 1 的非循环序列。
对于 Db2,以上语句创建一个从 1 开始,增量为 1,最小值为 1,最大值为 231 - 1 的非循环序列。
以下语句创建一个从 10 开始,增量为 -2(降序),最小值为 0,最大值为 100 的循环序列。
-- For Oracle, SQL Server, PostgreSQL and Db2
CREATE SEQUENCE seq2
START WITH 10
INCREMENT BY -2
MAXVALUE 100
MINVALUE 0
CYCLE;
序列 seq2 的取值依次为 10,8,6,…,0,100,98,… ;序列取值到达最小值(0)之后,再次从最大值开始(100)。
不同的数据库产品针对 SQL 标准进行了一些专有的扩展,以下是常见的扩展选项。
CACHE
Oracle、SQL Server、PostgreSQL 以及 Db2 都支持序列的缓存选项,例如:
-- For Oracle, SQL Server, PostgreSQL and Db2
CREATE SEQUENCE seq2
START WITH 10
INCREMENT BY -2
MAXVALUE 100
MINVALUE 0
CYCLE
CACHE 20;
使用 CACHE 选项可以减少获取序列值的磁盘操作,可以提高序列生成的性能。不过,此时服务崩溃(如电源故障)可能导致缓存中保留的序列号丢失。
在 SQL 标准中,获取序列下一个值的语法如下:
NEXT VALUE FOR seq_name
SQL Server 和 Db2 遵循 SQL 标准;
Oracle 使用伪列 seq_name.NEXTVAL 获取下一个序列值;
PostgreSQL 使用函数 nextval(‘seq_name’) 获取下一个序列。
举例说明,以下查询使用序列 seq2 返回一系列数值。
-- For SQL Server and Db2
SELECT NEXT VALUE FOR seq2 AS Seq,
employee_id,
first_name,
last_name
FROM employees;
-- For Oracle only
SELECT seq2.NEXTVAL AS Seq,
employee_id,
first_name,
last_name
FROM employees;
-- For PostgreSQL only
SELECT nextval('seq2') AS Seq,
employee_id,
first_name,
last_name
FROM employees;
查询结果如下:
对于查询结果中的每一行,即使存在同一个序列的多次调用,也只生成一次新值。例如,
-- For SQL Server and Db2
SELECT NEXT VALUE FOR seq2 AS Seq, -- seq2.NEXTVAL for Oracle
NEXT VALUE FOR seq2 AS Seq_2, -- nextval('seq2') for PostgreSQL
employee_id,
first_name,
last_name
FROM employees;
查询结果中的每一行,字段 Seq 和 Seq_2 都返回了相同的值:
同样可以在 INSERT 语句中使用序列的值,以下示例使用序列 seq2 为表 test_seq 生成主键值:
CREATE TABLE test_seq
( id INTEGER NOT NULL PRIMARY KEY
, name CHARACTER VARYING(20)
) ;
-- For SQL Server and Db2
INSERT INTO test_seq(id, name)
VALUES (NEXT VALUE FOR seq2, 'sql'); -- seq2.NEXTVAL for Oracle
INSERT INTO test_seq(id, name)
VALUES (NEXT VALUE FOR seq2, 'java'); -- nextval('seq2') for PostgreSQL
INSERT INTO test_seq(id, name)
VALUES (NEXT VALUE FOR seq2, 'c++');
SELECT id, name
FROM test_seq;
id |name |
----|-----|
96 |c++ |
98 |java |
100 |sql |
此外,插入到表中的序列值有可能是存在间断,例如在事务中生成了序列值,然后事务被回滚,已经使用的序列值将会被丢弃。如果使用了扩展的 CACHE 选项,当服务器故障时可能会丢失掉已经缓存的序列值。
关于数据库自增字段的 3 种实现方式,可以参考这篇文章。
参考资料: