关联文章:
各种时间类型和timezone关系浅析
ts字段op_ts 时区op_tsTIMESTAMP_LTZ(3) NOT NULL当前记录表在数据库中更新的时间。如果从表的快照而不是 binlog 读取记录,该值将始终为0。|
在以下测试中cdc表建表均使用ts_ms TIMESTAMP_LTZ(3) METADATA FROM 'op_ts' VIRTUAL 表示。
cdc在读取表时候分两个阶段:
op=rop=c或u或d3="r" 或者 3="r",3是op字段的索引值。ts_ms在全量阶段读取数据以下成为READ数据ts_ms在增量阶段读取数据以下成为CREATE数据flink Table中时间必须使用org.apache.flink.table.data.TimestampData对象表示。
@PublicEvolving
public final class TimestampData implements Comparable<TimestampData> {
private final long millisecond;
private final int nanoOfMillisecond;
}
此类型使用如下两个值联合表示记录时间。并不记录时区数据。
实战测试:
@Test
public void testTimeZone(){
// 常识:Epoch就是值utc的0时间点,是全局绝对时间点,本质是`ZoneOffset.of("+0")`下的0时间。与`January 1, 1970, 00:00:00 GMT`视为等同。
// GMT是前世界标准时,UTC是现世界标准时。UTC 比 GMT更精准,以原子时计时,适应现代社会的精确计时。
// 28800000=8*3600*1000。8小时毫秒值。
// 如下时间是+8时区的数据库存储的不带时区的时间:2023-09-28T09:43:20.320
long ts=1695894200320L;
// 如果将ts当做utc时间0时刻转为字符串则会导致时间+8 hour。2023-09-28 17:43:20。这是一般常用的在线转换时间的结果。因其默认是是epoch时间,所以转换后会+8h。
// 可见数据库读取的不带timezone时间的毫秒值,并不是以utc0时间(epoch)为基准的,而是以当前时区0为基准的。
// LocalDateTime对象本质支持LocalDate和LocalTime两个对象,LocalDate持有Integer的`年`,`月`,`日`。LocalTime则持有Integer的`时`,`分`,`秒`等和java.util.Date类型并不一样。
// LocalDateTime 的带有ZoneOffset方法比较难理解,此处:
// epochSecond 当然值的是epoch的秒数,是绝对时间概念和`java.util.Date.getTime()/1000`对应的,而offset是指此epoch秒数需要偏移的时间量。
// 内部代码是`long localSecond = epochSecond + offset.getTotalSeconds();`。
// 如下代码是正确的,因为java中的`java.util.Date`类和`java.sql.Timestamp`类型都是持有绝对时间的类,`Date.getTime`获得也是相对于Epoch的毫秒值(Returns the number of milliseconds since January 1, 1970, 00:00:00 GMT)。
LocalDateTime ldtFromDate = LocalDateTime.ofEpochSecond(new Date().getTime() / 1000, 0, ZoneOffset.of("+8"));
System.out.println(ldtFromDate); // 2023-09-28T16:16:45。此时时钟也是16:17:44。
Date date0 = new Date(0); // number of milliseconds since the standard base time known as "the epoch"
System.out.println(date0.getTime()); // 0, date0.getTime()方法返回绝对时间Returns the number of milliseconds since January 1, 1970, 00:00:00 GMT
// 如下的提供`ZoneOffset.UTC`可以理解是告诉LocalDateTime我提供的epochSecond已是`localSecond=当地时间-当地时间的0点`不需要再做转换了。
LocalDateTime ldt0 = LocalDateTime.ofEpochSecond(0L, 0, ZoneOffset.UTC);
System.out.println(ldt0); // 1970-01-01T00:00
LocalDateTime ldt8 = LocalDateTime.ofEpochSecond(0L, 0, ZoneOffset.of("+8"));
System.out.println(ldt8); // 1970-01-01T08:00
// TimestampData 默认不会进行任何时区转换。也不存储任何时区信息。内部仅靠`long millisecond`和`int nanoOfMillisecond`存储信息,以便于序列化。
// millisecond 一般可以认为是本地时间。因其在toString方法中会不会进行时区转换,toString方法仅是调用了`toLocalDateTime()`,中进行简单运算,并最终调用`LocalDateTime.toString`方法。
TimestampData td0 = TimestampData.fromEpochMillis(0); // 相当于LocalDateTime.ofEpochSecond(0, 0, ZoneOffset.UTC)。
System.out.println(td0); // 1970-01-01T00:00。可见TimestampData输出转字符串的时间就是以utc时间为基准的这和java.util.Date类型是一致的。
LocalDateTime ldt = LocalDateTime.ofEpochSecond(
ts / 1000
, (int) (ts % 1000 * 1_000_000)
, ZoneOffset.UTC);
System.out.println(ldt); // 2023-09-28T09:43:20.320
TimestampData td = TimestampData.fromEpochMillis(ts);
System.out.println(td); // 2023-09-28T09:43:20.320
Date date = new Date(ts); // 注意:参数date(the specified number of milliseconds since the standard base time known as "the epoch")应该是epoch但此时ts并不是epoch基准的而是本地local基准的。
System.out.println(date); // Thu Sep 28 17:43:20 CST 2023,CST就是北京时间了,其在toString方法中`BaseCalendar.Date date = normalize();`进行了时区转换即+8了。
}
3.1.1-1.17版本修改而来。二、每种数据库测试8项:
com.ververica.cdc.debezium.table.AppendMetadataCollector#collect 方法中debug得到数据1970-01-01 00:00:00)。非0即为不正确。jdbc的表数据org.apache.flink.connector.jdbc.table.JdbcRowDataInputFormat#nextRecord的方法中debug得到数据。。不含tm_ms数据。jdbc的表数据。使用flink sql-client查询。。不含tm_ms数据。

![![[image-20230927163847043.png|201]]](https://1000bd.com/contentImg/2024/03/16/210948122.png)
如下:上侧(win系统显示时间截图),下侧(cdc-query的ts_ms)
如果基本一致(不是差值8h),说明cdc-query的ts_ms是正确的的。
![![[image-20230928132434484.png|325]]](https://1000bd.com/contentImg/2024/03/16/210947703.png)
![![[image-20230928100333641.png]]](https://1000bd.com/contentImg/2024/03/16/210948381.png)
![![[image-20230928101529479.png]]](https://1000bd.com/contentImg/2024/03/16/210947651.png)
![![[image-20230927172538194.png]]](https://1000bd.com/contentImg/2024/03/16/210947843.png)
![![[image-20230927171613530.png|206]]](https://1000bd.com/contentImg/2024/03/16/210947631.png)
![![[image-20230927145744323.png]]](https://1000bd.com/contentImg/2024/03/16/210948252.png)
cdc-RowData
![![[image-20230927145825569.png]]](https://1000bd.com/contentImg/2024/03/16/210948263.png)
![![[image-20230927151801248.png|200]]](https://1000bd.com/contentImg/2024/03/16/210947891.png)
![![[image-20230928132850256.png|325]]](https://1000bd.com/contentImg/2024/03/16/210947924.png)
![![[image-20230928095911025.png]]](https://1000bd.com/contentImg/2024/03/16/210948182.png)
![![[image-20230928101453266.png]]](https://1000bd.com/contentImg/2024/03/16/210947835.png)
jdbc-RowData
![![[image-20230927173637049.png]]](https://1000bd.com/contentImg/2024/03/16/210947390.png)
![![[image-20230927173456643.png|212]]](https://1000bd.com/contentImg/2024/03/16/210947720.png)
![![[image-20230927163637993.png]]](https://1000bd.com/contentImg/2024/03/16/210947726.png)
![![[image-20230927163611807.png]]](https://1000bd.com/contentImg/2024/03/16/210947651.png)
![![[image-20230927163808365.png|192]]](https://1000bd.com/contentImg/2024/03/16/210947739.png)
![![[image-20230928133349412.png|350]]](https://1000bd.com/contentImg/2024/03/16/210948165.png)
![![[image-20230928094006306.png]]](https://1000bd.com/contentImg/2024/03/16/210947524.png)
![![[image-20230928101415704.png]]](https://1000bd.com/contentImg/2024/03/16/210948007.png)
![![[image-20230927174904854.png]]](https://1000bd.com/contentImg/2024/03/16/210947500.png)
![![[image-20230927182456589.png|194]]](https://1000bd.com/contentImg/2024/03/16/210947907.png)
![![[image-20230927160526864.png]]](https://1000bd.com/contentImg/2024/03/16/210947754.png)
![![[image-20230927160425443.png]]](https://1000bd.com/contentImg/2024/03/16/210948061.png)
![![[image-20230927160753056.png|191]]](https://1000bd.com/contentImg/2024/03/16/210948194.png)
![![[image-20230928133736851.png|400]]](https://1000bd.com/contentImg/2024/03/16/210948193.png)
![![[image-20230928101223538.png]]](https://1000bd.com/contentImg/2024/03/16/210948386.png)
![![[image-20230928101030948.png]]](https://1000bd.com/contentImg/2024/03/16/210948399.png)
![![[image-20230927183056565.png]]](https://1000bd.com/contentImg/2024/03/16/210948182.png)
![![[image-20230927182935788.png|203]]](https://1000bd.com/contentImg/2024/03/16/210947407.png)
(1)数据库获取的without time zone在flink中都是以本地时间的存储的。可以使用LocalDateTime.ofEpochSecond(long epochSecond, int nanoOfSecond, ZoneOffset.UTC)直接获取。
(2)Flink中的TimestampData中存储的一般可以认为是本地时间。但需要注意:TimestampData 不可将 instant 相关方法和 localDateTime 、Timestamp 相关方法混用。因为instant代表与epoch时间差。而后两者代表与local是时间差。
(3)Flink程序中时间的标准值都是local本地的。因其在Sql API(sql-client)中打印出的结果会与原始数据库中打印的一致。
如下图中红色字体的是错误的数据,使用CDC需要额外注意并进行转换。
![![[image-20230928164847790.png]]](https://1000bd.com/contentImg/2024/03/16/210947903.png)
-- mysql 以:time_zone 为准,system_time_zone至服务器时区
show variables like '%time_zone%';
-- postgres
show time zone;
-- sqlserver
DECLARE
@TimeZone NVARCHAR(255)
EXEC
master.dbo.xp_instance_regread
N'HKEY_LOCAL_MACHINE'
,
N'SYSTEM\CurrentControlSet\Control\TimeZoneInformation'
,
N'TimeZoneKeyName'
,
@TimeZone
OUTPUT
SELECT
@TimeZone
-- oracle
select dbtimezone from dual;