在Flink中,算子会被切分成多个Task(虚拟的)执行,Task执行其实是执行不同类型的Task。比如流式任务中,是执行StreamTask。
执行任务StreamTask
真正处理数据前,StreamTask要初始化,在这个过程中,创建了StreamInputProcessor这个关键对象。
不同Task的初始化不同,本文以中间算子Map为例讲解。map算子属于OneInputStreamTask,因此调用其init()方法。
对于Source算子而言,初始化的目的是为了从数据源获取数据到Source。
对于中间算子而言ÿ