Flink学习19：算子介绍keyBy

1.keyBy简介

主要作用：把相同的数据，汇总到相同的分区中

（数据本来是分布在不同的slot中，keyBy会把相同的数据拉到相同的slot中）

2.keyBy的使用

在使用keyBy时候，需要向keyBy传递一个参数，告诉其按照哪个字段进行归类。

有2种传递参数的方式，

1.传递位置的数值

示例：

import org.apache.flink.api.scala.createTypeInformation
import org.apache.flink.streaming.api.scala.StreamExecutionEnvironment

object keyByTest {
  def main(args: Array[String]): Unit = {
    //create env
    val env = StreamExecutionEnvironment.getExecutionEnvironment

    //create ds
    val ds = env.fromElements(("张三", 4), ("张三", 2), ("leo", 5), ("leo", 1),("raj", 8), ("giao", 7))

    val keyByedDs = ds.keyBy(0)

    keyByedDs.print()

    env.execute()





  }

}

输出结果：

2.通过名称进行keyBy

示例：

import org.apache.flink.api.scala.createTypeInformation
import org.apache.flink.streaming.api.scala.StreamExecutionEnvironment

object keyByNameTest {

  //defined the dataSource's data type
  case class StockPrice(stockId:String, timestamp: Long, price:Double)


  def main(args: Array[String]): Unit = {

    //create env
    val env = StreamExecutionEnvironment.getExecutionEnvironment

    //create ds

    val pricesList = List(StockPrice("stock1", 154545454, 1212.23), StockPrice("stock1", 154545454, 1212.23), StockPrice("stock2", 154545454, 666.23), StockPrice("stock3", 154545454, 888.23))

    val ds = env.fromCollection(pricesList)

    //transformation
    val keyByedDs = ds.keyBy("stockId")

    keyByedDs.print()

    env.execute()


  }

}

输出结果：

相关阅读:
一文带你详细了解机房搬迁工作步骤及方案，强烈建议收藏备用！
ACWing每日一题.3511
Acwing：哈夫曼树（详解）
Go源码--Strconv库
HandlerMapping.URI_TEMPLATE_VARIABLES_ATTRIBUTE
Makefile基础
【LeetCode】【字符串】【位运算实现字母大小写转换】709. 转换成小写字母 Java实现
K8S+ jenkins+gitlub+Harbor实现CI/CD
quarkus的异步操作，神奇
配置DNS服务的正反向解析

原文地址：https://blog.csdn.net/hzp666/article/details/126267055