flink中侧输出流和split有什么区别?

2020-08-05 08:54发布

flink中侧输出流和split有什么区别?

flink中侧输出流和split有什么区别?

4条回答
水默
2021-12-21 09:18

  在 flink 处理数据流时,我们经常会遇到这样的情况:在处理一个数据源时,往往需要将该源中的不同类型的数据做分割处理,如果使用 filter 算子对数据源进行筛选分割的话,势必会造成数据流的多次复制,造成不必要的性能浪费;flink 中的侧输出就是将数据流进行分割,而不对流进行复制的一种分流机制。flink 的侧输出的另一个作用就是对延时迟到的数据进行处理,这样就可以不必丢弃迟到的数据。

  plit - 拆分文件拆分文件

  # 每个文件的行数为1000行

  split -l 1000 test.txt

  # 将test文件拆分,20M一个文件

  split -b 20M test.txt

  test文件拆分,并且文件名依次为 [前缀]aa, [前缀]ab, [前缀]ac等,默认的前缀是X

  (使用-d选项可以指定后缀为数字,如00,01,02..,而不是aa,ab,ac。)



一周热门 更多>