Flink常用API之转换算子的Split算子

2023年5月25日下午11:52 • 大数据 • 阅读 82

Flink常用API之转换算子的Split算子

原创

wx62be9d88ce2942022-07-01 17:44:01博主文章分类：大数据 ©著作权

文章标签 flink scala big data 数据集数据 文章分类 Hadoop 大数据

©著作权归作者所有：来自51CTO博客作者wx62be9d88ce294的原创作品，请联系作者获取转载授权，否则将追究法律责任

Split 和 select [DataStream->SplitStream->DataStream]
Split 算子是将一个 DataStream 数据集按照条件进行拆分，形成两个数据集的过程，也是 union 算子的逆向实现。每个接入的数据都会被路由到一个或者多个输出数据集中。如下图所示，将输入数据集根据颜色切分成两个数据集。

Flink常用API之转换算子的Split算子

在使用 split 函数中，需要定义 split 函数中的切分逻辑，通过调用 split 函数，然后指定条件判断函数，

package transformationimport org.apache.flink.streaming.api.scala.StreamExecutionEnvironmentimport source.{MyCustomerSource, StationLog}    object Transformation02 {  def main(args: Array[String]): Unit = {    val en = StreamExecutionEnvironment.getExecutionEnvironment    en.setParallelism(1)    import org.apache.flink.streaming.api.scala._        val stream = en.addSource(new MyCustomerSource)    val result: SplitStream[StationLog] = stream.split(      log => {        if (log.callType.equals("success")) Seq("success") else Seq("no success")       }    )    val stream1: DataStream[StationLog] = result.select("success")    val stream2: DataStream[StationLog] = result.select("no success")    stream1.print("通话成功")    stream2.print("通话不成功")    en.execute()  }}

Flink常用API之转换算子的Split算子

split 函数本身只是对输入数据集进行标记，并没有将数据集真正的实现切分，因此需要借助 Select 函数根据标记将数据切分成不同的数据集。

赞
收藏
评论
*举报

上一篇：Flink常用API之转换算子的union算子

下一篇：Flink常用API之Kafka的Source

Original: https://blog.51cto.com/u_15704423/5434846
Author: wx62be9d88ce294
Title: Flink常用API之转换算子的Split算子

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/516966/

转载文章受原作者版权保护。转载请注明原作者出处！

赞 (0)

0

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Redis集群

大数据 2023年11月14日
0037
Linux快速入门(六)Linux网络管理

ping ping命令用于测试两台主机之间是否可以通信，一般情况下会使用 ping www.baidu.com来测试网络连通性，如果不指定发送包的个数默认是一直发送数据包，可以使用…

大数据 2023年5月26日
0053
【Android — 规范】Android 编码规范

前言一个好的开发规范可以让团队中的人对他人的代码更熟悉，新人也可以更好的了解产品的业务逻辑。开发规范并不是一个死的一成不变的，每个团队可能都有自己的开发规范，只要是适合团队的开发…

大数据 2023年5月26日
0083
sqlite 使用

为什么要用 SQLite？ SQLite 局限性常用的点命令在 Linux 上安装 SQLite sql语句 C/C++接口查询到数据怎么取方法一：使用 sqlite3_e…

大数据 2023年11月10日
0043
hive与Oracle

一、hive底层逻辑 GROUP BY 原理 select name,count(num) from tb group by name map 阶段，将 group by 后的字段…

大数据 2023年11月13日
0045
【DjangoDRF+缓存+JWT+RabbitMQ 七万字总结】

大数据 2023年11月16日
0047
3.Spark设计与运行原理，基本操作

1.Spark已打造出结构一体化、功能多样化的大数据生态系统，请用图文阐述Spark生态系统的组成及各组件的功能。 Spark生态系统主要包含Spark Core、Spark SQ…

大数据 2023年6月3日
0068
HIVE 表 DLL 基本操作（一）——第1关：Create/Alter/Drop 数据库

第1关：Create/Alter/Drop 数据库任务描述本关任务：根据编程要求对数据库进行相关操作。相关知识为了完成本关任务，你需要掌握： 1.如何创建数据库； 2.如何…

大数据 2023年11月13日
0079
SQLite学习手册(一)

1). 动态创建表。2). 根据sqlite3提供的API，获取表字段的信息，如字段数量以及每个字段的类型。3). 删除该表。见以下代码及关键性注释： #include <s…

大数据 2023年11月11日
0048
sqlplus的autotrace开关

官方文档https://docs.oracle.com/cd/E11882_01/server.112/e16604/ch_eight.htm#i1037226 set autot…

大数据 2023年6月3日
0085
深入解析Docker 架构原理

深入解析Docker 架构原理 Docker2019年08月10日一、Docker 简介什么是Docker?Docker的英文翻译是”搬运工”的意思，他…

大数据 2023年5月29日
00102
词嵌入(Word Embedding)

目录为什么需要词向量嵌入？表征的对象是什么？如何表征？词向量嵌入矩阵 Skip-Gram CBoW 负采样结语 Reference 为什么需要词向量嵌入？在自然语言相关…

大数据 2023年5月28日
0097
Docker系列之Elasticsearch安装教程

@ 1、什么Elasticsearch？ 2、安装elasticsearch 3、目录结构 4、常用命令 5、插件安装 6、elasticsearch-head 1、什么Elast…

大数据 2023年5月29日
0074
Flink-初识(特点、与sparkstreaming的比较)

1.初识 Flink 起源于 Stratosphere 项目，Stratosphere 是在 2010~2014 年由 3 所地处柏林的大学和欧洲的一些其他的大学共同进行的研究项目…

大数据 2023年5月26日
0070
【Redis高手修炼之路】②Redis的五大数据类型

大数据 2023年11月14日
0048
macOS Monterey 12.5 (21G72) 正式版 ISO、IPSW、PKG 下载

今日（2022-07-21）凌晨，Apple 终于发布了 macOS Monterey 12.5，包括功能增强、错误修复和安全性更新。macOS Monterey 12.5 自 2…

大数据 2023年6月3日
00138

亲爱的 Coder【最近整理，可免费获取】👉 最新必读书单 | 👏 面试题下载 | 🌎 免费的AI知识星球