Flink常用API之HDFS文件Source

2023年5月25日下午11:54 • 大数据 • 阅读 110

Flink常用API之HDFS文件Source

原创

wx62be9d88ce2942022-07-01 17:43:20博主文章分类：大数据 ©著作权

文章标签 hdfs flink big data apache 文章分类 Hadoop 大数据

©著作权归作者所有：来自51CTO博客作者wx62be9d88ce294的原创作品，请联系作者获取转载授权，否则将追究法律责任

package sourceimport org.apache.flink.streaming.api.scala.StreamExecutionEnvironment    object HDFSFileSource {  def main(args: Array[String]): Unit = {    val ev = StreamExecutionEnvironment.getExecutionEnvironment    ev.setParallelism(1)    import org.apache.flink.streaming.api.scala._        val stream: DataStream[String] = ev.readTextFile("hdfs://mycluster/wc.txt")        stream.flatMap(_.split(" "))      .map((_,1))      .keyBy(0)      .sum(1)      .print()    ev.execute("wordcount")  }}

HDFS数据图

[root@node1 ~]21/12/25 14:52:10 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicablehello tom andy joy hello rose hello joy mark andy hello tom andy rose hello joy

Flink常用API之HDFS文件Source

赞
收藏
评论
*举报

上一篇：Flink的Standalone 集群安装和部署

下一篇：Flink 常用 API 详解

Original: https://blog.51cto.com/u_15704423/5434841
Author: wx62be9d88ce294
Title: Flink常用API之HDFS文件Source

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/516976/

转载文章受原作者版权保护。转载请注明原作者出处！

赞 (0)

0

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Bitwarden sqlite 数据库备份、同步到windows

Bitwarden sqlite 数据库备份、同步到windows 背景 bitwarden的保存的密码需要定期备份，并且同步到本地的WSL，避免意外原因导致全部密码丢失步骤 b…

大数据 2023年11月11日
0053
了解一下docker容器数据卷

容器卷就是目录或者文件，存在于一个或者多个容器中，由docker挂载到容器，但不属于联合文件系统，因此能够绕过Union File System提供一些用于持续存储或共享数据的特性…

大数据 2023年5月28日
0066
Django将数据库从sqlite3切换为mysql

要把Django正在使用的数据库从sqlite3切换为mysql，基本思路就是先把sqlite3数据库里的数据使用Django的方式导出来，然后将Django的settings文件…

大数据 2023年11月10日
0043
【django】django-redis的使用方法

大数据 2023年11月14日
0039
数仓工具—Hive源码之SQL解析AntlrWorks的使用(10)

; AntlrWorks 前面我们已经已经介绍过了Antlr的工作原理以及应用，我们也自己动手实现了一个计算器的案例，我们验证规则文件是否有效的方式是idea 的插件，如下所示，就…

大数据 2023年11月12日
0034
C++核心准则C.86:保证==语义遵守操作数规则并不会抛出异常

C.86: Make == symmetric with respect to operand types and noexcept C.86:保证==语义遵守操作数规则并不会抛出…

大数据 2023年5月24日
0083
Mybatis_动态sql_1

Mybatis_动态sql_1 原创 959_1x2022-05-26 01:26:01博主文章分类：mybatis ©著作权文章标签 mybatis sql java 动态sq…

大数据 2023年5月26日
0067
最新 x86_64 系统调用入口分析 (基于 5.7.0)

最新 x86_64 系统调用入口分析 (基于5.7.0) 最近的工作涉及到系统调用的录入，但网上的一些分析都比较老，这里记录自己的分析过程，仅供参考。 [En] The recen…

大数据 2023年5月27日
0078
flink metric库的使用和自定义metric-reporter

flink内部实现了一套metric数据收集库。同时flink自身系统有一些固定的metric数据，包括系统的一些指标，CPU,内存, IO 或者各个task运行的一些指标。具…

大数据 2023年6月3日
0087
zabbix监控详解

zabbix监控详解 zabbix监控详解在web界面进行linux部署agentd 创建监控主机创建主机组并加入主机添加监控项添加触发器添加媒介(email方式) 添加…

大数据 2023年5月26日
0087
Hive4

大数据 2023年11月14日
0040
分享初学Room的简单使用

在工作中难免会遇到使用数据库的需求，现在的数据库框架有好多眼花缭乱各有优势，最后在GreenDao与Room中选择了Google强烈推荐的Room。简单的记录一下使用。一介绍： …

大数据 2023年11月11日
0033
mysql获取当前日期/未来日期/过去日期/查看hive函数

大数据 2023年11月14日
0037
无法连接服务器中的redis

大数据 2023年11月15日
0044
【Redis精进之路系列】缓存数据丢了，原来是Redis持久化没玩明白

大数据 2023年11月14日
0041
【计算机视觉40例】案例34：勾勒五官轮廓

Dlib是一个现代工具包，包含机器学习算法和工具，用于在程序中构造软件来解决复杂的现实世界问题。它被工业界和学术界广泛应用于机器人、嵌入式设备、移动电话和大型高性能计算环境等领域。…

大数据 2023年5月24日
0064

亲爱的 Coder【最近整理，可免费获取】👉 最新必读书单 | 👏 面试题下载 | 🌎 免费的AI知识星球