Flink的Time详解之时间语义Time介绍

对于流式数据处理,最大的特点是数据上具有时间的属性特征,Flimk 根据时间产生的位置不同,将时间区分为三种时间语义,分别为事件生成时间(Event Time)、事件接入时 间(Ingestion Time)和事件处理时间(Processing Time)。

  • Event Time:事件产生的时间,它通常由事件中的时间戳描述。
  • Ingestion Time:事件进入 Flink 的时间。
  • Processing Time:事件被处理时当前系统的时间。

1.时间语义 Time

数据从终端产生,或者从系统中产生的过程中生成的时间为事件生成时间,当数据经过 消息中间件传入到 Flink 系统中,在 DataSource 中接入的时候会生成事件接入时间,当数 据在 Flink 系统中通过各个算子实例执行转换操作的过程中,算子实例所在系统的时间为数 据处理时间。Flink 已经支持这三种类型时间概念,用户能够根据需要选择时间类型作为对 流式数据的依据,这种情况极大地增强了对事件数据处理的灵活性和准确性。

Flink的Time详解之时间语义Time介绍

2.设置时间语义

在 Flink 中默认情况下使用是 Process Time 时间语义,如果用户选择使用 Event Time 或 者 Ingestion Time 语 义 , 则 需 要 在 创 建 的 StreamExecutionEnvironment 中 调 用 setStreamTimeCharacteristic() 方 法 设 定 系 统 的 时 间 概 念 , 如 下 代 码 使 用 TimeCharacteristic.EventTime 作为系统的时间语义:

streamEnv.setStreamTimeCharacteristic(TimeCharacteristic.EventTime) streamEnv.setStreamTimeCharacteristic(TimeCharacteristic.IngestionTime)

Original: https://blog.51cto.com/u_15704423/5434861
Author: wx62be9d88ce294
Title: Flink的Time详解之时间语义Time介绍

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/516938/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球