Spark学习(4)SparkStreaming

Apache

Flink

SparkSteaming

Storm

架构介于spark和storm之间,主从结构与sparkStreaming相似,DataFlow Grpah与storm 相似,数据流可以被表示为一个有向图,每个顶点是一个定义的运算,每向边表示数据的流动

Native

架构依赖Spark,主从模式,每个batch批次处理都依赖driver主,可以理解为时间维度上的spark DAG

Micro-Batch

主从模式,且依赖ZK,处理过程中对主的依赖不大

Native

基于Ghandy-Lamport distributed snapshots checkpoint机制

Medium

WAL 及RDD 血统机制

High(高)

Records Ack

Medium(一般)

处理模型与延时

单条时间处理

亚秒级低延时

一个事件窗口内的所有事件

秒级低延时

每次传入的一个事件

亚秒级低延时

吞吐量

High

High

Low (低)

数据处理保证

Exactly once

High

Exactly once(实现架用Chandy-Lamport算法,即marker-checkpoint)

High

Medium

高级API

Flink ,栈中提供了很多高级API 和满足不同场景的类库:机器学习、图分析、关系式数据处理

High

能够很容易的对接Spark 生态圈里面的组件,同时额能够对接主流的消息传输组件及存储系统

High

应用需要按照特定的storm 定义的规模编写

Low

易用性

支持SQL Streaming ,Batch 和Streaming 采用统一编程框架

High

支持SQL Streaming ,Batch 和Streaming 采用统一编程框架

High

不支持SQL Streaming

Medium

成熟性

新兴项目,处于发展阶段

Low

已经发展一段时间

Medium

相对较早的流系统,比较稳定

High

部署性

部署相对简单,只依赖JRE环境

Low

部署相对简单,只依赖JRE环境

Low

依赖JRE环境和ZK

High

Original: https://www.cnblogs.com/cheng9999/p/11903655.html
Author: cheng_blog
Title: Spark学习(4)SparkStreaming

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/711796/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球