Spark学习(4)SparkStreaming

Apache

Flink

SparkSteaming

Storm

架构介于spark和storm之间,主从结构与sparkStreaming相似,DataFlow Grpah与storm 相似,数据流可以被表示为一个有向图,每个顶点是一个定义的运算,每向边表示数据的流动

Native

架构依赖Spark,主从模式,每个batch批次处理都依赖driver主,可以理解为时间维度上的spark DAG

Micro-Batch

主从模式,且依赖ZK,处理过程中对主的依赖不大

Native

基于Ghandy-Lamport distributed snapshots checkpoint机制

Medium

WAL 及RDD 血统机制

High(高)

Records Ack

Medium(一般)

处理模型与延时

单条时间处理

亚秒级低延时

一个事件窗口内的所有事件

秒级低延时

每次传入的一个事件

亚秒级低延时

吞吐量

High

High

Low (低)

数据处理保证

Exactly once

High

Exactly once(实现架用Chandy-Lamport算法,即marker-checkpoint)

High

Medium

高级API

Flink ,栈中提供了很多高级API 和满足不同场景的类库:机器学习、图分析、关系式数据处理

High

能够很容易的对接Spark 生态圈里面的组件,同时额能够对接主流的消息传输组件及存储系统

High

应用需要按照特定的storm 定义的规模编写

Low

易用性

支持SQL Streaming ,Batch 和Streaming 采用统一编程框架

High

支持SQL Streaming ,Batch 和Streaming 采用统一编程框架

High

不支持SQL Streaming

Medium

成熟性

新兴项目,处于发展阶段

Low

已经发展一段时间

Medium

相对较早的流系统,比较稳定

High

部署性

部署相对简单,只依赖JRE环境

Low

部署相对简单,只依赖JRE环境

Low

依赖JRE环境和ZK

High

Original: https://www.cnblogs.com/cheng9999/p/11903655.html
Author: cheng_blog
Title: Spark学习(4)SparkStreaming

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/711796/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

  • 五个维度打造研发管理体系【原创】

    技术管理者(技术总监/经理/CTO)期望通过体系化的管理方式建设,能够在百人,千人以上的团队中有效的构建聚焦目标,自我成长,高效能的研发作战团队,快速拿出成果,支撑业务的快速发展。…

    技术杂谈 2023年7月23日
    077
  • Leaf——美团点评分布式ID生成系统

    https://tech.meituan.com/2017/04/21/mt-leaf.html 作者:习惯沉淀 如果文中有误或对本文有不同的见解,欢迎在评论区留言。 如果觉得文章…

    技术杂谈 2023年6月1日
    0103
  • 各种ast库

    https://github.com/fkling/astexplorer Original: https://www.cnblogs.com/mengfangui/p/15793…

    技术杂谈 2023年5月31日
    073
  • CentOS 文件管理

    一、目录管理 1.1、目录结构 1.2、切换目录 1.3、查看目录 1.4、创建目录 1.5、复制目录 1.6、剪切目录 1.7、删除目录 二、文件管理 2.1、查看文件 2.2、…

    技术杂谈 2023年7月10日
    061
  • LeetCode28.实现strStr()

    实现strStr()函数。 给你两个字符串haystack和needle,请你在haystack字符串中找出needle字符串出现的第一个位置(下标从0开始)。如果不存在,则返回-…

    技术杂谈 2023年7月24日
    066
  • cesium之流动线纹理实现的两种方式【转】

    直接上代码吧 方法一:采用自定义shader 的实现,利用cesium内置的glsl变量是纹理随着时间按照指定方向进行流动。效果图中科技感的数字流动是呈现沿着线往上流动,这种效果很…

    技术杂谈 2023年5月31日
    073
  • 五、JDK的安装与配置

    一、JDK下载与安装 1.1、下载JDK安装包 博主在这里给大家准备了一个64位操作系统的jdk1.8以便大家下载(使用的是迅雷)点击此处下载提取码:dfbt 如果其他小伙伴的电脑…

    技术杂谈 2023年6月21日
    076
  • 代码圈复杂度

    回到我们日常的写代码的场景,我们一直在说系统很复杂,那到底什么是系统复杂度呢?最近几天,一直在改项目里别人写的代码,某些方法复杂无注释。怎么才能写的一手可读,可扩展,可维护[注1]…

    技术杂谈 2023年7月11日
    0120
  • MacBook 对rar后缀的文件进行加压

    https://www.theunarchiver.com/ 在百度云盘中下载了rar的压缩文件,电脑自带的只能对.zip进行解压 经过一番搜索和比较,The unarchiver…

    技术杂谈 2023年5月31日
    0130
  • java 异常类与自定义异常

    目录 异常类 Exception 类的层次 throws/throw 关键字: throws: throw: try catch finally语句 声明自定义异常 异常类 在 J…

    技术杂谈 2023年6月21日
    0132
  • Java面试整理(精简版)

    特征(OOP) 解释说明 通俗理解 关系联系 作用 封装 隐藏内部细节,只对外暴露访问方法 属性/方法封装,便于使用,限制不合理操作 类-类 低耦合,高内聚,增强代码可维护性;**…

    技术杂谈 2023年7月24日
    070
  • 搜索精准度优化架构方案

    概述 实现公司对内容精准化搜索和用户精准化推送的目标。 采用方案 搜索技术+数据挖掘+机器学习(未来)+人工审核(现在) 人员配备 1-2人专职开发(未来深入,人数更多) 大致流程…

    技术杂谈 2023年7月23日
    072
  • JSON和JS对象之间的互转

    1. jQuery插件支持的转换方式 $.parseJSON( jsonstr ); //jQuery.parseJSON(jsonstr),可以将json字符串转换成json对象…

    技术杂谈 2023年5月30日
    087
  • vs 2005 thread 无法调试

    两种办法: 1、打开项目属性,在”Debug”一项里,把”Enable the Visual Studio hosting process&#8…

    技术杂谈 2023年7月11日
    061
  • JVM诊断命令jcmd介绍

    原创:扣钉日记(微信公众号ID:codelogs),欢迎分享,转载请保留出处。 简介 从JDK7开始,jdk提供了一个方便扩展的诊断命令jcmd,用来取代之前比较分散的jdk基础命…

    技术杂谈 2023年7月24日
    070
  • 最流行的WebAssembly Web开发框架: Blazor

    最新的一份《The State of WebAssembly 2022》调查报告已出炉,”对于 WebAssembly 来说,这是相当不错的一年”。报告的一…

    技术杂谈 2023年5月31日
    0120
亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球