Spark学习(4) Spark Streaming

2023年6月16日上午7:02 • 数据库 • 阅读 73

Apache

Flink

SparkSteaming

Storm

架构介于spark和storm之间，主从结构与sparkStreaming相似，DataFlow Grpah与storm 相似，数据流可以被表示为一个有向图，每个顶点是一个定义的运算，每向边表示数据的流动

Native

架构依赖Spark，主从模式，每个batch批次处理都依赖driver主，可以理解为时间维度上的spark DAG

Micro-Batch

主从模式，且依赖ZK，处理过程中对主的依赖不大

Native

基于Ghandy-Lamport distributed snapshots checkpoint机制

Medium

WAL 及RDD 血统机制

High（高）

Records Ack

Medium（一般）

处理模型与延时

单条时间处理

亚秒级低延时

一个事件窗口内的所有事件

秒级低延时

每次传入的一个事件

亚秒级低延时

吞吐量

High

Low （低）

数据处理保证

Exactly once

High

Exactly once(实现架用Chandy-Lamport算法，即marker-checkpoint)

High

Medium

高级API

Flink ，栈中提供了很多高级API 和满足不同场景的类库：机器学习、图分析、关系式数据处理

High

能够很容易的对接Spark 生态圈里面的组件，同时额能够对接主流的消息传输组件及存储系统

High

应用需要按照特定的storm 定义的规模编写

Low

易用性

支持SQL Streaming ，Batch 和Streaming 采用统一编程框架

High

支持SQL Streaming ，Batch 和Streaming 采用统一编程框架

High

不支持SQL Streaming

Medium

成熟性

新兴项目，处于发展阶段

Low

已经发展一段时间

Medium

相对较早的流系统，比较稳定

High

部署性

部署相对简单，只依赖JRE环境

Low

部署相对简单，只依赖JRE环境

Low

依赖JRE环境和ZK

High

Original: https://www.cnblogs.com/cheng9999/p/11903655.html
Author: cheng_blog
Title: Spark学习(4) Spark Streaming

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/621506/

转载文章受原作者版权保护。转载请注明原作者出处！

数据库

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

深入浅出分析 ArrayDeque

作者：炸鸡可乐原文出处：www.pzblog.cn 一、摘要在 jdk1.5 中，新增了 Queue 接口，代表一种队列集合的实现，咱们继续来聊聊 java 集合体系中的 Que…

数据库 2023年6月14日
0086
Proxy代理模式（结构型）

一：描述：为其他对象提供一种代理,来控制对这个对象的访问。如当操作某个对象很复杂时,我们可以建个代理来操作复杂对象，并开放一些简单的接口/方法来让我们比较简单的间接操作,也可在代…

数据库 2023年6月11日
0082
Java开源博客系统AngelBlog发布

一、Java开源博客系统(AngelBlog)系统简介 Angel工作室AngelBlog系统是基于Java Spring boot +前端bootstrap+jquery+lay…

数据库 2023年6月14日
0060
SQL Server的Descending Indexes降序索引

SQL Server的Descending Indexes降序索引 1、建立测试环境测试环境：SQL Server 2012 表结构如下 USE [test] GO CREATE…

数据库 2023年6月9日
0078
JUC学习笔记（一）

1、什么是 JUC 1.1、JUC简介在 Java 中，线程部分是一个重点，本篇文章说的 JUC 也是关于线程的。JUC 就是 java.util .concurrent 工具包…

数据库 2023年6月6日
0091
SpringMvc(四)- 下载,上传,拦截器

1、图片下载图片下载：将服务器端的文件以流的形式写到客户端，通过浏览器保存到本地，实现下载； 1.1 图片下载步骤 1.通过session获取上下文对象(session.getS…

数据库 2023年6月16日
0054
Nginx常见问题

基于端口的虚拟机：使用端口来区分，浏览器使用域名或ip地址:端口号访问。注意：~ 代表自己输入的英文字母。 16、location正则案例 1 #优先级1,精确匹配，根路径 …

数据库 2023年6月14日
00112
什么是前缀索引？

一、什么是前缀索引？所谓前缀索引，说白了就是对文本的前几个字符建立索引（具体是几个字符在建立索引时去指定），比如以产品名称的前 10 位来建索引，这样建立起来的索引更小，查询效…

数据库 2023年6月14日
0098
MYSQL–>事务

事务是一组操作的集合，它是一个不可分割的工作单位。事务会把所有的操作作为一个整体一起向系统提交或撤销操作请求，这些操作要么同时成功，要么同时失败开启事务—->…

数据库 2023年6月14日
0072
Docker常用命令

镜像：Docker 镜像是用于创建 Docker 容器的模板容器：容器是独立运行的一个或一组应用仓库：用来保存镜像，可以理解为代码控制中的代码仓库一个仓库中包含多个镜像，以镜像为…

数据库 2023年6月11日
0075
Java 函数式编程

有且仅有一个未实现的非静态方法的接口叫做”函数式接口” interface IFactory<t> { T create(); } </t…

数据库 2023年6月6日
00106
mybatis order by concat用法

由于项目中用到了一个关联查询，关联的表中都有id字段，在排序时，使用${id}，获取值时，一直报 Column ‘id’ in order clause i…

数据库 2023年6月11日
0069
mysql中generated always as的使用

— generated always as的使用CREATE TABLE t1(c1 INT,c2 DOUBLE(20,19) ,c3 INT GENERATED AL…

数据库 2023年6月9日
0083
SQL语句的整合

基础语法 https://blog.csdn.net/m0_37989980/article/details/103413942 CRUD 提供给数据库管理员的基本操作，CRUD(…

数据库 2023年6月14日
0067
linux中如何查找一个文件夹的大小呢？

1、（方法一）ls -lht会列出当前目录下每个文件的大小，同时也会给出当前目录下所有文件大小总和 2、（方法二）du -sh *也会列出当前文件夹下所有文件对应的大小【把*替换…

数据库 2023年6月11日
0085

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Spark学习(4) Spark Streaming

大家都在看