Spark学习(4)SparkStreaming

2023年7月24日上午2:19 • 技术杂谈 • 阅读 71

Apache

Flink

SparkSteaming

Storm

架构介于spark和storm之间，主从结构与sparkStreaming相似，DataFlow Grpah与storm 相似，数据流可以被表示为一个有向图，每个顶点是一个定义的运算，每向边表示数据的流动

Native

架构依赖Spark，主从模式，每个batch批次处理都依赖driver主，可以理解为时间维度上的spark DAG

Micro-Batch

主从模式，且依赖ZK，处理过程中对主的依赖不大

Native

基于Ghandy-Lamport distributed snapshots checkpoint机制

Medium

WAL 及RDD 血统机制

High（高）

Records Ack

Medium（一般）

处理模型与延时

单条时间处理

亚秒级低延时

一个事件窗口内的所有事件

秒级低延时

每次传入的一个事件

亚秒级低延时

吞吐量

High

Low （低）

数据处理保证

Exactly once

High

Exactly once(实现架用Chandy-Lamport算法，即marker-checkpoint)

High

Medium

高级API

Flink ，栈中提供了很多高级API 和满足不同场景的类库：机器学习、图分析、关系式数据处理

High

能够很容易的对接Spark 生态圈里面的组件，同时额能够对接主流的消息传输组件及存储系统

High

应用需要按照特定的storm 定义的规模编写

Low

易用性

支持SQL Streaming ，Batch 和Streaming 采用统一编程框架

High

支持SQL Streaming ，Batch 和Streaming 采用统一编程框架

High

不支持SQL Streaming

Medium

成熟性

新兴项目，处于发展阶段

Low

已经发展一段时间

Medium

相对较早的流系统，比较稳定

High

部署性

部署相对简单，只依赖JRE环境

Low

部署相对简单，只依赖JRE环境

Low

依赖JRE环境和ZK

High

Original: https://www.cnblogs.com/cheng9999/p/11903655.html
Author: cheng_blog
Title: Spark学习(4)SparkStreaming

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/711796/

转载文章受原作者版权保护。转载请注明原作者出处！

技术杂谈

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

「猪齿鱼」助力汉得信息智能制造集中交付高效协同

导语 IT咨询行业面临着人天单价难以提高，而员工待遇和营运成本持续提升的压力，这大大压缩了咨询公司的利润空间，逼迫着咨询公司要想办法提高项目的交付效率，进行业务模式的变革。采用远程…

技术杂谈 2023年7月24日
00103
暗时间

这本书买来3年了以后才真正拿出来看，说来实在惭愧。也是自己在看完《开放的智力》以后迫切想看的，因为《开放的智力》当中多次提到刘未鹏的《暗时间》。我读本科那会，就知道这个牛人，后…

技术杂谈 2023年5月31日
0066
透视矩阵的推导（最直观、最深入、最还原，看完请点赞。）

由參数l,r,b,t,n,f定义的透视投影矩阵的推导困惑了我差点儿相同一个多礼拜。这几天差点儿是天天都在思考这个问题。昨天晚上3点多钟我突然醒了，然后我又開始想这个问题，结果最终让…

技术杂谈 2023年5月31日
0073
Error: [WinError 10013] An attempt was made to access a socket in a way forbidden by its access permissions

Error: [WinError 10013] An attempt was made to access a socket in a way forbidden by its a…

技术杂谈 2023年5月30日
0067
Windows+VSCode交叉编译在Linux-Arm环境上运行的程序

一、简介本文主要介绍在Windows平台上用VSCode配置交叉编译，从而可以一键编译出运行在Linux-Arm环境中的程序或库。二、准备工具 ①vscode ② cmake …

技术杂谈 2023年7月24日
0067
新增一个Redis 从节点为什么与主节点的key数量不一样呢？

过期键删除策略 (1) 惰性删除放任键过期不管，但是每次从键空间中获取键时，都检查取得的键是否过期，如果过期的话，就删除该键;如果没有过期，就返回该键。该策略对 CPU 来说是…

技术杂谈 2023年7月25日
00103
fashion datasets图像检索实践project

Using Siamese Networks and Pre-Trained Convolutional Neural Networks (CNNs) for Fashion Si…

技术杂谈 2023年6月1日
0089
MySQL8.0解决“MySQL 服务无法启动。服务没有报告任何错误。”

TL;NRs 初始化服务时最好使用 mysqld –initialized –console命令； MySQL8.0的配置变量与MySQL5.7不同， [mysqld]下面设置…

技术杂谈 2023年7月25日
0087
Python超好用的命令行界面实现工具，我保证你肯定不知道…

前言 Click 是一个简洁好用的Python模块，它能用尽量少的代码实现漂亮的命令行界面。它不仅开箱即用、还能支持高度自定义的配置。官方文档：https://click.pa…

技术杂谈 2023年6月21日
0089
docker学习：docker容器数据卷

是什么 docker的理念将运用与运行的环境打包形成容器运行，运行可以伴随着容器，但是我们对数据的要求希望是持久化的容器之间希望有可能共享数据 docker容器产生的数据，如果…

技术杂谈 2023年7月10日
0083
Vue 插槽

插槽到底是个啥？5分钟搞定 Vue 插槽插槽的基本使用组件使用slot标签，显示组件标签的内容 Title aaa Vue.component(‘child1’, { temp…

技术杂谈 2023年6月21日
0087
高危！Fastjson反序列化远程代码执行漏洞风险通告，请尽快升级

据国家网络与信息安全信息通报中心监测发现，开源Java开发组件Fastjson存在反序列化远程代码执行漏洞。攻击者可利用上述漏洞实施任意文件写入、服务端请求伪造等攻击行为，造成服务…

技术杂谈 2023年5月31日
0093
Metalama简介2.利用Aspect在编译时进行消除重复代码

上文介绍到 Aspect是 Metalama的核心概念，它本质上是一个编译时的AOP切片。下面我们就来系统说明一下 Metalama中的 Aspect。Metalama简介1. 不…

技术杂谈 2023年5月31日
0068
php中的替换

首先修改PHP.ini文件. 如下:1. 将short_open_tag = Off 改成On开启以后可以使用PHP的短标签：来代替同时，只有开启这个才可以使用 2. 将 asp_…

技术杂谈 2023年5月31日
00113
树状数组二分

#include//树状数组二分 using namespace std; int q,b,s,…

技术杂谈 2023年6月21日
00100
shopify速度评分怎么提升

shopify速度慢对用户和搜索引擎都不友好，提升shopify速度迫在眉睫！那么,shopify速度评分怎么提升呢？从app、theme code、image、video等几点优…

技术杂谈 2023年5月31日
0066

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Spark学习(4)SparkStreaming

大家都在看