Kafka 概述

2023年7月24日下午10:41 • 技术杂谈 • 阅读 57

kafka 是一个为事件流而生的分布式消息系统，广泛应用于网页用户记录跟踪，IOT 设备，日志采集，系统监控等场景。

kafka 是用于构建实时数据管道和流应用程序。具有横向扩展，容错，wicked fast（变态快）等优点，并已在成千上万家公司运行。

举个例子，大部分现代人都刷过抖音、b 站、淘宝，都知道这些应用 app 有个特点就是推荐算法，你浏览的越多，它们越知道你对什么感兴趣。推荐算法如果离开了用户行为数据，也就是用户的浏览记录，那么就像是巧妇难为无米之炊，需要有数据的支撑才能让推荐算法发挥出它的效果。

那么，有什么实现方式呢，无非就是以下几种，用户点击一下，算法接到一个请求，进行分析，然后输出相关推荐。

这种方式是不可能的，为什么呢，一是一个点击一个点击的数据量太少，除非做下存储，然后隔一段事件批量拉取做分析，二是对算法系统压力太大，万一用户请求太多了，容易打爆算法系统。还有一种就是接入消息中间件，就像 kafka，用户点击一下，生产者（这里可以是 app 或者相应查询内容的后端服务）发送一个事件到 kafka 服务器（专业术语是 broker），然后就不管了，这时候算法系统（消费者）拉取数据，进行实时或者离线分析，就算你高峰期用户请求再多，有 broker 在，最多就是消息挤压，我慢慢消费就行了，总有一天消费得完，分析完再反哺用户，然后用户再点击，再分析，再反哺，造成一个循环，这个循环进行的多了，用户的兴趣爱好就暴露的越明显，这也就是越刷越停不下来的原因。（大家要少刷啊！多读书！少看抖音）。

可能大家还有个疑惑，既然你请求多了会打爆算法系统，那么为什么不会打爆 broker 呢，这就设计到 kafka 的横向扩容特性了，纵使你数据再多，我加机器，加分区解决。

再举个例子，是从kafka 中文教程看到的，很生动形象（做下推荐，这个是为大佬翻译了 kafka 官方文档，并且一直在维护，nb！yyds！）。
生产者消费者，生产者生产鸡蛋，消费者消费鸡蛋，生产者生产一个鸡蛋，消费者就消费一个鸡蛋，假设消费者消费鸡蛋的时候噎住了（系统宕机了），生产者还在生产鸡蛋，那新生产的鸡蛋就丢失了。再比如生产者很强劲（大交易量的情况），生产者1秒钟生产100个鸡蛋，消费者1秒钟只能吃50个鸡蛋，那要不了一会，消费者就吃不消了（消息堵塞，最终导致系统超时），消费者拒绝再吃了，”鸡蛋”又丢失了，这个时候我们放个篮子在它们中间，生产出来的鸡蛋都放到篮子里，消费者去篮子里拿鸡蛋，这样鸡蛋就不会丢失了，都在篮子里，而这个篮子就是”kafka”。

鸡蛋其实就是”数据流”，系统之间的交互都是通过”数据流”来传输的（就是tcp、https什么的），也称为报文，也叫”消息”。

消息队列满了，其实就是篮子满了，”鸡蛋” 放不下了，那赶紧多放几个篮子，其实就是kafka的扩容。

各位现在知道kafka是干什么的了吧，它就是那个”篮子”。

后面大家会看到一些关于kafka的名词，比如topic、producer、consumer、broker，我这边来简单说明一下。

producer：生产者，就是它来生产”鸡蛋”的。
consumer：消费者，生出的”鸡蛋”它来消费。
topic：你把它理解为标签，生产者每生产出来一个鸡蛋就贴上一个标签（topic），消费者可不是谁生产的”鸡蛋”都吃的，这样不同的生产者生产出来的”鸡蛋”，消费者就可以选择性的”吃”了。
broker：就是篮子了。

Original: https://www.cnblogs.com/cyrus-s/p/15550994.html
Author: 三木同学
Title: Kafka 概述

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/713758/

转载文章受原作者版权保护。转载请注明原作者出处！

技术杂谈

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

聊聊foobar是什么？

大一时看很多老外的文档，总是看到一个叫 foobar的词，当时倒不是纠结这个词到底是什么意思，因为看到这个词使用的场景大多是代码示例段、示例变量名等一些无意义的地方，猜也能猜到这个…

技术杂谈 2023年7月11日
0065
端智能在大众点评搜索重排序的应用实践

端智能在大众点评搜索重排序的应用实践 – 美团技术团队 https://tech.meituan.com/2022/06/16/edge-search-rerank.h…

技术杂谈 2023年5月31日
0066
quartz框架(五)-Trigger相关内容

上篇博文，博主介绍了Job的相关内容。本篇博文，博主将介绍Trigger相关的内容。 Trigger是触发器的意思，它只定义Trigger相关属性的Get方法。一个Trigger只…

技术杂谈 2023年7月24日
0065
DWR日志在log4j.xml配置

一、日志 DWR依赖 Apache Commons Logging，可以使用log4j实现日志记录功能。 1.1 日志简介和其他日志框架一样，当设置低等级的日志时所有高于此等级的…

技术杂谈 2023年5月30日
0097
dremio 的InformationSchemaCatalog 服务二

public class InformationSchemaRecordReader extends AbstractRecordReader { private static f…

技术杂谈 2023年5月30日
0077
十三、常用类（完结）

十三、常用类 13.1 包装类 13.1.1 包装类的分类介绍：针对八种基本数据类型对应的引用类型作用：可以调用包装类里面的方法分类： 13.1.2 包装类的继承关系学一个类首…

技术杂谈 2023年7月11日
0071
零基础入门Socket网络编程到高级进阶与实战精讲

404. 抱歉，您访问的资源不存在。可能是网址有误，或者对应的内容被删除，或者处于私有状态。代码改变世界，联系邮箱 contact@cnblogs.com 园子的商业化努力-困…

技术杂谈 2023年5月31日
0089
P2P在NAT和STUN

转自：https://blog.csdn.net/a1989a132/article/details/17139003 本文主要讨论关于P2P通信的一些常见问题和解决方案。主要内容…

技术杂谈 2023年6月1日
0088
看完您如果还不明白 Kerberos 原理，算我输！

系统环境操作系统：CentOS 6 或 CentOS 7 JDK 版本：1.8.0_151 Ambari 版本：2.6.1 HDP 版本：2.6.4.0 扩展链接 Kerbero…

技术杂谈 2023年7月25日
0091
配置phpstorm支持less自动编译css

安装node.js 安装less npm install less -g 安装css压缩插件less-plugin-clean-css（此步骤非必选） npm install le…

技术杂谈 2023年7月11日
0063
知识图谱读书笔记5

posted @2021-10-05 11:34 DarJeely 阅读(36 ) 评论() 编辑 Original: https://www.cnblogs.com/Jeely/…

技术杂谈 2023年5月31日
00113
《西方经济学（微观部分）》（第7版）概念梳理

一、需求、供给和均衡价格蛛网模型概念：运用弹性原理解释某些生产周期较长的商品在失去均衡时发生的不同波动情况的一种动态均衡分析理论。非均衡时的波动情况 => 供、需弹性不…

技术杂谈 2023年5月31日
0096
使用Java客户端发送消息和消费的应用

体验链接：https://developer.aliyun.com/adc/scenario/fb1b72ee956a4068a95228066c3a40d6 实验简介本教程将D…

技术杂谈 2023年7月11日
0077
PHP——16进制转10进制

两种方法。 <?php echo hexdec("00EF"); // 239 echo base_convert("00EF",16…

技术杂谈 2023年5月31日
0079
netlify跳转

Redirecting to Netlify Original: https://www.cnblogs.com/1314h/p/16661326.htmlAuthor: Naih…

技术杂谈 2023年6月21日
0092
8 月份全球 Wi-Fi6 技术标准更新

1.巴林 TRA 启用 Wi-Fi6 2022 年 8 月 17 日，巴林电信管理局 (TRA) 批准了 5470-5725 MHz 和 5925-6425 MHz 频段用于 Wi…

技术杂谈 2023年6月21日
0061

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Kafka 概述

大家都在看