世界百事通!超简单的Kafka架构入门指南,看这一篇就够了

2023-05-08 09:31:17 一灯架构
1. Kafka简介

Apache Kafka 是一种高吞吐、分布式的流处理平台,由 LinkedIn 开发并于 2011 年开源。它具有高伸缩性、高可靠性和低延迟等特点,因此在大型数据处理场景中备受青睐。Kafka 可以处理多种类型的数据,如事件、日志、指标等,广泛应用于实时数据流处理、日志收集、监控和分析等领域。

通常用作消息队列和流处理,作为消息队列的时候,竞品有RabbitMQ、ActiveMQ、RocketMQ、Apache Pulsar等。

2. Kafka架构

下面介绍一下Kafka架构中最重要的三个参与者:


【资料图】

Producer(生产者):生产者负责将消息发送到 Kafka 集群。Consumer(消费者):消费者负责从 Kafka 集群中拉取并消费消息。Broker(代理节点):Broker 是 Kafka 集群中的一个服务代理节点,可以看作是一台服务器。Kafka 集群通常由多个 Broker 组成,以实现负载均衡和容错。3. 分区与副本

Kafka为了对消息进行分类,引入了Topic(主题)的概念。生产者在发送消息的时候,需要指定发送到某个Topic,然后消息者订阅这个Topic并进行消费消息。

Kafka为了提升性能,又在Topic的基础上,引入了Partition(分区)的概念。Topic是逻辑概念,而Partition是物理分组。一个Topic可以包含多个Partition,生产者在发送消息的时候,需要指定发送到某个Topic的某个Partition,然后消息者订阅这个Topic并消费这个Partition中的消息。

Kafka为了提高系统的吞吐量和可扩展性,把一个Topic的不同Partition放到多个Broker节点上,充分利用机器资源,也便于扩展Partition。

Kafka为了保证数据的安全性和服务的高可用,又在Partition的基础上,引入Replica(副本)的概念。一个Partition包含多个Replica,Replica之间是一主多从的关系,有两种类型Leader Replica(领导者副本)Follower Replica(跟随者副本),Replica分布在不同的Broker节点上。

Leader Replica负责读写请求,Follower Replica只负责同步Leader Replica数据,不对外提供服务。当Leader Replica发生故障,就从Follower Replica选举出一个新的Leader Replica继续对外提供服务,实现了故障自动转移。

下图展示的是,同一个Topic的不同Partition在Broker节点的分布情况:

Kafka为了提升Replica的同步效率和数据写入效率,又对Replica进行分类。针对一个Partition的所有Replica集合统称为AR(Assigned Replicas,已分配的副本),包含Leader Replica和Follower Replica。与Leader Replica保持同步的Replica集合称为ISR(In-Sync Replicas,同步副本),与Leader Replica保持失去同步的Replica集合称为OSR(Out-of-Sync Replicas,失去同步的副本)AR = ISR + OSR

Leader Replica将消息写入磁盘前,需要等ISR中的所有副本同步完成。如果ISR中某个Follower Replica同步数据落后Leader Replica过多,会被转移到OSR中。如果OSR中的某个Follower Replica同步数据追上了Leader Replica,会被转移到ISR中。当Leader Replica发生故障的时候,只会从ISR中选举出新的Leader Replica。

4. 偏移量

Kafka为了记录副本的同步状态,以及控制消费者消费消息的范围,于是引入了LEO(Log End Offset,日志结束偏移量)HW(High Watermark,高水位)。

LEO表示分区中的下一个被写入消息的偏移量,也是分区中的最大偏移量。LEO用于记录Leader Replica和Follower Replica之间的数据同步进度,每个副本中各有一份。

HW表示所有副本(Leader和Follower)都已成功复制的最小偏移量,是所有副本共享的数据值。换句话说,HW之前的消息都被视为已提交,消费者可以消费这些消息。用于确保消息的一致性和只读一次。

下面演示一下LEO和HW的更新流程:

初始状态,三个副本中各有0和1两条消息,LEO都是2,位置2是空的,表示是即将被写入消息的位置。HW也都是2,表示Leader Replica中的所有消息已经全部同步到Follower Replica中,消费者可以消费0和1两条消息。生产者往Leader Replica中发送两条消息,此时Leader Replica的LEO的值增加2,变成4。由于还没有开始往Follower Replica同步消息,所以HW值和Follower Replica中LEO值都没有变。由于消费者只能消费HW之前的消息,也就是0和1两条消息。Leader Replica开始向Follower Replica同步消息,同步速率不同,Follower1的两条消息2和3已经同步完成,而Follower2只同步了一条消息2。此时,Leader和Follower1的LEO都是4,而Follower2的LEO是3,HW表示已成功同步的最小偏移量,值是3,表示此时消费者只能读到0、1、2,三条消息。所有消息都同步完成,三个副本的LEO都是4,HW也是4,消费者可以读到0、1、2、3,四条消息。5. 消费者组

Kafka为了提高消息的处理效率,引入了消费者组的概念。一个消费者组(Consumer Group)包含多个消费者,一个消费者组可以同时订阅多个Topic,一个Topic也可以同时被多个消费者组订阅。

为了保证同一个Partition的消息被顺序处理,针对一个消费者组,一个Partition的消息只会交给这个消息者组的一个消费者处理。

6. 总结

本文简单介绍了Kafka架构,以及架构中涉及到底的一些名词概念,包括Producer(生产者)、Consumer(消费者)、Broker(代理节点)、Topic(主题)、Partition(分区)、Leader Replica(领导者副本)、Follower Replica(跟随者副本)、LEO(Log End Offset,日志结束偏移量)、HW(High Watermark,高水位)、Consumer Group(消费者组)等。

标签:

相关文章

世界百事通!超简单的Kafka架构入门指南,看这一篇就够了

1 Kafka简介ApacheKafka是一种高吞吐、分布式的流处理平台,由LinkedIn开发并于2011年开源。它具有高伸缩性

2023-05-08

中国银行人民币外汇牌价(05.08)

货币名称现汇买入价现钞买入价现汇卖出价现钞卖出价中行折算价阿联酋迪拉姆37 4134 5437 6740 6137 78澳大

2023-05-08

天天热议:创意古诗有哪些形式 4.我需要关于青春的诗,最好比较长

抄写作文网小编为大家提供创意古诗有哪些形式4 我需要关于青春的诗,最好比较长来供大家参考,欢迎阅读。2

2023-05-08

全球即时:财险公司一季度保费与净利双升 近八成综合投资收益率同比提高

财险公司一季度保费与净利双升近八成综合投资收益率同比提高根据险企近期陆续披露的偿付能力报告,一季度,

2023-05-08

每日精选:三年行动首战之年·现场丨“创业何必去远方,家乡就是好地方”

春和景明,万物昭苏。丹东东港市黄海北岸201国道沿线,一排排温室大棚鳞次栉比,在阳光的照射下泛着银光。

2023-05-08

快资讯丨这国拟用人民币向俄罗斯买石油

新湖南,主流新媒体,移动新门户。-分享自@新湖南

2023-05-08

今日S5830(s5830怎么样)-焦点观察

S5830,s5830怎么样很多人还不知道,现在让我们一起来看看吧!1、不错啊,在用,切水果可以玩啊。2、我有下

2023-05-08

流浪动物伤人 弃养、投喂者需担责 环球新视野

被遗弃之后,流浪的宠物们开始在人们生活的边缘游荡,在它们走进人们视野博取关注的同时,一些因其造成的财

2023-05-08

【天天聚看点】第八届招宝蒲公英换书大会举行

5月7日上午,第八届招宝蒲公英换书大会暨镇海区2023年哲学社会科学普及周启动仪式在宁波镇海区招宝山街道举

2023-05-07

七律长征中的七律是什么意思_七律长征中的七律指什么|天天微头条

欢迎观看本篇文章,小升来为大家解答以上问题。七律长征中的七律是什么意思,七律长征中的七律指什么很多人

2023-05-07

新疆库尔德宁景区迎来旅游“热” 全球即时看

进入五月,多地旅游热度攀升,位于新疆伊犁河谷的库尔德宁景区也迎来旅游热。随着旅游基础设施不断完善、服

2023-05-07

发布会上“1+N”秀肌肉,科大讯飞“星火”何以燎原?

认知大模型的星星之火,终将成燎原之势。文│松果财经作者│Manjusaka自从ChatGPT横空出世,一个更美好的世

2023-05-07

第三次海洋污染基线调查:我国局部近岸海域污染依然存在 环球今日讯

生态环境部近日启动实施第三次海洋污染基线调查,以我国近岸海域和海湾为重点,开展海水、沉积物和生物体中

2023-05-07

同比增长七成 福田汽车4月销量达5.1万辆

5月7日,福田汽车发布数据显示,今年4月汽车销量为5 1万辆,同比增长70 02%。其中,新能源汽车销量为2316辆

2023-05-07

湖北:“黑老大”黄大发落网!警方公开征集犯罪线索_每日头条

连日来,江城武汉,惊雷阵阵。比惊雷更让人震惊的,是湖北警方公布的一条通告——2023年5月6日,湖北省...

2023-05-07

【天天热闻】首设“农技讲堂”!黑龙江“插秧专列”如约而至

农业专家手拿秧苗讲解农业知识。央视网消息(记者李文学):又是一年插秧季。5月6日17时,黑龙江省首趟...

2023-05-07

愿平安!福建龙岩4名干部查看水情时落水失联,年龄最小的仅25岁|环球通讯

今日凌晨1点40分左右,4名当地干部在龙川溪一座桥上查看水情时,桥梁突然垮塌,4人落水失联

2023-05-07

Steam搜索功能升级,可以搜索游戏开发商了-环球速读

V社今日宣布推出了一个针对Steam商店搜索的更新,现在可以直接搜索特定的商店中心、标签以及开发商,方便玩

2023-05-07

如何登录工商银行网上银行(怎么进入工商银行网上登录页面) 焦点热文

1、通过工行门户网站登录个人网上银行,需输入已开通网银的卡(账)号 手机号 用户名及登录密码。2、(作答

2023-05-07

匪我思存东宫五个番外txt(匪我思存东宫五个番外) 当前消息

匪我思存东宫五个番外txt,匪我思存东宫五个番外这个很多人还不知道,现在让我们一起来看看吧!1、太液芙蓉

2023-05-07

我国基本实现沿海重要水域和主要港口雷达信号全覆盖

央视网消息:交通运输部数据显示,我国已经成为世界上建设船舶交通管理系统中心最多、监管水域面积最大的国

2023-05-07

焦点信息:女生初中毕业最吃香的专业 前景好的专业有哪些

女生初中毕业最吃香的专业有:护理专业、导游专业、学前教育专业、计算机专业、铁路类专业、航空乘务专业、

2023-05-07

gopro5说明书_gopro5-当前聚焦

1、一般运动相机,录像多久,有两个概念,电池与卡,本人以自己的实际产品,SJCAM运动相机SJ7为例,电池,

2023-05-07

秦刚会见巴基斯坦陆军参谋长穆尼尔

当地时间5月6日,国务委员兼外长秦刚在巴基斯坦伊斯兰堡会见巴陆军参谋长穆尼尔。

2023-05-07

全球快看:揭开亚马逊地区脚下的秘密:古老的土壤如何促进全球的森林恢复

在大约公元前450年到公元前950年之间,生活在今天亚马逊地区的数百万美洲印第安人通过各种过程改造了原本贫

2023-05-07

每日热议!玉树:缤纷美景入画来

当代山上,蓝天白云下一片生机盎然。(摄于2022年6月19日)本报记者程宦宁摄本报记者王晶程宦宁四月的玉树

2023-05-07

世界热议:金沙县气象台继续发布雷电黄色预警信号【Ⅲ/较重】【2023-05-07】

金沙县气象台5月7日0时41分继续发布雷电黄色预警信号:预计未来3小时我县清池、源村、石场、桂花、太平、马

2023-05-07

世界今头条!江西10地特大暴雨!34地大暴雨!63地暴雨!洪水蓝色预警!

据江西省气象局消息,近日江西遭遇入汛以来最强暴雨天气,省防汛抗旱指挥部决定自5月6日9时起启动防汛四级

2023-05-06

听说电影迅雷1080 听说电影迅雷

今天来聊聊关于听说电影迅雷1080,听说电影迅雷的文章,现在就为大家来简单介绍下听说电影迅雷1080,听说电

2023-05-06

天天看热讯:【瞰全球】外媒聚焦“五一”假期:活力中国,驱动亚太经济增长

假日消费被视为观察经济活力的窗口。刚刚过去的“五一”假期,显示出人们出游的强烈意愿和消费热情。商...

2023-05-06

最新发布
精彩图文
精彩推送

Copyright @  2015-2018 西南it网版权所有  备案号:皖ICP备2022009963号-8   联系邮箱:39 60 29 14 2@qq.com