Kafka核心概念及核心机制

骑猪看日落 2024-02-19 15:54 122阅读 0赞

核心概念

broker: 进程
producer: 生产者 flume
consumer: 消费者 ss (spark streaming,,,)
topic: 主题 分区+副本数 文件夹
partition: 分区一个分区可以有多个副本

consumergroup:

在这里插入图片描述
重点解析:
1.一个组内,共享一个公共的GROUPID
2.组内的所有消费者协调一起,去消费topic的所有的分区,并且不重复
3.每个分区p0只能由一个消费组A的一个消费者C1来消费(po只能让A组的c1消费,不能c2在消费)
4.容错性的消费机制

offset:

有序的 不可变的序列 相当于MySQL自增长主键
每个分区记录offset 偏移量 都是从1开始
segment: 每个分区都是由一系列的segment文件组
segment: log+index 两两出现
命名规则: 第一组为00000000000000000000
第二组为00000000000000002000
名称是由上一组的最后一条消息的offset来命名
例子:
通过offset为2800对应的消息
00000000000000000000.index
00000000000000000000.log
00000000000000002000.index
00000000000000002000.log
00000000000000004200.index
00000000000000004200.log

1.log文件记录message 全部
2.index文件记录 相对offset和对应的消息的物理偏移量 字节位置
稀疏存储
3.2800-2000=800 相对offset 800

发表评论

表情:
评论列表 (有 0 条评论,122人围观)

还没有评论,来说两句吧...

相关阅读

    相关 KafkaKafka核心概念

    1 消息系统简介 1.1 为什么要用消息系统 ? 解耦 各位系统之间通过消息系统这个统一的接口交换数据,无须了解彼此的存在; 冗余 部分消息系统具有消息持久化能

    相关 Kafka 核心概念和操作示例

    前面写了篇《聊一聊高并发高可用那些事(一):Kafka 篇》算是二稿吧,本篇是第三稿收尾了。 在本场 Chat 中, 会讲到如下内容: 1. 为什么需要消息队列 2.