Kafka权威指南-第二版

书名

作者：

分类：

进度

阅读记录：开始时间：2024-08-08 ~ 结束时间：YYYY-MM-dd

阅读页数：

消息丢失：1 生产者保证发出去（核心保证） 2 broker保证多副本+落磁盘 3 消费者保证不漏消息（消息还在，只是没有消费）消息重复：1 生产者幂等 2 broker拒绝重复消息 3 消费者不重复消费（核心保证：处理消息+提交偏移量）消息顺序：1 单分区消息有序（核心保证） 2 retries>0 && max.in.flight.requests.per.connection>1 && enable.idempotence=false，批次顺序可能会反，有重排序可能性。但是一个批次是有序的。retries>0 && max.in.flight.requests.per.connection=1也可以保证，但是可用性变低了。 enable.idempotence=true && max.in.flight.requests.per.connection<=5 && retries>0 可以保证有序+重试消息不重复。

消息写入成功指的是发送去确认acks=1，0，-1。和消息已经提交写入所有同步副本不是一个概念。acks=1写入leader，但是不一定提交了。 acks=-1，写入所有同步副本，但是没有重试，消息也会丢失。

不丢消息，重试，可能产生重复消息。

已提交消息（写入所有同步副本）和已提交偏移量（消费者发送kafka的偏移量，用于确认最后一条消息在分区位置）。

HW(HighWatermark),OSR(Out-Sync Relipcas),ISR(In-Sync Replicas),AR(Assigned Repllicas),LEO(LogEndOffset),LSO( LogStartOffset)，CO(ConsumerOffset-已提交偏移量)

Lag=HW-CO或LEO-CO

kafka事务消息保证流处理模型：消费-处理-生产，保证原子多分区写入。提交偏移量到_consumer_offsets主题，写入结果到输出主题。

kafka实现精确一次性语义：1 幂等生产者（避免重试机制导致的重复处理） 2 事务（Stream精确一次性语义基础）

配置参数

broker

broker.id

listeners

zookeeper.connect

log.dirs

num.recovery.threads.per.data.dir

auto.create.topics.enable

auto.leader.rebalance.enable

delete.topic.enable

broker in os

vm.swappiness

vm.dirty_background_ratio

vm.overcommit_memory

net.core.wmem_default

net.core.rmem_default

net.ipv4.tcp_window_scaling

net.ipv4.tcp_max_syn_backlog

net.core.netdev_max_backlog

G1:MaxGCPauseMillis和InitiatingHeapOccupancyPercent

topic

num.partitions=1

default.replication.factor=1

log.retention.ms

log.retention.bytes

log.segment.bytes

log.roll.ms

min.insync.replicas

message.max.bytes

producer

bootstrap.server

key.serializer

value.serializer

client.id

acks

max.block.ms

delivery.timeout.ms

request.timeout.ms

retries

retry.backoff.ms

linger.ms

buffer.memory

compression.type

batch.size

max.in.flight.requests.per.connection

max.request.size

receive.buffer.bytes

send.buffer.bytes

enable.idempotence

consumer

fetch.min.bytes=1

fetch.max.wait.ms=500

fetch.max.bytes=52428800=50MB

max.poll.records=500

max.partition.fetch.bytes=1048576=1M

session.timeout.ms=10000=10秒

heart.interval.ms=3000=3秒

max.poll.interval.ms=300000=5分钟

default.api.timeout.ms=60000=1分钟

request.timeout.ms=30000=30秒

auto.offset.reset=latest

enable.auto.commit=true

partition.assignment.strategy：RangeAssignor，RoundRobinAssignor，StickyAssignor，CooperativeStickyAssignor，