kafka rebalance机制,kafka reblance partition过程

kafka rebalance机制

摘要：

kafkar均衡机制kafka保证同一消费者组中只有一个消费者会使用消息。事实上，kafka保证每个使用者实例将在稳定状态下使用一个或多个特定数据，分区的数据将仅由特定使用者实例使用。这种设计的缺点是，同一消费者群体中的消费者无法平均消费数据，优点是每个消费者不必与大量经纪人进行通信，以减少通信开销。同事们还减少了分配的难度，使其更易于实施。此外，由于同一分区中的数据是有序的，因此可以确保每个分区中的的数据也被有序地消耗。

kafka rebalance机制

kafka保证同一个consumer group中只有一个consumer会消费掉某条消息，实际上，kafka保证的是稳定状态下每一个consumer实例只会消费一个或者多个特定的数据，而某个partition的数据只会被某一个特定的consumer实例所消费，这样设计的劣势是无法让同一个consumer group里的consumer均匀的消费数据，优势是每个consumer不用跟大量的broker通信，减少通信开销，同事也降低了分配的难度，实现也更简单，另外，因为同一个partition里的数据都是有序的，这样可以保证每个partition里的数据也是有序被消费的。如果某consumer group中consumer数量少于partition的数量则至少有一个consuemr会消费多个partition的数据，如果consumer的数量与partition数量相同，则正好一个consumer消费一个partition 的数据，而如果consumer的数量多于partition的数量时，会有部分consumer无法消费该topic下任何一条信息。

Consumer Rebalance 算法如下：

将目标topic下所有的partition排序，存于pt
对某 consumer group 下所有consumer 排序，存于cg ，第i个consumer记为ci `
N=size(Pt)/size(cg) 向上取整
解除ci对原来分配的partiiton 的消费权（i从零开始）
将第i*N到（i+1）* N-1个partition分配给ci

目前consumer realance 的控制策略是由每一个consumer通过通过zookeeper完成的，具体的控制方法

在/consumer/[consumer-group]/下注册id
设置/cnsumer/[consumer_group] 的watcher
设置对/brokers/ids 的watcher
zk下设置watcher的路径节点更改，触发consumer rebalance

在这种策略下，每一个consumer或者broker的增加或减少都会触发consumer rebalance 因为每个consumer只负责调整自己所消费的paritition，为了保证整个consumer group的一致性，所以当一个consumer触发了rebalance时，该consumer group 内的其他所有consumer 也应该同时触发rebalance

herd effect

任何broker或者consumer的增减都会触发所有的consumer的rebalance

split brain

每个consumer分别单独通过zookeeper判断哪些parittion dowm了那么不同consumer从

zookeeper 看到的view就看不一样了，这样会造成错误的reblance尝试，而且有可能所以的consumer 都认为rebalance

免责声明：文章转载自《kafka rebalance机制》仅用于学习参考。如对内容有疑问，请及时联系本站处理。

kafka rebalance机制

kafka rebalance机制

相关文章

Jenkins Generic Webhook Trigger+gitlab设置触发器

关于Java高并发的问题

分享一些 Kafka 消费数据的小经验

LPC (Local procedure calls) (一)数据结构

使用ionic3快速开发webapp（二）

Linux命令发送Http的get或post请求(curl和wget两种方法)

最新文章

随机推荐

思享工具箱导航

JSON工具

格式化转换

加解密编码

文本数字

网络

站长

计算

其他

对照列表