kafka 入门
Apache kafka kafka 是一个分布式的基于发布订阅的消息队列,主要应用于大数据实时处理领域。 什么是消息系统 消息系统负责将数据从一个应用程序传输到另一个应用程序,分布式消息传递基于可靠消息队列的概念。有两种类型的消息模式可用,一种是点对点, 另一种是 发布-订阅(pub-sub)消息系统,大多数是遵循 pub-sub 点对点系统, 消息被保存在队列中,一个或者多个消费者可以消耗队列中的消息,但是特定消息只能由某个消费者消费。一旦消费者读取队列中的消息,它 就从队列中消失。 发布-订阅消息系统, 在发布-订阅系统中,消息被保留在主题中,消费者可以订阅一个或者多个主题并使用主题中的消息。在 pub-sub 系统中,消息生产者成为发布者,消息使用者称为订阅者。 什么是 Kafka Apache Kafka 是一个分布式发布-订阅消息系统和一个强大的队列,可以处理大量的数据,并使消息从一个端点传递到另一个端点。Kafka 消息保留在磁盘上,并在集群内复制以防止数据丢失。 Kafka 的特带: 可靠性 kafka 是分布式的,分区,复制,容错 可扩展性 耐用性 性能 Kafka 工作流程 订阅具有相同 group id 的主题的消费者被认为是单个组,并且消息在他们之间共享。 pub -sub 工作流程 生产者定期向主题发送消息 kafka