Kafka 入门到起飞系列

发布人：shili8 发布时间：2025-03-13 19:40 阅读次数：0

**Kafka 入门到起飞系列**

###什么是 Apache KafkaApache Kafka 是一个分布式流数据平台，最初由 LinkedIn 开发，以解决大规模日志采集、处理和分析的需求。它提供了高吞吐量、低延迟和可扩展性等特点，使其成为大型数据处理系统的理想选择。

### Kafka 的基本概念####1. 主题（Topic）

主题是 Kafka 中的一个关键概念，它代表一个特定的数据流。每个主题可以有多个分区，每个分区都有自己的生产者和消费者。

####2. 分区（Partition）

分区是主题中的一部分，用于存储和处理数据。每个分区都有一个唯一的 ID，可以通过 ID 来访问特定的分区。

####3. 生产者（Producer）

生产者是向 Kafka Topics 中写入数据的客户端。它负责将数据发送到指定的 Topic 和 Partition。

####4. 消费者（Consumer）

消费者是从 Kafka Topics 中读取数据的客户端。它负责从指定的 Topic 和 Partition 中拉取数据并进行处理。

### Kafka 的基本流程1. **生产者**向 Kafka Topics 中写入数据。
2. **Broker**接收和存储数据，分区数据到不同的分区中。
3. **消费者**从 Kafka Topics 中读取数据，并进行处理。

### Kafka 入门示例####1. 安装 Kafka首先，我们需要安装 Kafka。可以通过以下命令下载并安装：

bashwget  -xvf kafka_2.12-2.7.0.tgzcd kafka_2.12-2.7.0

####2. 启动 Kafka启动 Kafka Broker：

bashbin/zookeeper-server-start.sh etc/kafka/zookeeper.properties &
bin/kafka-server-start.sh etc/kafka/server.properties &

####3. 创建 Topic创建一个名为 "my_topic" 的 Topic：

bashbin/kafka-topics.sh --create --bootstrap-server localhost:9092 --replication-factor1 --partitions1 my_topic

####4. 生产数据使用生产者向 Topic 中写入数据：

from kafka import KafkaProducerproducer = KafkaProducer(bootstrap_servers=['localhost:9092'])

for i in range(10):
 producer.send('my_topic', value=f'message {i}'.encode('utf-8'))

####5. 消费数据使用消费者从 Topic 中读取数据：

from kafka import KafkaConsumerconsumer = KafkaConsumer('my_topic', bootstrap_servers=['localhost:9092'])

for message in consumer:
 print(message.value.decode('utf-8'))

### 总结本文介绍了 Apache Kafka 的基本概念和流程，提供了一个入门示例。通过这个示例，我们可以看到 Kafka 是一个分布式流数据平台，可以高效地处理大规模的数据流。

### 后续内容下一篇文章将继续讨论 Kafka 的高级特性，包括分区、副本和消费者组等。我们还会探索如何使用 Kafka 来实现实时数据处理和分析。

### 参考资料* Apache Kafka 官方文档： />* Kafka 入门指南：

上一条：mysql（三）用户权限管理

下一条：instr字符查找函数（oracle用instr来代替like）