Kafka0.8.0集群构建

jopen 12年前

最近要做实时计算相关的东西，目前每天约100G日志，还在不断增长，高峰时一天400G日志。

考虑过flume+activemq+storm+redis+hadoop，考虑用kafka做mq的备用方案。

我这里用了公司的三台机器

192.168.197.170

192.168.197.171

192.168.197.172

一. Zookeeper集群构建

ZooKeeper集群中具有两个关键的角色：Leader和Follower。集群中所有的结点作为一个整体对分布式应用提供服务，集群中每个结点之间都互相连接。

</td> </tr> </tbody> </table> </div>

ZooKeeper采用一种称为Leader election的选举算法。在整个集群运行过程中，只有一个Leader，其他的都是Follower，如果ZooKeeper集群在运行过程中Leader出了问题，系统会采用该算法重新选出一个Leader。

ZooKeeper集群启动的时候，会首先选出一个Leader，在Leader election过程中，某一个满足选举算的结点就能成为Leader。

</td> </tr> </tbody> </table> </div>

可以使用自带的zookeeper.

命令：$nohup bin/zookeeper-server-start.sh config/zookeeper.properties &

不过我选择了自己搭建zookeeper集群。

下载并解压zookeeper.

</div>

修改$zookeeper_home/conf 下面的配置文件

cp zoo_simple.cfg zoo.cfg

内容修改为

dataDir=/usr/local/tmp/zookeeper

clientPort=2181

server.170=192.168.197.170:2888:3888

server.171=192.168.197.171:2888:3888

server.172=192.168.197.172:2888:3888

在我们配置的dataDir指定的目录下面，创建一个myid文件，里面内容为一个数字，用来标识当前主机，conf/zoo.cfg文件中配置的server.X中X为什么数字，则myid文件中就输入这个数字，例如：

$ echo "170" > /usr/local/tmp/zookeeper/myid

</div> </div> </div> </td> </tr> </tbody> </table> </div> </div>

bin/zkServer.sh start 启动zookeeper

二. Kafka集群构建

1. 下载并解压Kafka

看官方文档里介绍，先得构建scala环境，但是我自己没有执行下面的操作，居然也能运行，有点莫名其妙，

我下载的是http://mirror.bit.edu.cn/apache/kafka/0.8.0/kafka_2.8.0-0.8.0.tar.gz 。

> tar xzf kafka-<VERSION>.tgz  > cd kafka-<VERSION>  > ./sbt update  > ./sbt package  > ./sbt assembly-package-dependency

2. 修改配置文件

修改 conf/server.properties

zookeeper.connect=192.168.197.170:2181,192.168.197.171:2181,192.168.197.172:2181

broker.id分别改成

broker.id=170

broker.id=171

broker.id=172

host.name分别改成(如果不改，client访问集群时，如果没在hosts配置对应机器的 hostname，访问将会报错)

host.name=192.168.197.170

host.name=192.168.197.171

host.name=192.168.197.172

可根据需求修改
port: broker节点使用端口号默认 9092
log.dir: 消息目录位置

3. 启动Kafka

cd /usr/local/kafka_2.8.0-0.8.0

JMX_PORT=9999 bin/kafka-server-start.sh config/server.properties &

4. 创建Topic并查看

bin/kafka-create-topic.sh --zookeeper 192.168.197.170:2181 --partition 1 --topic leo-test

bin/kafka-list-topic.sh --zookeeper 192.168.197.170:2181

topic: leo-test partition: 0 leader: 171 replicas: 171 isr: 171

说明：
partiton： partion id，由于此处只有一个partition，因此partition id 为0
leader：当前负责读写的lead broker id
relicas：当前partition的所有replication broker list
isr：relicas的子集，只包含出于活动状态的broker

bin/kafka-create-topic.sh --zookeeper 192.168.197.170:2181 --replica 2 --partition 2 --topic leo-test2

topic: leo-test partition: 0 leader: 171 replicas: 171 isr: 171

topic: leo-test2 partition: 0 leader: 171 replicas: 171,170 isr: 171,170

topic: leo-test2 partition: 1 leader: 170 replicas: 170,171 isr: 170,171

5.试着干掉一个非leader 的broker,然后在干掉leader broker,看看会有什么情况发生。

命令：
pkill -9 -f server.properties

安装过程遇到的问题：

1. kafka启动后提示

Unrecognized VM option '+UseCompressedOops'
Could not create the Java virtual machine.

开始以为是内存大小的问题，后来发现不是，是JDK的问题，我用的32位centos，jdk1.6_24, 换成JDK1.7依然报错。

查看 bin/kafka-run-class.sh

找到

if [ -z "$KAFKA_JVM_PERFORMANCE_OPTS" ]; then
KAFKA_JVM_PERFORMANCE_OPTS="-server -XX:+UseCompressedOops -XX:+UseParNewGC -XX:+UseConcMarkSweepGC -XX:+CMSClassUnloadingEnabled -XX:+CMSScavengeBeforeRemark -XX:+DisableExplicitGC -Djava.awt.headless=true"
fi

去掉-XX:+UseCompressedOops

JMX_PORT=9999 bin/kafka-server-start.sh config/server.properties &
启动成功

Kafka0.8.0集群构建

相关经验

目录