流式大数据计算实践(2)----Hadoop集群和Zookeeper
一、前言 1、上一文搭建好了Hadoop单机模式,这一文继续搭建Hadoop集群 二、搭建Hadoop集群 1、根据上文的流程得到两台单机模式的机器,并保证两台单机模式正常启动,记得第二台机器 core-site.xml内的fs.defaultFS参数值要改成本机的来启动,启动完毕后再改回来 2、 清空数据,首先把运行单机模式后生成的数据全部清理掉 rm -rf /work/hadoop/nn/ current rm -rf /work/hadoop/dn/current hdfs namenode -format 3、启动集群 (1)storm1作为namenode节点,所以在这台机上面执行命令启动namenode $HADOOP_PREFIX/sbin/hadoop-daemon. sh --script hdfs start namenode (2)storm2作为datanode节点,所以在这台机上面执行命令启动datanode $HADOOP_PREFIX/sbin/hadoop-daemon. sh --script hdfs start datanode (3)通过jps命令可以看到对应的节点,然后通过50070的控制台可以看到storm2的datanode节点 三、ZooKeeper 1、Zookeeper是分布式框架经常要用到的应用协调服务