基于docker的hadoop

在 hadoop-cluster-docker的基础上进行了更新

Linux 其它

访问GitHub主页

共6Star

详细介绍

docker-hadoop

感谢 https://github.com/kiwenlau/hadoop-cluster-docker 出第一版的源代码，本项目是在 hadoop-cluster-docker的基础上进行了更新

更新hadoop版本为3.1.2
jdk改用 oracle jdk1.8.0_201
增加hbase版本为.2.0
增加了3.x版本的兼容配置
调整了一些配置项

使用步骤

创建网络

 sudo docker network create --driver=bridge hadoop

下载源代码

 git clone https://github.com/liuchengts/docker-hadoop.git

获取镜像有2种方式:

从仓库拉取

 sudo docker pull registry.cn-hangzhou.aliyuncs.com/lcts/hadoop:1.0

编译镜像，执行

./build-image.sh

默认是1主2从总共3个节点如果需要更多节点请先执行

./resize-cluster.sh 5

指定参数> 1：2,3 ..
这个脚本只是用不同的从属文件重建hadoop镜像，以节点名称当做容器名称

创建容器，执行如果需要更多节点可增加执行参数

./start-container.sh
或
./start-container.sh 5

指定参数> 1：2,3 ..
这个脚本只是用不同的从属文件重建hadoop镜像，以节点名称当做容器名称

output:

start hadoop-master container...
start hadoop-slave1 container...
start hadoop-slave2 container...
root@hadoop-master:~#

启动 hadoop，执行

./start-hadoop.sh

启动测试程序，执行

./run-wordcount.sh

output

input file1.txt:
Hello Hadoop

input file2.txt:
Hello Docker

wordcount output:
Docker    1
Hadoop    1
Hello    2

推荐源码

暂无源码更多源码...

提
问题

写
面经

写
文章

微信
公众号

扫码关注公众号