基于docker的hadoop
在 hadoop-cluster-docker的基础上进行了更新
Linux 其它
访问GitHub主页
共6Star
详细介绍
docker-hadoop
https://github.com/kiwenlau/hadoop-cluster-docker 出第一版的源代码,本项目是在 hadoop-cluster-docker的基础上进行了更新
感谢- 更新hadoop版本为3.1.2
- jdk改用 oracle jdk1.8.0_201
- 增加hbase版本为.2.0
- 增加了3.x版本的兼容配置
- 调整了一些配置项
使用步骤
创建网络
sudo docker network create --driver=bridge hadoop
下载源代码
git clone https://github.com/liuchengts/docker-hadoop.git
获取镜像有2种方式:
- 从仓库拉取
sudo docker pull registry.cn-hangzhou.aliyuncs.com/lcts/hadoop:1.0
- 编译镜像,执行
./build-image.sh
默认是1主2从总共3个节点 如果需要更多节点 请先执行
./resize-cluster.sh 5
- 指定参数> 1:2,3 ..
- 这个脚本只是用不同的从属文件重建hadoop镜像,以节点名称当做容器名称
创建容器,执行 如果需要更多节点 可增加执行参数
./start-container.sh
或
./start-container.sh 5
- 指定参数> 1:2,3 ..
- 这个脚本只是用不同的从属文件重建hadoop镜像,以节点名称当做容器名称
output:
start hadoop-master container...
start hadoop-slave1 container...
start hadoop-slave2 container...
root@hadoop-master:~#
启动 hadoop,执行
./start-hadoop.sh
启动测试程序,执行
./run-wordcount.sh
output
input file1.txt:
Hello Hadoop
input file2.txt:
Hello Docker
wordcount output:
Docker 1
Hadoop 1
Hello 2
推荐源码
暂无源码 更多源码...