Hadoop Single Node Setup using Docker on Ubuntu

This guide helps you install and run Apache Hadoop (Single Node) using Docker on Ubuntu.

Prerequisites

Ubuntu 20.04 / 22.04
Docker installed
Internet connection
Basic terminal usage

Step 1: Install Docker

sudo apt update sudo apt install ca-certificates curl gnupg # Add Docker's GPG key sudo install -m 0755 -d /etc/apt/keyrings curl -fsSL https://download.docker.com/linux/ubuntu/gpg | \ sudo gpg --dearmor -o /etc/apt/keyrings/docker.gpg sudo chmod a+r /etc/apt/keyrings/docker.gpg # Add Docker's repository echo \ "deb [arch=$(dpkg --print-architecture) signed-by=/etc/apt/keyrings/docker.gpg] \ https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable" | \ sudo tee /etc/apt/sources.list.d/docker.list > /dev/null # Install Docker sudo apt update sudo apt install docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-plugin

Step 2: (Optional) Run Docker Without `sudo`

sudo usermod -aG docker $USER newgrp docker

Or restart your system for group changes to take effect.

Step 3: Create a Docker Network

docker network create hadoop

Step 4: Pull the Hadoop Docker Image

We are using the official BDE Hadoop image:

docker pull bde2020/hadoop-namenode:2.0.0-hadoop3.2.1-java8

Step 5: Run the Hadoop NameNode Container

docker run -itd \ --net hadoop \ --name hadoop-master \ -p 9870:9870 -p 9000:9000 \ -e CLUSTER_NAME=HadoopCluster \ bde2020/hadoop-namenode:2.0.0-hadoop3.2.1-java8

Step 6: Access Hadoop Web Interface

Open your browser:

http://localhost:9870

Step 7: Interact with HDFS (Inside Container)

docker exec -it hadoop-master bash

Example HDFS Commands:

# Check if directory exists hdfs dfs -ls / # Create directory (only if it doesn't exist) hdfs dfs -mkdir /test # Upload file hdfs dfs -put /etc/hosts /test # List files hdfs dfs -ls /test # Download file back to container FS hdfs dfs -get /test/hosts /tmp/

Step 8: Run a WordCount MapReduce Job

cd $HADOOP_HOME hdfs dfs -mkdir /input hdfs dfs -put etc/hadoop/*.xml /input hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jar wordcount /input /output hdfs dfs -cat /output/part-r-00000

Step 9: Stop and Remove Container/Image

docker stop hadoop-master docker rm hadoop-master docker rmi bde2020/hadoop-namenode:2.0.0-hadoop3.2.1-java8 docker network rm hadoop

Optional: Clean HDFS

hdfs dfs -rm -r /test hdfs dfs -rm -r /input hdfs dfs -rm -r /output

Further Learning

Explore Hive (SQL on Hadoop)
Add Spark to the cluster
Build real-time pipelines with Kafka + Hadoop
Use Hadoop with Jupyter + PySpark

Author

Made by a beginner learning Big Data with Docker and Hadoop.
Tested on Ubuntu 22.04 with Docker 24+.

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Hadoop Single Node Setup using Docker on Ubuntu

Prerequisites

Step 1: Install Docker

Step 2: (Optional) Run Docker Without `sudo`

Step 3: Create a Docker Network

Step 4: Pull the Hadoop Docker Image

Step 5: Run the Hadoop NameNode Container

Step 6: Access Hadoop Web Interface

Step 7: Interact with HDFS (Inside Container)

Example HDFS Commands:

Step 8: Run a WordCount MapReduce Job

Step 9: Stop and Remove Container/Image

Optional: Clean HDFS

Further Learning

Author

About

Uh oh!

ronnie-allen/Hadoop-Single-Node-Setup-using-Docker-on-Ubuntu

Folders and files

Latest commit

History

Repository files navigation

Hadoop Single Node Setup using Docker on Ubuntu

Prerequisites

Step 1: Install Docker

Step 2: (Optional) Run Docker Without sudo

Step 3: Create a Docker Network

Step 4: Pull the Hadoop Docker Image

Step 5: Run the Hadoop NameNode Container

Step 6: Access Hadoop Web Interface

Step 7: Interact with HDFS (Inside Container)

Example HDFS Commands:

Step 8: Run a WordCount MapReduce Job

Step 9: Stop and Remove Container/Image

Optional: Clean HDFS

Further Learning

Author

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Step 2: (Optional) Run Docker Without `sudo`