Distributed-Machine-Learning Proof Of Concept

This project demonstrates a distributed machine learning system that leverages model and data parallelism across multiple machines. It includes two primary implementations: a CNN-based inference system using model parallelism and a Linear Regression system using data parallelism with Dask.

Overview

The architecture is designed to run over a local area network. A master node coordinates tasks, distributes models or data, and aggregates results from multiple worker nodes. Communication is handled using UDP for worker registration and TCP for data exchange.

Key Features

Distributed CNN model using model parallelism
Linear Regression training using Dask and data parallelism
REST API built with Flask for initiating training and making predictions
Lightweight and runs on low-spec machines over LAN

Technologies Used

Python 3.10
PyTorch
Dask
Flask
Scikit-learn
NumPy, Pandas
TCP/UDP socket communication
Pickle for serialization

Project Structure

master.py – Controls model/data distribution, API server
worker.py – Handles assigned training or inference tasks
flask_server.py – Hosts Flask routes for /train and /predict
utils/ – Utility functions for serialization and configuration
model.pkl – Sample CNN model (PyTorch)
dataset.csv – Input data for regression
requirements.txt – List of dependencies
bankend_81.py - Linear Regression Distributed Model

Usage

Use /train API endpoint to start distributed training.
Use /predict API endpoint to send input data and get predictions.

Contributors

@chahelgupta, @AmishiDesai04, @vpratham

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
README.md		README.md
backend_81.py		backend_81.py
dataset.py		dataset.py
enhanced_anxiety_dataset.csv		enhanced_anxiety_dataset.csv
image.jpg		image.jpg
master.py		master.py
master.txt		master.txt
master_a.txt		master_a.txt
model.py		model.py
model1.html		model1.html
model11.html		model11.html
model2.html		model2.html
modelselect.html		modelselect.html
socket_utils.py		socket_utils.py
train.py		train.py
update_logs.js		update_logs.js
user_dataset.py		user_dataset.py
user_model.py		user_model.py
values.py		values.py
worker.py		worker.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Distributed-Machine-Learning Proof Of Concept

Overview

Key Features

Technologies Used

Project Structure

Usage

Contributors

About

Uh oh!

Releases

Packages

Languages

chahelgupta/Distributed-Machine-Learning

Folders and files

Latest commit

History

Repository files navigation

Distributed-Machine-Learning Proof Of Concept

Overview

Key Features

Technologies Used

Project Structure

Usage

Contributors

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages