| Project Name | Description | Technologies | Link | Experience Type | Project Type |
|---|---|---|---|---|---|
| Purchase Prediction for Online Store | Прогнозирование покупок клиентов за 90 дней с LightGBM, обработка больших данных и дисбаланса классов. | Python, Scikit-learn, LightGBM, Pandas, feature-engineering | github.com/kagor4/Purchase-Prediction-for-Online-Store | Freelance | Classical ML |
| Startup Survival Predictor | Прогнозирование выживаемости стартапов с F1 0.997 на основе DecisionTree, оптимизированного через Optuna, для Kaggle. | Python, Scikit-learn, Optuna, Pandas, Phik, feature-engineering | github.com/kagor4/Startup-Survival-Predictor | Freelance | Classical ML |
| Churn Prediction for Beta Bank | Прогнозирование ухода клиентов с F1 0.61 на тестовой выборке, решение проблемы дисбаланса классов. | Python, Scikit-learn, RandomForestClassifier, upsampling | github.com/kagor4/Churn-Prediction-for-Beta-Bank | Academic | Classical ML |
| Age Prediction for Khleb-Sol Supermarket | Модель компьютерного зрения для предсказания возраста покупателей с MAE 7.12 на основе ResNet50. | Python, TensorFlow, Keras, ResNet50, Pandas, ImageDataGenerator | github.com/kagor4/Khleb-Sol_supermarket_project | Academic | Computer Vision |
| Churn Prediction for Telecom Company | Прогнозирование оттока клиентов телеком-компании с ROC AUC 0.903 на основе CatBoost, анализ факторов ухода. | Python, Scikit-learn, CatBoost, Pandas, SQLite, Plotly | github.com/kagor4/project_telecom | Academic | Classical ML |
| Image Search for Photohosting | PoC мультимодального поиска изображений по тексту с использованием ResNet50 и BERT. | Python, TensorFlow, Keras, SentenceTransformers, BERT, ResNet50, NLTK | github.com/kagor4/photohosting_project | Academic | Multimodal Models |
| Star Temperature Predictor | Нейросетевая модель для предсказания температуры звёзд с RMSE 4263 на основе PyTorch, анализ астрофизических данных. | Python, PyTorch, Scikit-learn, Pandas, Seaborn, Phik | github.com/kagor4/Star-Temperature-Predictor | Academic | Classical ML |
| Used Car Price Predictor | Прогнозирование стоимости подержанных автомобилей с RMSE 1611.68 на основе LightGBM, предобработка аномалий. | Python, Scikit-learn, LightGBM, Pandas, Seaborn, feature-engineering | github.com/kagor4/Used-Car-Price-Predictor | Academic | Classical ML |
| Accident Risk Prediction System | Оценка риска ДТП для каршеринга с F1 0.674 на основе нейронной сети, интеграция PostgreSQL и демо в Streamlit. | Python, PyTorch, CatBoost, Scikit-learn, PostgreSQL, Streamlit | github.com/kagor4/Accident-Risk-Prediction-System | Academic | Classical ML |
| Taxi Demand Prediction | Прогнозирование спроса на такси в аэропорту с RMSE 42.57 на основе LinearRegression, анализ сезонности. | Python, Scikit-learn, LinearRegression, CatBoost, LightGBM, Pandas | github.com/kagor4/Taxi-Demand-Prediction | Academic | Time Series |
| GoFast Scooter Analytics | Анализ поведения пользователей сервиса аренды самокатов, оптимизация тарифов и подписки Ultra. | Python, Pandas, NumPy, SciPy, Matplotlib, Jupyter Notebook | github.com/kagor4/GoFast-Scooter-Analytics | Academic | Analytics |
| Russian Film Industry Analytics | Анализ эффективности господдержки российского кинопроизводства, связь финансирования и кассовых сборов. | Python, Pandas, Matplotlib, Jupyter Notebook | github.com/kagor4/Russian-Film-Industry-Analytics | Academic | Analytics |
| Real Estate Price Predictor | Прогнозирование стоимости недвижимости в Санкт-Петербурге, обработка выбросов и генерация признаков. | Python, Pandas, NumPy, Matplotlib, Scikit-learn, Jupyter Notebook | github.com/kagor4/Real-Estate-Price-Predictor | Academic | Classical ML |
| OilWell Prediction | Прогнозирование объёма нефти и прибыли, оценка рисков через bootstrap. | Python, Pandas, Scikit-learn, NumPy, Jupyter Notebook | github.com/kagor4/OilWell-Profit-Predictor | Academic | Classical ML |
| California Housing Prediction | Прогнозирование стоимости жилья в Калифорнии с RMSE 68932.66 на основе LinearRegression и PySpark. | Python, PySpark, Scikit-learn, Pandas | github.com/kagor4/California-Housing-Price-Predictor | Academic | Classical ML |
| Toxic Comments Classification | Классификация токсичных текстов с F1 0.7506 на основе CatBoost и TF-IDF. | Python, Scikit-learn, CatBoost, NLTK, Pandas | github.com/kagor4/toxic_comments_project | Academic | NLP |
| Bank Churn Prediction | Прогнозирование ухода клиентов банка с F1 0.61 на основе RandomForest, методы борьбы с дисбалансом. | Python, Scikit-learn, RandomForestClassifier, Pandas, Matplotlib, tqdm | github.com/kagor4/bank_churn_project | Academic | Classical ML |
- Notifications
You must be signed in to change notification settings - Fork 0
Портфолио Data Science: проекты в ML, нейронных сетях, NLP, Computer Vision, временных рядах и аналитике. Использованы Python, Scikit-learn, PyTorch, TensorFlow, CatBoost, PySpark.
kagor4/DataSciencePortfolio
Folders and files
| Name | Name | Last commit message | Last commit date | |
|---|---|---|---|---|
Repository files navigation
About
Портфолио Data Science: проекты в ML, нейронных сетях, NLP, Computer Vision, временных рядах и аналитике. Использованы Python, Scikit-learn, PyTorch, TensorFlow, CatBoost, PySpark.
Topics
Resources
Stars
Watchers
Forks
Releases
No releases published
Packages 0
No packages published