Модель машинного обучения для прогнозирования вероятности ухода клиентов телеком-компании.
Цель проекта — выявить клиентов с высоким риском ухода и предложить интерпретируемую модель для принятия решений.
- Повысить удержание клиентов
- Автоматизировать прогноз оттока
- Интерпретировать ключевые факторы ухода
- Python 3.x
- pandas, numpy, matplotlib, seaborn, plotly
- scikit-learn, imbalanced-learn, CatBoost, phik
- PyTorch, torchmetrics
- SQLite
git clone https://github.com/kagor4/prokect_teltecom.git cd prokect_teltecom pip install -r requirements.txtЗатем откройте и запустите ноутбук notebook.ipynb в Jupyter или Google Colab.
Проект использует SQLite базу данных, содержащую 4 таблицы:
contract— договорные условияpersonal— демография клиентаinternet— интернет-услугиphone— услуги телефонии
Целевая переменная: active_contract
(0 — клиент остался, 1 — ушёл)
- Лучшая модель:
CatBoostClassifier - ROC AUC:
0.903 - Основные факторы ухода:
- Продолжительность договора (
duration_contract) - Месячные расходы (
monthly_charges) - Тип оплаты (
type) - Наличие дополнительных услуг
- Продолжительность договора (
📦 telecom-churn/ ├── prokect_teltecom.py # основной анализ и модели ├── requirements.txt # зависимости └── README.md # описание проекта - Добавить интерфейс/дешборд
- Улучшить recall для ушедших клиентов
- Провести бизнес-калькуляцию потерь от оттока
Автор: kagor4