Este proyecto muestra cómo entrenar y probar un modelo de lenguaje pequeño (SLM) para clasificar frases según su emoji usando Hugging Face Transformers y PyTorch.
- Python 3.8 o superior
- Acceso a internet para descargar modelos preentrenados
Instala todas las dependencias necesarias ejecutando:
pip install -r requirements.txt - Clona o descarga este repositorio y entra en la carpeta del proyecto.
- (Opcional) Crea y activa un entorno virtual:
- Windows:
python -m venv .venv .venv\Scripts\activate - Linux/Mac:
python3 -m venv .venv source .venv/bin/activate
- Windows:
- Instala las dependencias:
pip install -r requirements.txt
- Ejecuta el script principal:
- Windows:
python ejem.py
- Linux/Mac:
python ejem.py
- Windows:
Copia y guarda esto como run_all_win.ps1 y ejecútalo en PowerShell:
python -m venv .venv .venv\Scripts\activate pip install -r requirements.txt python ejem.pyCopia y guarda esto como run_all_unix.sh y ejecútalo en la terminal:
python3 -m venv .venv source .venv/bin/activate pip install -r requirements.txt python ejem.py- El script
ejem.pyentrena y evalúa el modelo, y permite probar frases interactivamente. - Si tienes problemas con dependencias, asegúrate de tener la última versión de pip:
pip install --upgrade pip. - El entrenamiento es rápido porque el dataset es pequeño y el modelo es ligero.
Autor: Juan Domingo Autor: Juan Carlos Macías