1. Entendimiento del Negocio
Objetivos y
requisitos del proyecto
5. Evaluación
Revisar Proceso
Analizar qué funcionó y qué no
Evaluar Resultados
4. Modelamiento
Elegir Modelos
Entrenar Modelos
Evaluar Modelos
Evaluar modelos con métricas como RMSE, precisión, recall
Comparar Modelos
3. Preparación de datos
Esta etapa consume hasta el 80% del tiempo del proyecto. Es importante planificar con anticipación.
Datos Crudos
Conjunto de datos final
2. Comprensión de Datos
Arquitectura de datos de la organización.
Análisis exploratorio de datos (EDA)
Calidad de los Datos
¿Son confiables? ¿Qué tan limpios estan?
Diccionario de fuentes de datos.
Expectativas del Cliente
Gestión de Riesgos
Evaluación Continua
Calidad de Datos
Descripción general de todas las fuentes de datos relevantes para su proyecto.
Selección de Datos
Limpieza de Datos
Construcción de Features
Tecnologías y herramientas
Planes Detallados
Cambios fuentes de datos
Requisitos Cambiantes
Escalabilidad
Comparar salidas del modelo con criterios de éxito definidos
Determinar Próximos Pasos
Definir Problema
Objetivos del Negocio
Evaluar Recursos
Planificación
Plan del proyecto
¿Cómo se estructura un proyecto en ciencia de datos?
CRISP-DM
Elaborado por: Ludwig Angel
6. Despligue
Capacitar a los usuarios finales
Documentar el proceso
Monitorear desempeño del modelo en tiempo real
Actualizar modelos según nuevos datos y necesidades
Implementar el modelo en producción
API, dashboard, informes
Retos