Estructura y Procesos en
Proyectos de Ciencia de Datos
Camilo Arciniegas Forero
Gestión de Proyectos
en Ciencia de Datos
(pasos claves)
1. Entendimiento de la Necesidad
Identificar el problema
Entendimiento de la necesidad
2. Diagnóstico
Evaluar los activos de datos existentes
Entendimiento de madurez analítica
3. Propuesta de Valor
Identificar casos de uso de ciencia de datos
Conformación de equipo de ciencia de datos
4. Entrega de Valor Continua
Elegir marcos de gestión del proyecto
Implementar tecnología
Desarrollar modelos analíticos
Plantear acciones basadas en datos
Monitoreo y evaluación contínua
Validación de gestión del cambio
Metodología CRISP-DM
(Fases)
Comprensión del Negocio
Definir objetivos del negocio
Evaluar la situación actual
Determinar metas de proyecto
Comprensión de los Datos
Recopilar datos iniciales
Explorar y describir los datos
Verificar calidad de los datos
Preparación de los Datos
Limpiar y transformar datos
Construir datasets finales
Modelado
Seleccionar técnicas de modelado
Configurar parámetros
Crear y evaluar modelos
Evaluación
Validar resultados obtenidos
Revisar los objetivos del negocio
Decidir sobre los siguientes pasos
Despliegue
Implementar soluciones
Planificar monitoreo y mantenimiento
Documentar resultados