Gestión de Proyectos de Ciencia de Datos
Uso de metodología?
NO
DESAFIOS
Organizacionales y de equipo
Falta de coordinación
Ambigüedad en roles
Falta de metodologías estándar
Gestión del proyecto
Falta de claridad en el objetivo
Falta de procesos estructurados
Dificultad para estimar tiempos de entrega
Manejo de datos e información
Calidad de los datos
Problema de validación
Seguridad y privacidad de los datos
SI
METODOLOGIA CRIPS-DM
¿Qué es?
Metodología utilizada para organizar y estructurar todo el ciclo de vida de un proyecto de ciencia de datos.
Fases de CRIPS-DM
1) Comprensión del negocio
¿Qué es lo que el cliente quiere lograr?
2) Comprensión de los datos
Recolectar y explorar datos
1) Identificar la calidad de los datos
2) Análisis descriptivo identificando la información disponible para abordar el problema
3) Preparación de los datos
Limpiar Datos
Transformar Variables
Seleccionar características
4) Modelado
Selección de técnica de análisis y construcción del modelo predictivo
Regresión Logística
Arboles de Decisión
Redes Neuronales
5) Evaluación
Comparar resultados con el objetivo del negocio
6) Despliegue
Generar informe
Integrar modelo con software
Usar modelo para tomas decisiones
Beneficios
Popularidad como estándar de minería de datos.
Proceso estructurado, confiable y adaptable a diversas industrias
Fomenta la interacción y la mejora continua
Áreas de aplicación
Salud
Educación
Ingeniería
Manufactura
Negocios