Gestión de Proyectos de Ciencia de Datos

Uso de metodología?

NO

DESAFIOS

Organizacionales y de equipo

Falta de coordinación

Ambigüedad en roles

Falta de metodologías estándar

Gestión del proyecto

Falta de claridad en el objetivo

Falta de procesos estructurados

Dificultad para estimar tiempos de entrega

Manejo de datos e información

Calidad de los datos

Problema de validación

Seguridad y privacidad de los datos

SI

METODOLOGIA CRIPS-DM

¿Qué es?

Metodología utilizada para organizar y estructurar todo el ciclo de vida de un proyecto de ciencia de datos.

Fases de CRIPS-DM

1) Comprensión del negocio

Problema u oportunidad que se quiera abordar

¿Qué es lo que el cliente quiere lograr?

2) Comprensión de los datos

Recolectar y explorar datos

1) Identificar la calidad de los datos

2) Análisis descriptivo identificando la información disponible para abordar el problema

3) Preparación de los datos

Limpiar Datos

Transformar Variables

Seleccionar características

4) Modelado

Selección de técnica de análisis y construcción del modelo predictivo

Regresión Logística

Arboles de Decisión

Redes Neuronales

5) Evaluación

Comparar resultados con el objetivo del negocio

6) Despliegue

Generar informe

Integrar modelo con software

Usar modelo para tomas decisiones

Beneficios

Popularidad como estándar de minería de datos.

Proceso estructurado, confiable y adaptable a diversas industrias

Fomenta la interacción y la mejora continua

Áreas de aplicación

Salud

Educación

Ingeniería

Manufactura

Negocios