basado en
diseñado por
genera
presenta
contiene
contiene

PROYECTO DE CIENCIAS DE DATOS GENÉRICO

Aspectos estructurales

Etapas

Identificación del problema

Recopilación de datos

Análisis exploratorio

Presentación de resultados

Implementación

Aspectos procedimentales

Actividades

Contexto de la empresa, visión, misión, políticas, normatividad

Definición del objetivo general y específicos

Identificar fuentes de información

Ubicación

Como se integran

Conciliación

Identificar las variables dependientes e independientes

Identificar las técnicas y herramientas

Construir la base de datos

Cleaning de datos

Seleccionar hiperparámetros

Simular los modelos

Iterar con variedad de datos

Desarrollar los modelos

Descriptivos

Predictivos

Conclusiones y recomendaciones

Identificar el Software

Segmentar datos: de desarrollo 70%, de validación 30%

Evaluar los modelos

Estadísiticamente

Juicio de expertos

Definición de métricas e indicadores

Discretizar variables categóricas

Identificar limitaciones y desafíos

Despliegue en producción

Dashboard, informes y predicciones

Mantenimiento al modelo (correcciones y optimizaciones)

Dificultades y retos

Consecución de fuentes de datos volumétricas

Gobierno de datos no definido

Datos sin normalizar y errados

Omisión de juicio de expertos

Capacidad de cómputo limitada

Impactos

Optimización en los tiempos de respuesta

Aumento en la utilidad

Reducción de costos operativos

Disminución en el nivel de riesgo

La analítica genera valor en el nivel estratégico de las entidades

Optimización del presupuesto

Rendimiento y eficiencia

Confidencialidad y protección de datos