PROYECTO DE CIENCIAS DE DATOS GENÉRICO
Aspectos estructurales
Etapas
Identificación del problema
Recopilación de datos
Análisis exploratorio
Presentación de resultados
Implementación
Aspectos procedimentales
Actividades
Contexto de la empresa, visión, misión, políticas, normatividad
Definición del objetivo general y específicos
Identificar fuentes de información
Ubicación
Como se integran
Conciliación
Identificar las variables dependientes e independientes
Identificar las técnicas y herramientas
Construir la base de datos
Cleaning de datos
Seleccionar hiperparámetros
Simular los modelos
Iterar con variedad de datos
Desarrollar los modelos
Descriptivos
Predictivos
Conclusiones y recomendaciones
Identificar el Software
Segmentar datos: de desarrollo 70%, de validación 30%
Evaluar los modelos
Estadísiticamente
Juicio de expertos
Definición de métricas e indicadores
Discretizar variables categóricas
Identificar limitaciones y desafíos
Despliegue en producción
Dashboard, informes y predicciones
Mantenimiento al modelo (correcciones y optimizaciones)
Dificultades y retos
Consecución de fuentes de datos volumétricas
Gobierno de datos no definido
Datos sin normalizar y errados
Omisión de juicio de expertos
Capacidad de cómputo limitada
Impactos
Optimización en los tiempos de respuesta
Aumento en la utilidad
Reducción de costos operativos
Disminución en el nivel de riesgo
La analítica genera valor en el nivel estratégico de las entidades
Optimización del presupuesto