DESARROLLO DE PROYECTOS EN CIENCIA DE DATOS
Sectores Aplicables
Productivo, académico, gubernamental, salud, etc
Impactos Logrados
Impacto en la innovación
Impacto en los costos
Impacto en la cultura organizacional
Impacto en la percepción del cliente sobre la empresa
Impacto en la privacidad y la ética
Impacto en la competitividad
Impacto en la gestión de recursos
Impacto en la relación con el cliente
Impacto en la eficiencia operativa
Impacto en la toma de decisiones de negocio
Resultados Obtenidos
Monitoreo y evaluación continua
Visualizaciones de datos
Modelos prescriptivos
Identificación de anomalías
Análisis de causas raíz
Mejoras en la toma de decisiones
Optimización de procesos
Análisis de tendencias
Detección de patrones y asociaciones
Segmentación de clientes
Modelos predictivos
Dificultades
▪Expectativas no realistas
▪Cambios en las condiciones del negocio o los datos.
▪Elección de la técnica del modelado adecuada.
▪Sobrecarga de datos.
▪Dificultad para integrar datos de diferentes fuentes.
▪Problemas de sobreajuste.
▪Representación sesgada.
▪Datos insuficientes.
▪Datos incompletos.
▪Falta de claridad en la definición del problema.
Ejecución del Proyecto
5. Revisar y mejorar
4. Implementar los resultados
3. Evaluar el modelo
precisión, recall, F1-score
2. Modelar
2.2 Entrenamiento y validación de modelos
2.1 Selección de algoritmos
1. Explorar los datos
Planeación del proyecto
Minería de datos
Preparación de los datos
Recolección de Datos
Tipos de datos
Fuentes de datos
formateo adecuado de los datos para que puedan ser utilizados en modelos analíticos.
Creación de nuevas variables derivadas
selección de variables relevantes
Limpieza y Preprocesamiento de Datos
Normalización y escalado de datos
Eliminación de valores nulos
Abordar Problema
Definición del Problema
Definir objetivos y métricas objetivo o de éxito
Identificar el problema a resolver