DESARROLLO DE PROYECTOS EN CIENCIA DE DATOS
Abordar Problema
Definición del Problema
Identificar el problema a resolver
Definir objetivos y métricas objetivo o de éxito
Planeación del proyecto
Minería de datos
Preparación de los datos
Limpieza y Preprocesamiento de Datos
Eliminación de valores nulos
Normalización y escalado de datos
selección de variables relevantes
Creación de nuevas variables derivadas
formateo adecuado de los datos para que puedan ser utilizados en modelos analíticos.
Recolección de Datos
Fuentes de datos
Tipos de datos
Ejecución del Proyecto
1. Explorar los datos
2. Modelar
2.1 Selección de algoritmos
3. Evaluar el modelo
precisión, recall, F1-score
4. Implementar los resultados
5. Revisar y mejorar
Dificultades
▪Datos incompletos.
▪Datos insuficientes.
▪Representación sesgada.
▪Problemas de sobreajuste.
▪Dificultad para integrar datos de diferentes fuentes.
▪Sobrecarga de datos.
▪Elección de la técnica del modelado adecuada.
▪Cambios en las condiciones del negocio o los datos.
▪Expectativas no realistas
Resultados Obtenidos
Modelos predictivos
Segmentación de clientes
Detección de patrones y asociaciones
Análisis de tendencias
Optimización de procesos
Mejoras en la toma de decisiones
Análisis de causas raíz
Identificación de anomalías
Modelos prescriptivos
Visualizaciones de datos
Monitoreo y evaluación continua
Impactos Logrados
Impacto en la cultura organizacional
Impacto en los costos
Impacto en la innovación
Sectores Aplicables
Productivo, académico, gubernamental, salud, etc