Retos en ciencia de datos Activida 1
(Daniel Mendez)

r

IV. Conclusiones V. Referencias bibliográficas

Introducción

Comprensión del negocio

OBJETIVO
Define el problema a resolver desde la necesidad del negocio

PUNTOS CLAVE
Identifica el problema
Define el objetivo del negocio
Análisis del impacto esperado
Identificación de recursos disponibles

DESAFÍOS
Falta de alineación con las partes interesadas

Compresión de datos

OBJETIVO
Explorar y evaluar la calidad de los datos

PUNTOS CLAVE
Recolección de datos
Exploración inicial EDA
Evaluación de la calidad

DESAFIOS
Datos insuficientes
Fuentes dispersas o no estructuradas

Preparación de datos

OBJETIVO
Limpiar, transformar y estructurar los datos para su uso

PUNTOS CLAVE
Limpieza
Transformación
Creación de variables

DESAFIOS
Errores en fase que afectan todo el pipeline

Modelado

OBJETIVO
Aplicar algoritmos de machine learning o técnicas estadísticas para resolver el problema

PUNTOS CLAVE
Selección del tipo de modelo
Entrenamiento y evaluación inicial
Ajuste de parámetros

DESAFIOS
Sobre ajuste / Desajuste
Sesgo en los datos que impactan el modelo

Evaluación

OBJETIVO
Determinar si el modelo cumple con los objetivos del negocio

PUNTOS CLAVE
Comparación con métricas definidas en la fase de comprensión del negocio
Interpretación de los resultados
Evaluación de riegos y su ética en el uso del modelo

DESAFÍOS
Métricas técnicas no equivalentes al éxito del negocio
Modelos difíciles de explicar o interpretar

Despliegue

OBJETIVO
Implementar el modelo en producción y monitorearlo

PUNTOS CLAVE
Integración en sistemas empresariales
Implementación de pipelines de datos
Monitorización y mantenimiento

DESAFÍOS
Modelos que fallan en producción
Cambio de patrones de datos en el tiempo

Retos en la ciencia de datos

Recopilación y limpieza de datos

Métodos de recopilación de datos

Técnicas de limpieza de datos

Análisis y procesamiento de datos

Herramientas y técnicas de análisis de datos

Algoritmos de procesamiento de datos

Privacidad y ética en la ciencia de datos

Protección de datos personales

Consideraciones éticas en el uso de datos

Interpretación y comunicación de resultados

Visualización de datos

Comunicación efectiva de los resultados

Actualización constante y aprendizaje continuo

Avances tecnológicos en ciencia de datos

Formación y capacitación en nuevas técnicas y herramientas