La ciencia de datos enfrenta múltiples retos, entre ellos la necesidad de limpiar, transformar y estructurar los datos para su correcto uso. Durante la fase de evaluación, es esencial determinar si el modelo cumple con los objetivos del negocio, aunque las métricas técnicas no siempre reflejan el éxito comercial.
Retos en ciencia de datos Activida 1
(Daniel Mendez)
IV. Conclusiones
V. Referencias bibliográficas
Retos en la ciencia de datos
Actualización constante y aprendizaje continuo
Formación y capacitación en nuevas técnicas y herramientas
Avances tecnológicos en ciencia de datos
Interpretación y comunicación de resultados
Comunicación efectiva de los resultados
Visualización de datos
Privacidad y ética en la ciencia de datos
Consideraciones éticas en el uso de datos
Protección de datos personales
Análisis y procesamiento de datos
Algoritmos de procesamiento de datos
Herramientas y técnicas de análisis de datos
Recopilación y limpieza de datos
Técnicas de limpieza de datos
Métodos de recopilación de datos
Despliegue
DESAFÍOS
Modelos que fallan en producción
Cambio de patrones de datos en el tiempo
PUNTOS CLAVE
Integración en sistemas empresariales
Implementación de pipelines de datos
Monitorización y mantenimiento
OBJETIVO
Implementar el modelo en producción y monitorearlo
Evaluación
DESAFÍOS
Métricas técnicas no equivalentes al éxito del negocio
Modelos difíciles de explicar o interpretar
PUNTOS CLAVE
Comparación con métricas definidas en la fase de comprensión del negocio
Interpretación de los resultados
Evaluación de riegos y su ética en el uso del modelo
OBJETIVO
Determinar si el modelo cumple con los objetivos del negocio
Modelado
DESAFIOS
Sobre ajuste / Desajuste
Sesgo en los datos que impactan el modelo
PUNTOS CLAVE
Selección del tipo de modelo
Entrenamiento y evaluación inicial
Ajuste de parámetros
OBJETIVO
Aplicar algoritmos de machine learning o técnicas estadísticas para resolver el problema
Preparación de datos
DESAFIOS
Errores en fase que afectan todo el pipeline
PUNTOS CLAVE
Limpieza
Transformación
Creación de variables
OBJETIVO
Limpiar, transformar y estructurar los datos para su uso
Compresión de datos
DESAFIOS
Datos insuficientes
Fuentes dispersas o no estructuradas
PUNTOS CLAVE
Recolección de datos
Exploración inicial EDA
Evaluación de la calidad
OBJETIVO
Explorar y evaluar la calidad de los datos
Comprensión del negocio
DESAFÍOS
Falta de alineación con las partes interesadas
PUNTOS CLAVE
Identifica el problema
Define el objetivo del negocio
Análisis del impacto esperado
Identificación de recursos disponibles
OBJETIVO
Define el problema a resolver desde la necesidad del negocio