Kategorier: Alle - preparación - modelamiento - evaluación - entendimiento

av Esteban Angel 1 for dagen siden

25

¿Cómo se estructura un proyecto en ciencia de datos? CRISP-DM Elaborado por: Ludwig Angel

Un proyecto de ciencia de datos se estructura en varias etapas clave que garantizan el éxito y la calidad de los resultados. La primera etapa es el entendimiento del negocio, donde se definen los objetivos y requisitos del proyecto, evaluando los recursos disponibles y planificando los pasos a seguir.

  ¿Cómo se estructura un proyecto en ciencia de datos? 
CRISP-DM
Elaborado por: Ludwig Angel

1. Entendimiento del Negocio

Objetivos y requisitos del proyecto

5. Evaluación

Revisar Proceso

Analizar qué funcionó y qué no

Evaluar Resultados

4. Modelamiento

Elegir Modelos

Entrenar Modelos
Evaluar Modelos

Evaluar modelos con métricas como RMSE, precisión, recall

Comparar Modelos

3. Preparación de datos

Esta etapa consume hasta el 80% del tiempo del proyecto. Es importante planificar con anticipación.

Datos Crudos
Conjunto de datos final

2. Comprensión de Datos

Arquitectura de datos de la organización.

Análisis exploratorio de datos (EDA)
Calidad de los Datos
¿Son confiables? ¿Qué tan limpios estan?
Diccionario de fuentes de datos.

Expectativas del Cliente Gestión de Riesgos Evaluación Continua Calidad de Datos

Descripción general de todas las fuentes de datos relevantes para su proyecto.

Selección de Datos Limpieza de Datos Construcción de Features

Tecnologías y herramientas Planes Detallados

Cambios fuentes de datos Requisitos Cambiantes Escalabilidad

Comparar salidas del modelo con criterios de éxito definidos

Determinar Próximos Pasos

Definir Problema Objetivos del Negocio Evaluar Recursos Planificación

Plan del proyecto

¿Cómo se estructura un proyecto en ciencia de datos? CRISP-DM Elaborado por: Ludwig Angel

6. Despligue

Capacitar a los usuarios finales
Documentar el proceso
Monitorear desempeño del modelo en tiempo real
Actualizar modelos según nuevos datos y necesidades
Implementar el modelo en producción
API, dashboard, informes

Retos