类别 全部 - preparación - modelado - optimización - evaluación

作者:José Luis Sánchez Ceballos 8 天以前

14

Estructura de un Proyecto en Ciencia de Datos

En un proyecto de ciencia de datos, se sigue una estructura metodológica para asegurar la eficiencia y precisión en los resultados. La preparación de los datos es una de las primeras etapas, involucrando la transformación de variables, limpieza de datos y selección de características relevantes.

Estructura de un Proyecto en Ciencia de Datos

Ejemplo Riesgo de Crédito

Optimización: Seleccionar perfiles de clientes con menor riesgo de impago

Técnicas utilizadas: Análisis de perfil de crédito de clientes

Objetivo: Calcular probabilidades de incumplimiento en clientes del sector financiero

Clasificación supervisada

Estructura de un Proyecto en Ciencia de Datos

Metología ASUM DM

KDD (Knowledge Discovery in Databases)

metodología SEMMA

Metodología CRISP-DM

Despliegue
Usar el modelo para toma de decisiones
Integrar el modelo en sistemas de software
Generar informes
Llevar el modelo a producción
Evaluación
Verificar utilidad del modelo
Ajustar el modelo o seleccionar otro
Asegurar precisión, sensibilidad, especificidad
Comparar los resultados con los objetivos del negocio
Modelado
Construir modelos predictivos
Ejemplo de técnicas

Redes neuronales

Árboles de decisión

Regresión logística

Seleccionar técnicas de análisis
Preparación de los Datos
Seleccionar las características más importantes
Transformar variables
Limpiar datos incorrectos o faltantes
Comprensión de los Datos
Evaluar la información disponible
Análisis descriptivo
Verificar calidad de los datos
Comprensión del Negocio
Comprender lo que la empresa busca lograr
Alinear los objetivos del proyecto con los objetivos de negocio
Definir el problema o la oportunidad