Categorie: Tutti - datos - negocio - evaluación - modelo

da John Loachamin mancano 3 anni

130

CRISP-MD

La metodología CRISP-DM es un estándar ampliamente utilizado para guiar proyectos de análisis de datos, dividiéndolos en fases claras y estructuradas. La primera fase se centra en la comprensión del negocio, donde se alinean los objetivos del proyecto con los objetivos de la organización, evaluando la situación actual y estableciendo metas específicas de minería de datos.

CRISP-MD

UNIVERSIDAD TECNOLÓGICA ISRAEL Estudiante: John Loachamin Asignatura: BASE DE DATOS III Semestre: 8vo "A"

CRISP-MD

CRISP-DM (Cross Industry Standard Process for Data Mining) proporciona una descripción normalizada del ciclo de vida de un proyecto estándar de análisis de datos.

6. Despliegue
El objetivo de esta fase es realizar el despliegue de los resultados obtenidos de forma que sea propagado a los usuarios finales, así como el mantenimiento del mismo una vez el despliegue haya finalizado.

Realizar seguimiento y mantenimiento de la parte más operativa del despliegue.

Diseñar un plan de despliegue de modelos y conocimiento sobre nuestra organización.

5. Evaluación del modelo
En esta fase nos centrarnos en evaluar el grado de acercamiento del modelo a los objetivos de negocio.

Establecer los siguientes pasos a tomar, tanto si se trata de repetir fases anteriores como si se trata de abrir nuevas líneas de investigación.

Revisar todo el proceso de minería de datos que nos ha llevado hasta este punto.

Evaluar el modelo o modelos generados hasta el momento.

4. Modelado
El objetivo de esta fase es construir un modelo que nos permita alcanzar los objetivos del proyecto.

Ajustar el modelo evaluando su fiabilidad y su impacto en los objetivos anteriormente establecidos.

Fijar una estrategia de verificación de la calidad del modelo.

Construir un modelo a partir de la aplicación de las técnicas.

Seleccionar las técnicas de modelado más adecuado.

3. Preparación de los datos
El objetivo de esta fase es obtener los datos finales sobre los que aplicarán los modelos.

Transformar los datos para iniciar el modelo.

Integrar y formatear los datos.

Construir nuevas variables (si se requiere).

Seleccionar y realizar tareas de limpieza de datos.

2. Comprensión de los datos
Dos puntos clave en esta fase: conocer los datos, estructura y distribución, y la calidad de los mismos.

Gestionar la calidad de los datos, identificando problemas y proporcionando soluciones.

Realizar tareas de exploración de datos.

Ejecutar procesos de captura de datos.

1. Comprensión del negocio
El objetivo de esta fase es alinear los objetivos del proyecto de data mining con los objetivos del negocio.

Fijar los objetivos a nivel de minería de datos.

Evaluar la situación actual.

Establecer los objetivos de negocio.