CRISP-MD

CRISP-DM (Cross Industry Standard Process for Data Mining) proporciona una descripción normalizada del ciclo de vida de un proyecto estándar de análisis de datos.

1. Comprensión del negocio

El objetivo de esta fase es alinear los objetivos del proyecto de data mining con los objetivos del negocio.

Establecer los objetivos de negocio.

Evaluar la situación actual.

Fijar los objetivos a nivel de minería de datos.

2. Comprensión de los datos

Dos puntos clave en esta fase: conocer los datos, estructura y distribución, y la calidad de los mismos.

Ejecutar procesos de captura de datos.

Realizar tareas de exploración de datos.

Gestionar la calidad de los datos, identificando problemas y proporcionando soluciones.

3. Preparación de los datos

El objetivo de esta fase es obtener los datos finales sobre los que aplicarán los modelos.

Seleccionar y realizar tareas de limpieza de datos.

Construir nuevas variables (si se requiere).

Integrar y formatear los datos.

Transformar los datos para iniciar el modelo.

4. Modelado

El objetivo de esta fase es construir un modelo que nos permita alcanzar los objetivos del proyecto.

Seleccionar las técnicas de modelado más adecuado.

Construir un modelo a partir de la aplicación de las técnicas.

Fijar una estrategia de verificación de la calidad del modelo.

Ajustar el modelo evaluando su fiabilidad y su impacto en los objetivos anteriormente establecidos.

5. Evaluación del modelo

En esta fase nos centrarnos en evaluar el grado de acercamiento del modelo a los objetivos de negocio.

Evaluar el modelo o modelos generados hasta el momento.

Revisar todo el proceso de minería de datos que nos ha llevado hasta este punto.

Establecer los siguientes pasos a tomar, tanto si se trata de repetir fases anteriores como si se trata de abrir nuevas líneas de investigación.

6. Despliegue

El objetivo de esta fase es realizar el despliegue de los resultados obtenidos de forma que sea propagado a los usuarios finales, así como el mantenimiento del mismo una vez el despliegue haya finalizado.

Diseñar un plan de despliegue de modelos y conocimiento sobre nuestra organización.

Realizar seguimiento y mantenimiento de la parte más operativa del despliegue.

UNIVERSIDAD TECNOLÓGICA ISRAEL

Estudiante: John Loachamin
Asignatura: BASE DE DATOS III
Semestre: 8vo "A"