METODOLOGÍA
CRISP-DM

Ciclo de vida
Minería de datos

1 - Comprensión del negocio

Alinea los objetivos del proyecto de data mining con los objetivos del negocio.

2 - Compresión de los datos

Conoce los datos, estructura y distribución, y la calidad de los mismos.

3 - Preparación de los datos

Obtiene los datos finales sobre los que aplicarán los modelos.

4 - Modelado

Construye un modelo que nos permita alcanzar los objetivos del proyecto.

5 - Evaluación

En esta fase nos centrarnos en evaluar el grado de acercamiento del modelo a los objetivos de negocio.

6 - Despliegue

Realiza el despliegue de los resultados obtenidos de forma que sea propagado a los usuarios finales así como el mantenimiento del mismo una vez el despliegue haya finalizado.

Ventajas

Mayor competitividad.

Satisfacción del cliente.

Confianza de los clientes y proveedores.

Disminución y cumplimiento de los plazos.

Disminución de costos.

Reducción de tiempo.

Aplicacion y beneficios

Para aplicar en una empresa se debe:

Analizar y considerar como un eje principal.

Subtopic

Analizar todos los tipos de datos por completos.

Agrupar lainformación de los datos y su comportamiento.

Evaluar conjuntamente los datos considerando las tareas especificas.

Considerar la implementación estructural, junto al tiempo que se utilizó.

Obtener datos fiables que ofrece información de calidad.

Mantener una organización adecuada de toda la información.

Una metodología para proyectos de minería de datos no es la “más actual” o “la mejor”, pero es muy útil para comprender esta tecnología o extraer ideas para diseñar o revisar métodos de trabajo para proyectos de similares características.

¿Que es?

-Metodología creada para dar forma a los proyectos de Data Mining.

Es una metodología estándar que ha sido desarrollada para la construcción de proyectos.

El modelo de CRISP-DM es flexible y se pueden personalizar fácilmente.

Desventajas

Puede aparecer algún inconveniente a la hora de utilizar esta METODOLOGÍA.

Dependiendo del tipo de datos que se quieran recopilar, nos puede llevar mucho trabajo.

A veces la inversión inicial para obtener la METODOLOGÍA necesarias para la recopilación de datos puede tener un coste elevado.