METODOLOGÍA
CRISP-DM
Ciclo de vida
Minería de datos
1 - Comprensión del negocio
Alinea los objetivos del proyecto de data mining con los objetivos del negocio.
2 - Compresión de los datos
Conoce los datos, estructura y distribución, y la calidad de los mismos.
3 - Preparación de los datos
Obtiene los datos finales sobre los que aplicarán los modelos.
4 - Modelado
Construye un modelo que nos permita alcanzar los objetivos del proyecto.
5 - Evaluación
En esta fase nos centrarnos en evaluar el grado de acercamiento del modelo a los objetivos de negocio.
6 - Despliegue
Realiza el despliegue de los resultados obtenidos de forma que sea propagado a los usuarios finales así como el mantenimiento del mismo una vez el despliegue haya finalizado.
Ventajas
Mayor competitividad.
Satisfacción del cliente.
Confianza de los clientes y proveedores.
Disminución y cumplimiento de los plazos.
Disminución de costos.
Reducción de tiempo.
Aplicacion y beneficios
Para aplicar en una empresa se debe:
Analizar y considerar como un eje principal.
Subtopic
Analizar todos los tipos de datos por completos.
Agrupar lainformación de los datos y su comportamiento.
Evaluar conjuntamente los datos considerando las tareas especificas.
Considerar la implementación estructural, junto al tiempo que se utilizó.
Obtener datos fiables que ofrece información de calidad.
Mantener una organización adecuada de toda la información.
Una metodología para proyectos de minería de datos no es la “más actual” o “la mejor”, pero es muy útil para comprender esta tecnología o extraer ideas para diseñar o revisar métodos de trabajo para proyectos de similares características.
¿Que es?
-Metodología creada para dar forma a los proyectos de Data Mining.
Es una metodología estándar que ha sido desarrollada para la construcción de proyectos.
El modelo de CRISP-DM es flexible y se pueden personalizar fácilmente.
Desventajas
Puede aparecer algún inconveniente a la hora de utilizar esta METODOLOGÍA.
Dependiendo del tipo de datos que se quieran recopilar, nos puede llevar mucho trabajo.
A veces la inversión inicial para obtener la METODOLOGÍA necesarias para la recopilación de datos puede tener un coste elevado.