Categorieën: Alle - analítica - implementación - riesgo - métricas

door Andres Casallas 1 jaar geleden

75

PROYECTO DE CIENCIAS DE DATOS GENÉRICO

Los proyectos de ciencias de datos genéricos buscan reducir riesgos, optimizar presupuestos y mejorar tiempos de respuesta a través de la analítica estratégica. Se estructuran en varias etapas, desde la identificación del problema hasta la presentación de resultados, pasando por el análisis exploratorio y la implementación.

PROYECTO DE CIENCIAS DE DATOS GENÉRICO

Confidencialidad y protección de datos

Rendimiento y eficiencia

PROYECTO DE CIENCIAS DE DATOS GENÉRICO

Impactos

Optimización del presupuesto
La analítica genera valor en el nivel estratégico de las entidades
Disminución en el nivel de riesgo
Reducción de costos operativos
Aumento en la utilidad
Optimización en los tiempos de respuesta

Dificultades y retos

Capacidad de cómputo limitada
Omisión de juicio de expertos
Datos sin normalizar y errados
Gobierno de datos no definido
Consecución de fuentes de datos volumétricas

Aspectos procedimentales

Actividades
Mantenimiento al modelo (correcciones y optimizaciones)
Dashboard, informes y predicciones
Despliegue en producción
Identificar limitaciones y desafíos
Discretizar variables categóricas
Definición de métricas e indicadores
Evaluar los modelos

Juicio de expertos

Estadísiticamente

Segmentar datos: de desarrollo 70%, de validación 30%
Identificar el Software
Conclusiones y recomendaciones
Desarrollar los modelos

Predictivos

Descriptivos

Iterar con variedad de datos
Simular los modelos
Seleccionar hiperparámetros
Cleaning de datos
Construir la base de datos
Identificar las técnicas y herramientas
Identificar las variables dependientes e independientes
Identificar fuentes de información

Conciliación

Como se integran

Ubicación

Definición del objetivo general y específicos
Contexto de la empresa, visión, misión, políticas, normatividad

Aspectos estructurales

Etapas
Implementación
Presentación de resultados
Análisis exploratorio
Recopilación de datos
Identificación del problema