Aspectos Comunes

Proyectos en Ciencia de Datos Daniel Badillo Mojica

Aspectos Procedimentales

Actividades que se llevan a cabo en un proyecto de ciencia de datos.

Planeación

Entendimiento del proyecto

Definición de los objetivos

Revisión de antecedentes

Revisión de requerimientos de datos

Preparación de datos

Recolección de datos

Limpieza de datos

Estandarización

Construcción de variables

Análisis exploratorio

Identificación de relaciones

Generación de estadísticas descriptivas

Visualización exploratoria

Modelado

Selección de técnicas

Construcción del modelo

Diseño de criterios de evaluación

Aplicación de los modelos

Evaluación y validación

Simulación del modelo con diferentes muestras

Evaluación resultados (estadísitcos o evaluación de expertos o pares)

Interpretación de resultados

Implementación

Planificicación de la implementación

Despliegue del modelo

Monitoreo

Evaluar el impacto de las decisiones basadas en datos.

Preparar, limpiar y transformar los datos en estructuras adecuadas para su análisis.

Aplicar modelos para obtener resultados que guíen la toma de decisiones necesarias para responder al objetivo.

Etapas fundamentales de un proyecto de ciencia de datos.

Identificación del Problema

Transformación de datos en información

Desarollo y Modelado

Medición del Resultado

Definir los objetivos del proyecto. Formular las preguntas claves y los requerimientos para responderlas.

Aspectos Estructurales

Retos

Desafíos comunes en la etapas de un proyecto de ciencia de datos.

Calidad y disponibilidad de datos

Dificultades para acceder a datos limpios y estructurados.

Escalabilidad

Ajuste de modelos para manejar grandes volúmenes de datos o nuevas fuentes de información.

Interpretación y comunicación de resultados

Traducir resultados complejos a términos comprensibles para la toma de decisiones.

Complejidad de modelos y técnicas

Selección adecuada del modelo.

Impactos

Tipos de impactos que los proyectos de ciencia de datos pueden generar.

Técnicos

Optimización de procesos, automatización y mejor gestión de datos.

Económicos

Mejora en la eficiencia operativa, reducción de costos y aumento de ingresos por decisiones más acertadas.

Sociales

Generación de nuevas oportunidades de empleo y mejora en la prestación de servicios.

Ambientales

Aplicaciones que optimizan recursos y reducen el impacto ambiental.

Éticos

Manejo responsable de datos sensibles y toma de decisiones transparentes.

Académicos

Formación de estudiantes de distintos niveles académicos. Generación de publicaciones científicas.^