Categories: All - gestión - ciencia - datos - modelado

by Laura M. Acosta Quintero 7 hours ago

12

Estructuración de un proyecto de Ciencias de Datos

El campo de la ciencia de datos combina varias disciplinas como estadística, matemáticas e informática para extraer conocimiento y valor de datos estructurados y no estructurados. Los proyectos en esta área se organizan según el desafío que abordan y pueden involucrar equipos especializados en la gestión de datos e información.

Estructuración de un proyecto de Ciencias de Datos

Elaborado por: Laura Acosta Quintero

Estructuración de un proyecto de Ciencias de Datos

Caso de estudio: Scotiabank Colpatria

Consideraciones en la planeación
Estimación del tiempo de ejecución del modelo
Flujio de trabajo
Sistema de implementación
Metodologías y herramientas a utilizar
Retos principales
Integración con sistemas externos para obtener información
Determinar si las variables aplican a todos los clientes
Calidad de las bases de datos
Selección de variables con poder de discriminación
Tiempo de preparación
8 Meses
Modelo
Clasificación supervisada
Objetivos de negocio
Mejora de ingresos y utilidad
Desarrollo de un modelo de scoring de créditos
Gerente del proyecto
Danny Lenis

Metodologías de gestión de proyectos en Ciencia de Datos

clasificadas según
El desafío que resuelve

en

Integrales (proyectos, equipos, datos/información)

Equipos y gestión de datos e información

Data Science Workflow

Development Workflow for Data Scientists

Proyectos y gestión de datos e información

Toward Data Mining Engineering Data Science Edge

Big Data Management Canvas

Proyectos y equipos

Systematic Research on Big Data

Agile Data Science Life Cycle

EMC Data Analytics Life Cycle

Equipos

Managing Information and Data Science Teams

Proyectos

CRISP-DM

consta de

Seis fases

Despliegue

Llevar el modelo a producción

Toma de decisiones

Generación de informes

Integración con software

Evaluación

Comparar resultados con objetivos del negocio

Seleccionar nuevas técnicas si es necesario

Ajustar modelos

Modelado

Construir modelos predictivos

basados en

Datos disponibles

Seleccionar la técnica de análisis

tales como

Redes neuronales

Árboles de desición

Regresión logística

Preparación de los datos

donde se hace

Selección de variables relevantes

Transformación

Limpieza de

Datos faltantes

Datos incorrectos

Comprensión de los datos

Análisis descriptivo

Recolectar y explorar datos

Comprensión del negocio

Crear el plan de proyecto

Definir objetivos del cliente

es

La más utilizada mundialmente

por su

Acrónimo en inglés

traduce

Proceso Estándar Intersectorial para la Minería de Datos

Subtópico

Fundamental Methodology for Data Science

AI Ops

Analytics Canvas

Ideación Evaluación e Implementación de Big Data

Big Data Management Framework

Gestión de proyectos en Ciencias de Datos

aborda
Tres áreas clave

que son

Gestión de datos e información

Generación de

Conocimiento

Insights

Gestión de equipos

Colaboración

Coordinación

Comunicación

Gestión de proyectos

Administración de alcances de tareas y plazos.

Establecimiento de objetivos, etapas, resultados y entregables.

Monitoreo de etapas del proyecto.

Objetivo de los proyectos de Ciencia de Datos

Experiencia en el dominio recomendada para extraer valor de los datos.
Aplicabilidad en todos los sectores y dominios
Resolver problemas reales complejos
a través de

Técnicas basadas en datos

Ciencias de datos

utiliza
Métodos y técnicas científicas

para

extraer conocimiento y valor

de

Datos no estructurados

Datos estructurados

es un
Campo multidisciplinario

que integra

Estadística

Matemáticas

Informática