Introducción a la
Visualización de datos
¿Cómo pueden ser utilizadas las
visualizaciones?
La visualización de datos se comprende como el
reto de poder contar una historia y poder tomar decisiones a partir del uso indicado de los datos.
Se considera como una herramienta fundamental
en la ciencia de datos.
Actores
Dentro de la construcción de una visualización se pueden identificar dos grandes actores:
* Diseñador de la visualización y el usuario final de la visualización (quien la consume).
Se destacan aspectos importantes como:
Ambos toman decisiones del diseño.
Existen herramientas de visualización especificas (Contexto)
Existen herramientas de visualización generales (Gama de datos)
Analizar
Existen diferentes acciones que definen
los objetivos del usuario
Descubrir, Identificar aspectos nuevos de
la información
Generar nuevas hipotésis
Verificar hipótesis existentes
Presentar, Cuando la visualización esta
siendo usada por alguien para comunicar algo que ya la audiencia lo ha entendido.
Toma de decisiones
Planificación
Previsión
Procesos
Disfrutar, curiosidad por encontrar
algo nuevo, sin que exista una necesidad clara.
Las necesidades entre el diseñador y el usuario no
deben ser las mismas.
Producir
Tiene como objetivo generar material nuevo, además
de consumir resultados que se consuman inmediatamente
Anotaciones,adicion de notas de forma manual como
un nuevo atributo
Registro, guardar y capturar elementos de
la visualización
Derivar o transformar, producir nueva info a
partir de la existente
Búsqueda
Tiene como objetivo hacer búsqueda de elementos de interes
Buscar, es aquí donde ya se sabe lo que se busca
y donde lo puede encontrar
Localizar, ubicar donde se encuentra el objetivo especifico.
Navegar, no se tiene claro la identidad de lo
que se busca. Se ofrecen función de características
Explorar, se refiere a la búsqueda de características
sin tener en cuenta la ubicación.
Consulta
Una vez se tienen los objetivos claros, una tarea de bajo nivel, es el ejercicio de consultar
Identificar, se relaiza desde un objetivo único
Comparar, multiples objetivos
Totalizar, todos los objetivos posibles,
es una visión integral de todo.
Explorar, se refiere a la búsqueda de características
sin tener en cuenta la ubicación.
Uso de diferentes elementos
(Target)
Son importantes en las definiciones de objetivos
de alto nivel.
Tendencias, caracterización de los patrones en lo datos
(aumentos, disminuciones, picos, etc) en los datos.
Puntos atipicos o anomalias
Variables, dependeran de lo que se desee analizar
¿Como se pueden contar historias
a partir de una visualización?
Esta herramienta se conoce como Storytelling, busca
que se pueda dar una información precisa a partir de lo que se visualiza.
Mensaje, Expresa una perspectiva clara para
comunicar mas.
Narrar, de forma personal y temporal, adicional
conectar con la audiencia
Receptores, que la audiencia logre recordar
¿Cómo deben estar los datos
organizados?
Definición
Un data pipeline se puede concebir como el
proceso en el cual se toman unos datos destino
y se almacenan en un lago de datos.
Se caracteriza por el siguiente proceso :
Ingestión
Preparación
Cálculo
Presentación
Recopilación
Aplicaciones de pipelines
Analitica predictiva
Captura de mercado en tiempo real
¿Que mejoras se logran?
Escalabilidad, tiene que ver con el volumén de datos
Fluidez, al hacer uso de archivos de diferentes
tipos de datos (xlsx, parquet,json, csv)
Uniformidad de datos y consolidación
¿Que es la visulización de datos?
Se define como la representación gráfica de información
y de datos. A partir de tablas, gráficos y mapas.
Es importante
Ventajas
Compartir información facilmente
Explorar oportunidades de forma interactiva
Visualizar patrones y relaciones
Contar historias con un proposito
Desventajas
Hacer suposiciones equivocadas
Confundir la correlación y causalidad
Los mensajes centrales pueden perderse