Introducción a la
Visualización de datos

Introducción a la 
Visualización de datos

¿Cómo pueden ser utilizadas las
visualizaciones?

La visualización de datos se comprende como el
reto de poder contar una historia y poder tomar decisiones a partir del uso indicado de los datos.
Se considera como una herramienta fundamental
en la ciencia de datos.

Actores

Dentro de la construcción de una visualización se pueden identificar dos grandes actores:
* Diseñador de la visualización y el usuario final de la visualización (quien la consume).

Se destacan aspectos importantes como:

Ambos toman decisiones del diseño.

Existen herramientas de visualización especificas (Contexto)

Existen herramientas de visualización generales (Gama de datos)

Analizar

Existen diferentes acciones que definen
los objetivos del usuario

Descubrir, Identificar aspectos nuevos de
la información

Generar nuevas hipotésis

Verificar hipótesis existentes

Presentar, Cuando la visualización esta
siendo usada por alguien para comunicar algo que ya la audiencia lo ha entendido.

Toma de decisiones

Planificación

Previsión

Procesos

Disfrutar, curiosidad por encontrar
algo nuevo, sin que exista una necesidad clara.

Las necesidades entre el diseñador y el usuario no
deben ser las mismas.

Producir

Tiene como objetivo generar material nuevo, además
de consumir resultados que se consuman inmediatamente

Anotaciones,adicion de notas de forma manual como
un nuevo atributo

Registro, guardar y capturar elementos de
la visualización

Derivar o transformar, producir nueva info a
partir de la existente

Búsqueda

Tiene como objetivo hacer búsqueda de elementos de interes

Buscar, es aquí donde ya se sabe lo que se busca
y donde lo puede encontrar

Localizar, ubicar donde se encuentra el objetivo especifico.

Navegar, no se tiene claro la identidad de lo
que se busca. Se ofrecen función de características

Explorar, se refiere a la búsqueda de características
sin tener en cuenta la ubicación.

Consulta

Una vez se tienen los objetivos claros, una tarea de bajo nivel, es el ejercicio de consultar

Identificar, se relaiza desde un objetivo único

Comparar, multiples objetivos

Totalizar, todos los objetivos posibles,
es una visión integral de todo.

Explorar, se refiere a la búsqueda de características
sin tener en cuenta la ubicación.

Uso de diferentes elementos
(Target)

Son importantes en las definiciones de objetivos
de alto nivel.

Tendencias, caracterización de los patrones en lo datos
(aumentos, disminuciones, picos, etc) en los datos.

Puntos atipicos o anomalias

Variables, dependeran de lo que se desee analizar

¿Como se pueden contar historias
a partir de una visualización?

Esta herramienta se conoce como Storytelling, busca
que se pueda dar una información precisa a partir de lo que se visualiza.

Mensaje, Expresa una perspectiva clara para
comunicar mas.

Narrar, de forma personal y temporal, adicional
conectar con la audiencia

Receptores, que la audiencia logre recordar

¿Cómo deben estar los datos
organizados?

Definición

Un data pipeline se puede concebir como el
proceso en el cual se toman unos datos destino
y se almacenan en un lago de datos.

Se caracteriza por el siguiente proceso :

Ingestión

Preparación

Cálculo

Presentación

Recopilación

Aplicaciones de pipelines

Analitica predictiva

Captura de mercado en tiempo real

¿Que mejoras se logran?

Escalabilidad, tiene que ver con el volumén de datos

Fluidez, al hacer uso de archivos de diferentes
tipos de datos (xlsx, parquet,json, csv)

Uniformidad de datos y consolidación

¿Que es la visulización de datos?

Se define como la representación gráfica de información
y de datos. A partir de tablas, gráficos y mapas.

Es importante

Ventajas

Compartir información facilmente

Explorar oportunidades de forma interactiva

Visualizar patrones y relaciones

Contar historias con un proposito

Desventajas

Hacer suposiciones equivocadas

Confundir la correlación y causalidad

Los mensajes centrales pueden perderse

Premisa 1: Los usuarios solo quieren
consumir información existente

Premisa 2: Producir nueva información

Estudiante: Katherin Quiñones

Fuentes
S. Currie Sivek, «Coronavirus Data Visualizations + How Charts Lie,» Alteryx, Abril 2020. [En línea]. Available: https://www.alteryx.com/es-419/input/blog/coronavirus-data-visualizations-and-how-charts-lie%C2%A0. [Último acceso: 15 Abril 2023].
J.-F. Daoust y F. Bastien, «Should We or Should We Not Include Confidence Intervals in COVID-19 Death Forecasting? Evidence from a Survey Experiment,» Political Studies Review, vol. 19, nº 2, pp. 302-310, 2021.
The Marine Stewardship Council, «How my dad fishes for the future,» [En línea]. Available: https://dad-fishes-for-the-future.msc.org/. [Último acceso: 15 Abril 2023].
D.-H. Shymko, «When data fails to tell a story data visualization mistakes,» Instinctools, [En línea]. Available: https://www.instinctools.com/blog/when-data-fails-to-tell-a-story-data-visualization-mistakes/. [Último acceso: 15 Abril 2023].