Periodismo de datos y visualización de la información

Qué es el periodismo de datos

Datos

r

Los datos son:Fuente de información.Herramienta para contar una historia.Valores de una variable.Todo lo que entra en una base de datos.

Tipos

Estructurados

r

Pueden ser ordenador y procesados fácilmente, como los documentos de Excel o una página HTML.

No estructurados

r

Documentos que carecen de una estructura interna, como los documentos Word o los PDFs.

Periodismo de datos

r

El periodismo de datos es:El resultado de la cooperación entre periodistas de investigación y programadores que quieren utilizar los datos para contribuir a crear una sociedad global más justa.Consiste en transformar datos en evidencias que, con frecuencia, ayudan a saber si nuestros gobernantes están haciendo bien su labor.No es solo una herramienta, sino una oportunidad para explicar historias complejas y dar respuestas con datos.Más científico (que no equivale a un periodismo sobre ciencia).

Qué nos ofrece

r

Noticias y reportajes basados en datosBases de datosVisualizaciones a través de:TextosTablasGráficosImágenesVídeosInteractivosWebs y aplicaciones interactivas

a

Cómo se hace el periodismo de datos

r

La mejor manera de hacer periodismo de datos es de manera colaborativa -> través de la colaboración de equipos multidisciplinares formados por periodistas y programadores.Mediante la asociación de diversos mediosColaborando con hackersColaborando con académicos: por sus proyectos de investigaciónColaborando con ONGs: por su labor de monitorizaciónColaborando con la ciudadanía

a

Cuándo empezó todo

r

El "nuevo periodismo" de Tome Wolfe era más literario.Se apoyaba en las experiencias y en las anécdotas.Priorizaba las emociones y las imágenes de sensaciones.El otro "nuevo periodismo" de Philip Meyes era más científico pero sin renunciar a la precisión del lenguaje; esa precisión estaba basada en los datos.Más adelante, en 2009, se creó el Datablog de The Guardian, un equipo emplazado en el área de diseño y gráficos que publicaba las bases de datos.Después, en 2010, este equipo pasó a la redacción con la llegada de WikiLeaks y la Guerra de Irak.Actualmente, el mejor momento para hacer periodismo de datos es cuando se encuentra una historia que se cuenta mejor con números, es decir, datos.

Principales problemas del periodismo de datos

r

Es difícil iniciar una investigación. Con frecuencia partimos de una pregunta periodística pero los datos no siempre pueden responderlaRequiere destrezas técnicas para buscar, comprender y visualizar fuentes digitales. Analizar y comprender un conjunto de datos es un proceso que necesita tiempo (incluso teniendo destreza tecnológica y estadística)No existe una rutina o procedimiento de trabajo en el periodismo de datosLos datos que suministran gobiernos y organizaciones están, en ocasiones, incompletos o desactualizadosSi los datos están desestructurados o en un formato inapropiado trabajar con ellos puede ser muy complejo y lento

Ventajas

r

Genera confianza en los lectores: no pretende ser el primero en informar sino facilitar información verídica y contrastadaOfrece a los lectores una forma sencilla de conocer hechos complejosCapta más atención por parte de los lectores: más tiempo de permanencia en las páginas del diarioCon frecuencia, ofrece la oportunidad de informarse de forma personalizadaSe viraliza con mucha  facilidad: tanto es así que a veces se utiliza como una estrategia de marketing online

Recomendaciones

r

Las herramientas de análisis estadístico y visualización de información son tus amigas. Convierten información muy compleja en conocimiento comprensibleComparte con tus compañeros tus ideas y muéstrales tu trabajo. Disponer de opiniones diversas, procedentes de diferentes perfiles de personas, te ayudará a enriquecer y mejorar tu trabajo (Brian Boyer, Chicago Tribune)Cuando solicites información, no aceptes un no por respuesta fácilmenteSi no sabes como empezar a hacer periodismo de datos, escoge un tema que le importe a la gente (tanto en el momento de escogerlo como cuando termines tu trabajo)Ten en cuenta que todo el proceso que has seguido (consecución de datos, análisis, etc.) puede ser una buena historia

Por qué deben utilizar los datos los periodistas

r

Porque es una potente herramienta para estar más cerca de la verdad, de lo que pasa en el mundo.Porque nos permite encontrar información que, de otro modo, sería imposible de hallar o probar (Cynthia O´Murchu, Financial Times)Porque algunas historias solo pueden ser entendidas y explicadas con los datos y su visualización.Porque cuando la información era escasa, la labor más importante para los periodistas era conseguirla. Ahora que la información es abundante, lo más importante es procesarla.Porque reunir, filtrar y visualizar información que no puede verse a simple vista es muy valioso para el periodismo y la sociedad.El periodismo de datos es la gran oportunidad de dar sentido y reivindicar el periodismoEmpodera al periodistaLo hace menos dependiente de las fuentesEs replicableLo hace más "científico"

Qué nos cuenta

Una historia general

Una historia del lector o muy cercana a él

Qué procedimientos de trabajo se siguen

Identificación de la fuente/s

r

Organismo gubernamentales (p.ej. Ministerios, Consejerías, etc.)Portales de datos oficiales (p.ej. INE, Idescat, etc.)Organismos internacionales (p.ej. UN, OMS, etc.)Portales de datos (p.ej. Data Hub, Crunchbase, Qlik)Organizaciones privadasCon ánimo de lucro (empresas)Sin ánimo de lucro (p. ej. ONGs, asociaciones, fundaciones, etc.)Ciudadanos (con información fiable y validable) (¿Qué quieren contarte los ciudadanos?)Sitios web (p.ej. de la administración pública, universidades, empresas, etc.)BuscadoresMedios sociales (p.ej. Twitter, Instagram, etc.)

Estudio del tipo de datos

r

EstructuradosNo estructurados

Petición y/o descarga de los datos (scraping)

r

Mediante peticiones: por ejemplo, en organismos públicos utilizando nuestro derecho de acceso a la información públicaPodemos exigir datos que deban estar en acceso públicoNo podemos exigir datos que requieran tratamiento por parte de la AdministraciónAntes de solicitar un conjunto de datos es buena idea solicitar su "diccionario de datos"También conviene solicitar información sobre los nuevos códigos o campos que se hayan añadido a los datosCon herramientas automáticas: por ejemplo, “scrapers” para la descarga de páginas HTML, etc.

Normalización/Limpieza de los datos

r

Identificación y adopción inequívoca de nombres propios (por ejemplo, el nombre de un político o una celebridad)Eliminación de mayúsculas y tildesNormalización de la información contenida en los campos de los documentos estructurados (p.ej. un Excel con un campo de profesión con datos tales como: maestro, profesor, educador, formador, etc.)

Creación de una base de datos

r

Normalmente mediante la fusión de dos o más conjuntos de datos. Por ejemplo, utilizando Access para unir varios documentos Excel con distintos camposDebería permitir la consulta de los datos y su descarga en uno o más formatos

Análisis de los datos

r

Normalmente utilizando software estadístico (p.ej. Excel, SPSS, y R)Las medidas estadísticas utilizadas en periodismo de datos suelen ser muy básicas: media, moda, mediana, correlaciones, etc.No debes obsesionarte con la precisiónEl análisis debe afrontarse con una mente abierta y de manera totalmente objetiva (p.ej. crisis económica y consumo de alcohol)Identifica bien las variables que afectan a tu objeto de estudio (p.ej. política de mano dura de Giuliani vs. Ley del aborto)Reflexiona antes de publicar tus conclusiones (p.ej. 1 de cada 15 europeos es analfabeto)Los números grandes y pequeños ¿son relativos? (p.ej. uso de medios sociales en comunicación política)

Visualización de los datos

r

Los datos por sí mismo son invisibles. Normalmente, es la visualización la que dota de sentido a los datos 🡪 Aprende de/con tus visualizacionesLa visualización de datos debe ser informativa y bonitaSi se ha de decidir entre contar mejor una historia o hacerla más atractiva estéticamente, siempre se  primara a la historiaSe escogerá un tipo u otro de visualización en función del tipo de dato y estudio que estemos realizandoNormalmente la visualización permite:Medir algoComparar algoMostrar una evolución a lo largo del tiempoMostrar una jerarquíaCategorizar algoAsociar o relacionar algo

Elaboración y publicación de la noticia, reportaje...

r

Asegúrate de que tu análisis es correcto antes de publicarlo (repite tus cálculos al menos un par de veces)Ten cuidado con las relaciones de causa-efecto que puedas establecer. Cuando sea posible opta por enumeracionesSi tu trabajo menciona personas u organizaciones ofréceles el derecho a réplicaPublica en acceso abierto tus datos. Así tu trabajo será contrastable. Además, otros podrán hacer hallazgos que no viste o profundizar más en tu análisisDetermina qué indicadores utilizarás para evaluar la calidad de tu trabajo