Introducción al Periodismo de Datos

¿Qué es?

r

El Periodismo de datos cuenta historias generales, pero también intenta explicar otras vinculadas a los lectores, o próximas a estos. Lo que pretende es acercar una realidad compleja al público, para que la comprenda. Para ello, usa diferentes formatos:Texto, es decir, un artículoTablasGráficosImágenesVídeosInteractivos**Ejemplo de un juego interactivo del Consorcio Internacional de Periodistas de Investigación para explicar cómo funciona la evasión fiscal:https://www.icij.org/investigations/panama-papers/stairway-tax-heaven/

Periodismo (de investigación) hecho con datos, que se usan como:

r

Los datos no son hechos, sino valores de una variable. No describen la realidad, sino que la resumen. Por sí solos no dan información, hay que relacionarlos y vincularlos con otros para encontrarles el sentido. Pueden ser:Verdaderos o falsosNuméricos o no numéricosObjetivos o subjetivosPrimarios o secundariosNO confundirlos con el "Big Data" (volumen, velocidad, variedad, veracidad, valor)

Fuente de Información

Herramienta para contar una historia

Ambos

Resultado de la cooperación entre periodistas de investigación y programadores

Contribuir a una sociedad global más justa

Transformar los datos en evidencias

Control de los poderosos (Cuarto Poder)

Oportunidad para explicar historias complejas

¿Cómo ejercerlo?

Con equipos multidisciplinares

r

Nos referimos a los grandes medios de comunicación, que son los que pueden permitirse estos profesionales. Los pequeños pueden recurrir a ONGs y académicos.

De forma colaborativa

r

Cuando hay una gran cantidad de datos disponibles o estos son muy complejos, y también para reducir los costes.

Asociación de medios diferentes

r

Un ejemplo claro es el del Consorcio Internacional de Periodistas de Investigación, que reúne a periodistas y medios de muchos países distintos que trabajan de forma colaborativa. Este grupo es el que procesó la cantidad ingente de datos filtrada sobre los clientes de un bufete de abogados en un paraíso fiscal, investigación conocida como Papeles de Panamá.

Con académicos

Con Hackers

Con ONGs

Con la ciudadanía

También de forma individual

Principales problemas

Difícil iniciar una investigación y puede que no lleguemos a encontrar una respuesta

Requiere destrezas técnicas (buscar, comprender y visualizar fuentes digitales)

Se necesita tiempo

Sobre todo con datos desestructurados

No existe una rutina fija

Los datos pueden estar incompletos y/o desactualizados

Ventajas

Genera confianza en los lectores

Información verídica y contrastada

Forma sencilla de conocer hechos complejos

Capta la atención del lector

Puede permitir informarse de forma personalizada

Se viraliza con facilidad

Fácilmente traducible a otros idiomas

Empodera el periodista

Menos dependiente de las fuentes

¿Por qué deben utilizar datos los periodistas?

Potente herramienta para estar más cerca de la verdad

Permite encontrar información que de otro modo sería imposible encontrar

Algunas historias solo pueden ser entendidas y explicadas con datos

Cuando hay tanta información disponible, los periodistas deben procesarla

Reúne, filtra y hace visible información valiosa para la sociedad que no puede verse a simple vista

¿Qué procedimientos de trabajo sigue?

r

Se debería documentar detalladamente el proceso de trabajo.

Identificación de la fuente que puede suministrar los datos

Organismos gubernamentales (Ministerios, Consejerías...)

Portales de datos oficiales (INE, Idescat...)

Organismos internacionales (ONU, OMS...)

Portales de datos (Data Hub, Crunchbase, Qlik)

Organizaciones privadas

Organizaciones con ánimo de lucro (empresas)

Sin ánimo de lucro (ONGs, asociaciones, fundaciones...)

Ciudadanos con información fiable y validable

Sitios web (De la administración pública, universidades, empresas...)

Buscadores

Medios sociales (Twitter, Instagram, Facebook...)

Estudio del tipo de datos que puede suministrar, su formato

Estructurados

r

Se pueden procesar y ordenar fácilmente. Se encuentran en un Excel o en el HTML de una página, por ejemplo.

No estructurados

r

Están en documentos que carecen de una estructura interna, como un documento WORD o PDF.

Petición y/o descarga de los datos

r

¿Cómo los podemos obtener?Mediante peticiones a organismos públicos, con nuestro derecho de acceso a la información pública.Posibilidad de exigir datos que deben estar en acceso público, pero no aquellos que requieran tratamiento por parte de la AdministraciónSolicitar un "diccionario de datos" con anterioridad puede ser útil Solicitar información sobre los nuevos códigos o campos que se hayan añadido a los datosCon herramientas automáticas, como "scrappers" para la descarga automática de páginas HTML.Pero antes: Elaborar una lista de preguntas o hipótesis a las que nos gustaría responder con los datos. Preguntar si la petición supone un coste. Conocer bien nuestros derechos. Guardar una copia de los datos originales. No infringir la ley al tratar la información.

Instituto Nacional de Estadística

Eurostat

Documentcloud

Civio

Normalización (limpieza) de los datos

r

Con los datos en la mano, debemos organizarlos y procesarlos, según el tipo de datos con los que trabajemos.Identificación y adopción inequívoca de nombres propios (por ejemplo, el nombre de un político o una celebridad)Eliminación de mayúsculas y tildesNormalización de la información contenida en los campos de los documentos estructurados (Ejemplo -> un Excel con un campo de profesión con datos tales como: maestro, profesor, educador, formador...) --> Unificarlos en una sola categoría.

Creación de una base de datos

r

Se suele hacer mediante la fusión de dos o más conjuntos de datos, utilizando herramientas como Access o Excel, para permitir su descarga y consulta en diferentes formatos.

Análisis de los datos

r

¿Cómo?Utilizando software estadístico: Excel, SPSS, RCon medidas estadísticas básicas: media, moda, mediana, correlaciones...No obsesionarse con la precisión El análisis debe afrontarse con una mente abierta y de manera totalmente objetiva (cuidado con las ideas preconcebidas que pueden alterar el análisis)Identificar bien las variables que afectan al objeto de estudio (efectos y consecuencias)Reflexionar antes de publicar las conclusionesLos números grandes y pequeños ¿son relativos? Sí, dependen del contexto

Visualización de los datos

r

Los datos por sí mismos son invisibles, por eso es necesaria la visualización, que los dota de sentido. La visualización debe ser informativa y bonita a la vez, aunque es más importante contarla bien que hacerla más atractiva estéticamente.La visualización debe diseñarse pensando en dos tipos de lectores:Uno que quiere una información fácil e inmediataOtro que quiere profundizar en el conocimiento de los datosY permite saber si nos conviene centrarnos en un aspecto concreto de los datos, si conviene centrarnos en un aspecto general, si tenemos que filtrar mejor los datos, o si hemos de eliminar los valores extremosTipos de visualizaciones, según el tipo de datos y estudio:Tablas: cuando trabajamos con un reducido número de datosGráficos: cuando trabajemos con dos o tres dimensionesGráficos de líneas: para mostrar continuidad temporalGrafos: para mostrar relaciones o interconexiones

Medir

Comparar

Mostrar una evolución a lo largo del tiempo

Mostrar una jerarquía

Categorizar

Asociar o relacionar

Elaboración y publicación de la pieza periodística (notícia, reportaje, interactivo, etc.)

r

Asegúrate de que tu análisis es correcto antes de publicarlo (repite tus cálculos al menos un par de veces)Ten cuidado con las relaciones de causa-efecto que puedas establecer. Cuando sea posible opta por enumeracionesSi tu trabajo menciona personas u organizaciones ofréceles el derecho a réplicaPublica en acceso abierto tus datos. Así tu trabajo será contrastable. Además, otros podrán hacer hallazgos que no viste o profundizar más en tu análisisDetermina qué indicadores utilizarás para evaluar la calidad de tu trabajoConsidera si es mejor usar Copyright o licencia Creative Commons

Recomendaciones

Perder el miedo a las herramientas de visualización y análisis

Compartir ideas con compañeros/as y mostrarles el trabajo

r

Disponer de opiniones diversas, procedentes de diferentes perfiles de personas, te ayudará a enriquecer y mejorar tu trabajo (Brian Boyer, Chicago Tribune)

No aceptar fácilmente un no por respuesta: conocer los derechos de acceso a los datos

Escoger temas que importen a la ciudadanía

El proceso (consecución de datos, análisis...) puede ser una buena historia

Orígenes: Philip Meyer

Periodismo de precisión

Basado en datos

Más "científico" (método)

“Tratar al periodismo como si fuera una ciencia, adoptando el método científico, la objetividad científica y los ideales científicos en el proceso completo de la comunicación de masas”. Philip Meyer, Periodismo de precisión, 1991.