Periodismo de datos y visualización de la información
Qué procedimientos de trabajo se siguen
Elaboración y publicación de la noticia, reportaje...
- Asegúrate de que tu análisis es correcto antes de publicarlo (repite tus cálculos al menos un par de veces)
- Ten cuidado con las relaciones de causa-efecto que puedas establecer. Cuando sea posible opta por enumeraciones
- Si tu trabajo menciona personas u organizaciones ofréceles el derecho a réplica
- Publica en acceso abierto tus datos. Así tu trabajo será contrastable. Además, otros podrán hacer hallazgos que no viste o profundizar más en tu análisis
- Determina qué indicadores utilizarás para evaluar la calidad de tu trabajo
Visualización de los datos
- Los datos por sí mismo son invisibles. Normalmente, es la visualización la que dota de sentido a los datos 🡪 Aprende de/con tus visualizaciones
- La visualización de datos debe ser informativa y bonita
- Si se ha de decidir entre contar mejor una historia o hacerla más atractiva estéticamente, siempre se primara a la historia
- Se escogerá un tipo u otro de visualización en función del tipo de dato y estudio que estemos realizando
- Normalmente la visualización permite:
- Medir algo
- Comparar algo
- Mostrar una evolución a lo largo del tiempo
- Mostrar una jerarquía
- Categorizar algo
- Asociar o relacionar algo
Análisis de los datos
- Normalmente utilizando software estadístico (p.ej. Excel, SPSS, y R)
- Las medidas estadísticas utilizadas en periodismo de datos suelen ser muy básicas: media, moda, mediana, correlaciones, etc.
- No debes obsesionarte con la precisión
- El análisis debe afrontarse con una mente abierta y de manera totalmente objetiva (p.ej. crisis económica y consumo de alcohol)
- Identifica bien las variables que afectan a tu objeto de estudio (p.ej. política de mano dura de Giuliani vs. Ley del aborto)
- Reflexiona antes de publicar tus conclusiones (p.ej. 1 de cada 15 europeos es analfabeto)
- Los números grandes y pequeños ¿son relativos? (p.ej. uso de medios sociales en comunicación política)
Creación de una base de datos
- Normalmente mediante la fusión de dos o más conjuntos de datos. Por ejemplo, utilizando Access para unir varios documentos Excel con distintos campos
- Debería permitir la consulta de los datos y su descarga en uno o más formatos
Normalización/Limpieza de los datos
- Identificación y adopción inequívoca de nombres propios (por ejemplo, el nombre de un político o una celebridad)
- Eliminación de mayúsculas y tildes
- Normalización de la información contenida en los campos de los documentos estructurados (p.ej. un Excel con un campo de profesión con datos tales como: maestro, profesor, educador, formador, etc.)
Petición y/o descarga de los datos (scraping)
- Mediante peticiones: por ejemplo, en organismos públicos utilizando nuestro derecho de acceso a la información pública
- Podemos exigir datos que deban estar en acceso público
- No podemos exigir datos que requieran tratamiento por parte de la Administración
- Antes de solicitar un conjunto de datos es buena idea solicitar su "diccionario de datos"
- También conviene solicitar información sobre los nuevos códigos o campos que se hayan añadido a los datos
- Con herramientas automáticas: por ejemplo, “scrapers” para la descarga de páginas HTML, etc.
Estudio del tipo de datos
- Estructurados
- No estructurados
Identificación de la fuente/s
- Organismo gubernamentales (p.ej. Ministerios, Consejerías, etc.)
- Portales de datos oficiales (p.ej. INE, Idescat, etc.)
- Organismos internacionales (p.ej. UN, OMS, etc.)
- Portales de datos (p.ej. Data Hub, Crunchbase, Qlik)
- Organizaciones privadas
- Con ánimo de lucro (empresas)
- Sin ánimo de lucro (p. ej. ONGs, asociaciones, fundaciones, etc.)
- Ciudadanos (con información fiable y validable) (¿Qué quieren contarte los ciudadanos?)
- Sitios web (p.ej. de la administración pública, universidades, empresas, etc.)
- Buscadores
- Medios sociales (p.ej. Twitter, Instagram, etc.)
Qué nos cuenta
Una historia del lector o muy cercana a él
Una historia general
Por qué deben utilizar los datos los periodistas
- Porque es una potente herramienta para estar más cerca de la verdad, de lo que pasa en el mundo.
- Porque nos permite encontrar información que, de otro modo, sería imposible de hallar o probar (Cynthia O´Murchu, Financial Times)
- Porque algunas historias solo pueden ser entendidas y explicadas con los datos y su visualización.
- Porque cuando la información era escasa, la labor más importante para los periodistas era conseguirla. Ahora que la información es abundante, lo más importante es procesarla.
- Porque reunir, filtrar y visualizar información que no puede verse a simple vista es muy valioso para el periodismo y la sociedad.
- El periodismo de datos es la gran oportunidad de dar sentido y reivindicar el periodismo
- Empodera al periodista
- Lo hace menos dependiente de las fuentes
- Es replicable
- Lo hace más "científico"
Recomendaciones
- Las herramientas de análisis estadístico y visualización de información son tus amigas. Convierten información muy compleja en conocimiento comprensible
- Comparte con tus compañeros tus ideas y muéstrales tu trabajo. Disponer de opiniones diversas, procedentes de diferentes perfiles de personas, te ayudará a enriquecer y mejorar tu trabajo (Brian Boyer, Chicago Tribune)
- Cuando solicites información, no aceptes un no por respuesta fácilmente
- Si no sabes como empezar a hacer periodismo de datos, escoge un tema que le importe a la gente (tanto en el momento de escogerlo como cuando termines tu trabajo)
- Ten en cuenta que todo el proceso que has seguido (consecución de datos, análisis, etc.) puede ser una buena historia
Ventajas
- Genera confianza en los lectores: no pretende ser el primero en informar sino facilitar información verídica y contrastada
- Ofrece a los lectores una forma sencilla de conocer hechos complejos
- Capta más atención por parte de los lectores: más tiempo de permanencia en las páginas del diario
- Con frecuencia, ofrece la oportunidad de informarse de forma personalizada
- Se viraliza con mucha facilidad: tanto es así que a veces se utiliza como una estrategia de marketing online
Principales problemas del periodismo de datos
- Es difícil iniciar una investigación. Con frecuencia partimos de una pregunta periodística pero los datos no siempre pueden responderla
- Requiere destrezas técnicas para buscar, comprender y visualizar fuentes digitales.
- Analizar y comprender un conjunto de datos es un proceso que necesita tiempo (incluso teniendo destreza tecnológica y estadística)
- No existe una rutina o procedimiento de trabajo en el periodismo de datos
- Los datos que suministran gobiernos y organizaciones están, en ocasiones, incompletos o desactualizados
- Si los datos están desestructurados o en un formato inapropiado trabajar con ellos puede ser muy complejo y lento
Cuándo empezó todo
El "nuevo periodismo" de Tome Wolfe era más literario.
- Se apoyaba en las experiencias y en las anécdotas.
- Priorizaba las emociones y las imágenes de sensaciones.
El otro "nuevo periodismo" de Philip Meyes era más científico pero sin renunciar a la precisión del lenguaje; esa precisión estaba basada en los datos.
Más adelante, en 2009, se creó el Datablog de The Guardian, un equipo emplazado en el área de diseño y gráficos que publicaba las bases de datos.
Después, en 2010, este equipo pasó a la redacción con la llegada de WikiLeaks y la Guerra de Irak.
Actualmente, el mejor momento para hacer periodismo de datos es cuando se encuentra una historia que se cuenta mejor con números, es decir, datos.
Cómo se hace el periodismo de datos
La mejor manera de hacer periodismo de datos es de manera colaborativa -> través de la colaboración de equipos multidisciplinares formados por periodistas y programadores.
- Mediante la asociación de diversos medios
- Colaborando con hackers
- Colaborando con académicos: por sus proyectos de investigación
- Colaborando con ONGs: por su labor de monitorización
- Colaborando con la ciudadanía
Qué es el periodismo de datos
Qué nos ofrece
Periodismo de datos
El periodismo de datos es:
- El resultado de la cooperación entre periodistas de investigación y programadores que quieren utilizar los datos para contribuir a crear una sociedad global más justa.
- Consiste en transformar datos en evidencias que, con frecuencia, ayudan a saber si nuestros gobernantes están haciendo bien su labor.
- No es solo una herramienta, sino una oportunidad para explicar historias complejas y dar respuestas con datos.
- Más científico (que no equivale a un periodismo sobre ciencia).
Datos
Los datos son:
- Fuente de información.
- Herramienta para contar una historia.
- Valores de una variable.
- Todo lo que entra en una base de datos.
Tipos
No estructurados
Documentos que carecen de una estructura interna, como los documentos Word o los PDFs.
Estructurados
Pueden ser ordenador y procesados fácilmente, como los documentos de Excel o una página HTML.