“Tratar al periodismo como si fuera una ciencia, adoptando el método científico, la objetividad científica y los ideales científicos en el proceso completo de la comunicación de masas”. Philip Meyer, Periodismo de precisión, 1991.
Introducción al Periodismo de Datos
Orígenes: Philip Meyer
Periodismo de precisión
Más "científico" (método)
Basado en datos
Recomendaciones
El proceso (consecución de datos, análisis...) puede ser una buena historia
Escoger temas que importen a la ciudadanía
No aceptar fácilmente un no por respuesta: conocer los derechos de acceso a los datos
Compartir ideas con compañeros/as y mostrarles el trabajo
Disponer de opiniones diversas, procedentes de diferentes perfiles de personas, te ayudará a enriquecer y mejorar tu trabajo (Brian Boyer, Chicago Tribune)
Perder el miedo a las herramientas de visualización y análisis
¿Qué procedimientos de trabajo sigue?
Se debería documentar detalladamente el proceso de trabajo.
Elaboración y publicación de la pieza periodística (notícia, reportaje, interactivo, etc.)
- Asegúrate de que tu análisis es correcto antes de publicarlo (repite tus cálculos al menos un par de veces)
- Ten cuidado con las relaciones de causa-efecto que puedas establecer. Cuando sea posible opta por enumeraciones
- Si tu trabajo menciona personas u organizaciones ofréceles el derecho a réplica
- Publica en acceso abierto tus datos. Así tu trabajo será contrastable. Además, otros podrán hacer hallazgos que no viste o profundizar más en tu análisis
- Determina qué indicadores utilizarás para evaluar la calidad de tu trabajo
- Considera si es mejor usar Copyright o licencia Creative Commons
Visualización de los datos
Los datos por sí mismos son invisibles, por eso es necesaria la visualización, que los dota de sentido. La visualización debe ser informativa y bonita a la vez, aunque es más importante contarla bien que hacerla más atractiva estéticamente.
La visualización debe diseñarse pensando en dos tipos de lectores:
- Uno que quiere una información fácil e inmediata
- Otro que quiere profundizar en el conocimiento de los datos
Y permite saber si nos conviene centrarnos en un aspecto concreto de los datos, si conviene centrarnos en un aspecto general, si tenemos que filtrar mejor los datos, o si hemos de eliminar los valores extremos
Tipos de visualizaciones, según el tipo de datos y estudio:
- Tablas: cuando trabajamos con un reducido número de datos
- Gráficos: cuando trabajemos con dos o tres dimensiones
- Gráficos de líneas: para mostrar continuidad temporal
- Grafos: para mostrar relaciones o interconexiones
Asociar o relacionar
Categorizar
Mostrar una jerarquía
Mostrar una evolución a lo largo del tiempo
Comparar
Medir
Análisis de los datos
¿Cómo?
- Utilizando software estadístico: Excel, SPSS, R
- Con medidas estadísticas básicas: media, moda, mediana, correlaciones...
- No obsesionarse con la precisión
- El análisis debe afrontarse con una mente abierta y de manera totalmente objetiva (cuidado con las ideas preconcebidas que pueden alterar el análisis)
- Identificar bien las variables que afectan al objeto de estudio (efectos y consecuencias)
- Reflexionar antes de publicar las conclusiones
- Los números grandes y pequeños ¿son relativos? Sí, dependen del contexto
Creación de una base de datos
Se suele hacer mediante la fusión de dos o más conjuntos de datos, utilizando herramientas como Access o Excel, para permitir su descarga y consulta en diferentes formatos.
Normalización (limpieza) de los datos
Con los datos en la mano, debemos organizarlos y procesarlos, según el tipo de datos con los que trabajemos.
- Identificación y adopción inequívoca de nombres propios (por ejemplo, el nombre de un político o una celebridad)
- Eliminación de mayúsculas y tildes
- Normalización de la información contenida en los campos de los documentos estructurados (Ejemplo -> un Excel con un campo de profesión con datos tales como: maestro, profesor, educador, formador...) --> Unificarlos en una sola categoría.
Petición y/o descarga de los datos
¿Cómo los podemos obtener?
- Mediante peticiones a organismos públicos, con nuestro derecho de acceso a la información pública.
- Posibilidad de exigir datos que deben estar en acceso público, pero no aquellos que requieran tratamiento por parte de la Administración
- Solicitar un "diccionario de datos" con anterioridad puede ser útil
- Solicitar información sobre los nuevos códigos o campos que se hayan añadido a los datos
- Con herramientas automáticas, como "scrappers" para la descarga automática de páginas HTML.
Pero antes:
- Elaborar una lista de preguntas o hipótesis a las que nos gustaría responder con los datos.
- Preguntar si la petición supone un coste.
- Conocer bien nuestros derechos.
- Guardar una copia de los datos originales.
- No infringir la ley al tratar la información.
Civio
Documentcloud
Eurostat
Instituto Nacional de Estadística
Estudio del tipo de datos que puede suministrar, su formato
No estructurados
Están en documentos que carecen de una estructura interna, como un documento WORD o PDF.
Estructurados
Se pueden procesar y ordenar fácilmente. Se encuentran en un Excel o en el HTML de una página, por ejemplo.
Identificación de la fuente que puede suministrar los datos
Medios sociales (Twitter, Instagram, Facebook...)
Buscadores
Sitios web (De la administración pública, universidades, empresas...)
Ciudadanos con información fiable y validable
Sin ánimo de lucro (ONGs, asociaciones, fundaciones...)
Organizaciones con ánimo de lucro (empresas)
Organizaciones privadas
Portales de datos (Data Hub, Crunchbase, Qlik)
Organismos internacionales (ONU, OMS...)
Portales de datos oficiales (INE, Idescat...)
Organismos gubernamentales (Ministerios, Consejerías...)
¿Por qué deben utilizar datos los periodistas?
Reúne, filtra y hace visible información valiosa para la sociedad que no puede verse a simple vista
Cuando hay tanta información disponible, los periodistas deben procesarla
Algunas historias solo pueden ser entendidas y explicadas con datos
Permite encontrar información que de otro modo sería imposible encontrar
Potente herramienta para estar más cerca de la verdad
Ventajas
Empodera el periodista
Menos dependiente de las fuentes
Fácilmente traducible a otros idiomas
Se viraliza con facilidad
Puede permitir informarse de forma personalizada
Capta la atención del lector
Forma sencilla de conocer hechos complejos
Genera confianza en los lectores
Información verídica y contrastada
Principales problemas
Los datos pueden estar incompletos y/o desactualizados
No existe una rutina fija
Se necesita tiempo
Sobre todo con datos desestructurados
Requiere destrezas técnicas (buscar, comprender y visualizar fuentes digitales)
Difícil iniciar una investigación y puede que no lleguemos a encontrar una respuesta
¿Cómo ejercerlo?
También de forma individual
De forma colaborativa
Cuando hay una gran cantidad de datos disponibles o estos son muy complejos, y también para reducir los costes.
Con la ciudadanía
Con ONGs
Con Hackers
Con académicos
Asociación de medios diferentes
Un ejemplo claro es el del Consorcio Internacional de Periodistas de Investigación, que reúne a periodistas y medios de muchos países distintos que trabajan de forma colaborativa. Este grupo es el que procesó la cantidad ingente de datos filtrada sobre los clientes de un bufete de abogados en un paraíso fiscal, investigación conocida como Papeles de Panamá.
Con equipos multidisciplinares
Nos referimos a los grandes medios de comunicación, que son los que pueden permitirse estos profesionales. Los pequeños pueden recurrir a ONGs y académicos.
¿Qué es?
El Periodismo de datos cuenta historias generales, pero también intenta explicar otras vinculadas a los lectores, o próximas a estos. Lo que pretende es acercar una realidad compleja al público, para que la comprenda. Para ello, usa diferentes formatos:
- Texto, es decir, un artículo
- Tablas
- Gráficos
- Imágenes
- Vídeos
- Interactivos*
*Ejemplo de un juego interactivo del Consorcio Internacional de Periodistas de Investigación para explicar cómo funciona la evasión fiscal:
https://www.icij.org/investigations/panama-papers/stairway-tax-heaven/
Oportunidad para explicar historias complejas
Transformar los datos en evidencias
Control de los poderosos (Cuarto Poder)
Resultado de la cooperación entre periodistas de investigación y programadores
Contribuir a una sociedad global más justa
Periodismo (de investigación) hecho con datos, que se usan como:
Los datos no son hechos, sino valores de una variable. No describen la realidad, sino que la resumen. Por sí solos no dan información, hay que relacionarlos y vincularlos con otros para encontrarles el sentido.
Pueden ser:
- Verdaderos o falsos
- Numéricos o no numéricos
- Objetivos o subjetivos
- Primarios o secundarios
NO confundirlos con el "Big Data" (volumen, velocidad, variedad, veracidad, valor)
Ambos
Herramienta para contar una historia
Fuente de Información