Categorias: Todos - periodisme - dades - anàlisi

por ALEJANDRA VIVES MELÉNDEZ 1 mês atrás

20

Periodisme de dades

El periodisme de dades implica la recopilació, limpieza, normalización y análisis de grandes conjuntos de datos para extraer información valiosa. Las técnicas de scraping permiten convertir datos de internet en documentos manipulables utilizando herramientas como Google Sheets y Tabula para extraer tablas de documentos PDF.

Periodisme de dades

Alejandra Vives Meléndez, 02/11/2024

Periodisme de dades

Anàlisi i visualització de dades

ANÀLISI: sintetització de dades molt grans mitjançant mesures estadístiques i visualitzacions
Mesures estadístiques aplicades. De centralitat: moda, mediana i mitjana. De dispersió: rang i desviació típica. De dependència: correlació, percentatges i canvi percentual

Males praxis de visualització: gràfics de barres amb eixos tallats o començats per una xifra que interessa, no mostrar prou dades d'una seqüència que sí que tens, mostrar percentatges enganyosos sense explicar d'on surten, suggerir alguna cosa incorrecta o recollir informació errònia

Els millors gràfics són els que les audiències poden interpretar fàcilment en el sentit que proposes!

Objectius d'una visualització --> destacar un nº important, comparar (2 o + nº, amb un punt de referència, representar parts d'un tot), mostrar una evolució al llarg del temps i destacar per mitjà d'imatges o text: ordre i estructura visual

*Taules: eina de visualització molt útil quan necessitem comparar dades molt variables

RECOMANACIONS I CONSELLS: títols informatius, alinear els textos, evitar els elements diagonals, deixar espai en blanc, contrast, alinear l'eix X en la part de la visualització, eliminar les vores del gràfic, eliminar les línies de quadrícula i simplificar les dades

Scraping de dades

Què és? --> Convertir en un document manipulable la informació que trobem a Internet
Scraping amb fulls de càlcul de Google. Fórmules més utilitzades: IMPORTHTML, IMPORTFEED, IMPORTXML

Scraping amb Tabula. Permet l'extracció de taules a partir de documents PDF

Neteja de dades: procediment utilitzat per detectar i eliminar possibles errors presents en els conjunts de dades recopilades

Normalització de dades: procediment per homogeneïtzar dades i donar coherència al dataset amb el qual treballem

Neteja i normalització. Eines: Interactive Data Transformation Tools (datasets grans) i Open Refine (datasets petits)

Conceptes bàsics

Periodisme de dades: periodisme basat en una recerca intensiva d’arxiu de dades. És col·laboratiu i hauria de ser transparent amb les audiències
Visualització de la informació: quan convertim les dades en quelcom que l’audiència pugui entendre: gràfics, mapes, taules, etc.

Com es fa: cerca i recollida de dades, neteja i normalització de dades, visualització i anàlisi de dades, disseny de la visualització de dades final, redacció i publicació de la notícia o reportatge de dades i documentació del procés de recollida i anàlisi de dades

Bases de dades: Factiva, Lexis Nexis i MyNews

Cercadors: Google cerca avançada i/o Google Data Search