Periodisme de Dades

LZNov05

Fonts de Dades

Dades públiques

Iniciatives de dades obertes que permeten accés lliure

Xarxes socials

Información sobre tendencias y temas actuales

Dades privades

Bases de dades d'empreses, accés restringit

Dades Públiques

Censos, registros oficiales, estadísticas de gobierno

Scraping

Web Scraping

Extracció de dades de pàgines web mitjançant programació

Eines de Scraping

Legislació i Ética

Consideracions legals i ètiques en scraping

Neteja i Normalització de dades

Eliminació de duplicats

Evitar que les dades se repeteixin

Estandarització de formats

Homogeneïtzar formats (dates, unitats)

Omplir valors

Completar dades incompletes (mitjana, interpolació)

Correcció d'errors

Correcció de dades incorrectes o inconsistents

Transformació de dades

Ajustament de les dades per a l'anàlisi

Anàlisi de dades

Anàlisi Descriptiu

Resum de característiques generales (mitjana)

Anàlisi Exploratori

Recerca de patrons i correlacions.

Anàlisi Estadístic

Ús de mètodes estadístics (regressió)

Modelat predictiu

Uso de algoritmes para prediccions

Anàlisi de tendències

Visualització de dades

Gràfics de barres

Per a comparacions i tendències

Mapas de calor

Per mostrar intensitat o densitat d'un valor

Mapas geoespacials

Per a dades amb components geogràfics

Diagramas de dispersió

Visualització de relacions entre variables

Eines de visualització

Programadores con Tableau, Power BI, D3.js