1. ESTADÍSTICA UNIDIMENSIONAL

1.7. Com cronstruir una distribució de freqüències agrupades

1. Determinem el rang (o recorregut) de la variable

2. Nombre de classes

El nombre de classes en un histograma depèn de la mida de la mostra.

Per mostres de mida moderada (N < 50), es recomana utilitzar l'arrel quadrada d'n com a nombre de classes.

Per a mostres més grans s'utilitza la fórmula de Sturges (log(n) / log(2) + 1)

3. Determinem la amplitud dels intervals

És més còmode que l'amplitud de totes les classes sigui la mateixa

Si és així la fórmula és ai = a = Re/no intervals.

Prendrem com a regla general, fer que l'interval estigui tancat per l'esquerra i obert per la dreta (excepte el darrer interval).

1.8. Gràfics

Diagrama de barres

És la representació per al es variables quantitatives sense agrupar o per a variables qualitatives

A l'eix x afegim els valors de de la variable xi, i a l'eix y al freqüència absoluta o relativa

Polígon de freqüències

És la representació per a les varaibles quantitatives sense agrupar o per a variables qualitatives

Histograma

És l'equivalent al diagrama de barres per a dades agrupades

Diagrama de sectors

És la representació per a variables qualitatives

Es representen mitjançant cercles, i el sector és proporcional a la freqüència

1.9. Paràmetres estadístics de centralització

Per a dades qualitatives, la distribució de freqüències resumeix la mostra. Per a dades quantitatives, s'utilitzen mesures descriptives numèriques per a resumir la informació de les dades.

Mitjana aritmètica

És el valor obtingut en sumar totes les dades i dividir-ho pel nombre total d'observacions. Cal tenir en compte que si hi ha dades repetides, s'han de considerar en el càlcul.

Mediana

La mediana és el valor que divideix un conjunt d'observacions a la meitat, deixant el 50% de les observacions a cada banda. És utilitzada per a descriure la posició central d'un conjunt de dades.

Si el nombre d'observacions és imparell, hi ha una dada central

Si el nombre d'observacions és parell, es prenen dues dades centrals i es calcula la mitjana entre elles

Moda

És aquell valor o interval més freqüent en la mostra

Quartils

Els quartils d'un conjunt ordenat de dades són els tres punts de tall que divideixen el conjunt de dades en quatre grups de la mateixa mida. Els quartils 25, 50 i 75 reben el nom de primer quartil, segon quartil i tercer quartil. El segon quartil coincidirà sempre amb la mediana.

1.10. paràmetres estadístics de dispersió

Rang o recorregut

Desviacions respecte la mitjana (Dm)

És la diferència entre una dada (xi) i la seva mitjana (x)

Fórmula: Valor absolut de xi-x

Variància (S2)

La variança mesura la dispersió de les dades respecte a la mitjana. Si les dades estan molt separades de la mitjana, hi haurà una variança elevada.

Fórmula: (Dm) elevat al quadrat *ni / n

Desviació típica (S)

És l'arrel quadrada de la variància

Rang interquartílic

La mesura de dispersió d'una distribució es calcula restant el primer quartil al tercer quartil. Aquesta diferència reflecteix la distància entre els valors que divideixen la distribució en quatre parts iguals.

Coeficient de variació (Cv)

És una mesura que compara la dispersió de dues seqüències de dades expressades en diferents unitats.  Això ens permet determinar quina seqüència té una major dispersió. És una eina útil per comparar dades amb diferents unitats i proporciona una mesura relativa de la dispersió.

Fórmula: Cv = S/x

És la ciència que recull, representa i utilitza les dades sobre característiques d'interès per prendre decisions i extreure conclusions generals.

1.1. Mètode estadístic

L'estadística descriptiva és una branca de l'estadística que es dedica a l'organització, resum i primera descripció de les dades.

1.2. Conceptes bàsics

Població

Conjunt d’individus o ens subjectes a estudi.

Mostra

Nombre de dades que prenem de la població per fer el nostre estudi.

Mida mostral

Nombre d'observacions a la mostra (N).

Dada

Cada valor observat de la variable.

Variable

Característica que estem mesurant.

1.3. Tipus de variables

Variables qualitatives: Aquelles que no són mesurables, és a dir aquelles les observacions de les quals no tenen caràcter numèric. Expressen qualitats o categories

Nominals: Tenen qualitat que no són ordenables.

Ordinals:Tenen qualitats que poden ser ordenades.

Variables quantitatives: Aquelles que són mesurables, les seves observacions tenen caràcter numèric.

Discretes: Tenen valors numèrics fixes.

Continues:Tenen valors en intervals numèrics.

1.4. Distribucions de les freqüències

Les freqüències són utilitzades per a organitzar les dades.

Freqüència absoluta (ni)

És el nombre de vegades que es repeteix un valor específic en una mostra de la variable.

Propietat: La suma de totes les freqüències absolutes és igual al tamany de la mostra.

Freqüència relativa (fi)

És igual a la freqüència absoluta dividida pel nombre total de dades, és dir per la mida mostral.

Fórmula: ni/N=fi

Propietat: La suma de totes les freqüències relatives és igual a 1

Freqüències acumulades (Ni)

Ens indica la quantitat de dades que són iguals o inferiors a un valor específic.

S'ha de sumar les freqüències absolutes dels elements anteriors a aquest.

Propietat: La freqüència acumulada final és igual al nombre total de dades en la mostra.

Freqüència relativa acumulada (Fi)

Es calcula dividint cada freqüència acumulada pel total de dades.

Fórmula: Ni/N

1.5. TAULA de freqüències d’una variable

En un estudi estadístic, després de recollir les dades, es presenten de manera clara i comprensible mitjançant taules de freqüències. Això facilita la visualització i l'anàlisi dels valors recopilats.

1.6. distribucions de freqüències agrupades

Per a variables contínues amb molts valors, pot ser incòmode de llegir. Agrupar-los en intervals o intervals de classe simplifica la taula resultant, tot i que implica una pèrdua de precisió en els resultats.

Agrupar en intervals de classe és el procés de dividir les dades en intervals de nombres petits que compleixen les següents condicions:

Evita la superposició i l'ambigüitat entre les classes per a una observació concreta.

Cobreixin tot el rang de valors que tenim a la mostra.

S'anomenen:

A les fronteres de l'interval, límits inferior i superior de classe

li, Li respectivament.

Marca de classe (ci) al punt mitjà de l'interval, és a dir, a la mitjana aritmètica

Recorregut o rang (R) és la diferència entre l'extrem superior i inferior

R = Li - li

Al nombre d'observacions d'una classe se'n diu freqüència de classe (ni)

Si dividim aquesta freqüència pel nombre total d'observacions, s'obté la freqüència relativa de classe (fi).