av Martí Rico för 1 år sedan
137
Mer av detta
El núvol de punts o diagrama de dispersió és un gràfic utilitzat per a detectar relacions de dependència entre dues variables. Es representa els parells de valors en uns eixos de coordenades, amb la variable independent a l'eix X i la variable dependent a l'eix Y. Aquesta representació visual permet identificar possibles correlacions o tendències entre les variables.
per a Y (yj) atès que X (xi) és el nombre de vegades que es repeteix el valor ij tenint en compte només aquells valors en què X (xi
n(i) j = nij per a tot j = 1, 2,..., h.
Per a X(xi) atès que Y(yj) és el nombre de vegades que es repeteix el valor xi tenint en compte només aquells valors en què Y (ij)
ni (j) = nij per a tot i = 1, 2, ..., k
A partir de les anteriors, i de la mateixa manera, es construiran aquestes freqüències (fi) i (fj)
Per la Y (yj) sería el número de vegades que es repeteix el valor yj sense tenir en compte els valors de la X, la representem per nj.
Per la X (xi) sería el número de vegades que es repeteix el valor xi sense tenir en compte els valors de la Y, la representem per ni
Es comú utilitzar una taula de contingència per a mostrar els valors d'una distribució estadística bidimensional. En aquesta taula, es registren els resultats d'una variable a la part superior i els valors de l'altra variable a l'esquerra. A cada casella de la taula s'indiquen les freqüències absolutes, relatives o percentatges de les dues variables.
Fórmula: nij / n
Aquesta frase indica el nombre de vegades que es troba el valor xi de la variable X en la mostra, en relació amb el valor yj de la variable Y.
Propietat: la suma de les freqüències absolutes és igual a n.
Hi ha dues rectes de regressió que es calcularan en funció de la correlació i les mitjanes i variàncies de les variables marginals:
La selecció de la recta a utilitzar depèn del context del problema. En alguns casos, l'enunciat ja indica quina recta s'ha d'utilitzar, mentre que en altres casos cal deduir-ho a partir de les dades.
La recta de regressió és aquella que millor s'ajusta a la distribució de punts (núvol de punts).
Si es demana predir el valor de x coneixent la corresponent y, s'ha d'utilitzar la recta de regressió de X sobre Y, ja que aïlla la variable X.
Si es demana predir un valor de y donat un valor de x, s'ha d'utilitzar la recta de Y sobre X, ja que aquesta recta aïlla la variable Y.
La de X sobre Y
X = x + (oxy/oy2) * (yj-y)
La de Y sobre X
Y = y + (oxy/ox2) * (xi-x)
Coeficient de correlació lineal de Pearson
Covariància
Mitjana, variància i desviació típica d'X i d'Y
La tercera és la de la variable bidimensional XY
A les columnes hi situarem els valors (xi,yj), nij, xi * yj * nij
La segona és la de la variable Y
A les columnes hi situarem yj, yj * nj, yj2 * nj
La primera és la de la variable X
A les columnes hi situarem xi, xi * ni, xi2 * ni
oy = arrel quadrada de ((sumatori de yi al quadrat * ni) / N - y al quadrat
y = mitjana de totes les yi
ox = arrel quadrada de ((sumatori de xi al quadrat * ni) / N - x al quadrat
x = mitjana de totes les xi
N = número total d'individus estudiats
oxy és la covariància
Si oxy = 0
No hi ha dependència lineal
Si oxy < 0
Dependència lineal negativa
Si oxy > 0
Dependència lineal positiva