REGRESIÓN Y CORRELACIÓN LÍNEAL

Coeficiente de correlación

¿Qué es?

El grado de asociación entre dos variables numéricas puede resumido en un estadístico

Coeficiente de correlación de Pearson

Mide el grado de asociación lineal entre dos variables y posteriormente un estadístico basado en rangos que estima la correlación

Definición

Sean (Xi, Yi) las observaciones realizadas en cada uno de los n sujetos de una muestra de tamaño n.

Propiedades

r toma valores entre –1 y 1 (–1 ≤ r ≤ 1)

r mide la fuerza de la asociación LINEAL entre X e Y

r = 0 implica que no hay relación lineal entre las variables

r = + 1 implica que todos los puntos caen sobre una recta de pendiente positiva

Mientras mayor el valor absoluto de r mayor la fuerza de la asociación

El valor de r no depende de las unidades de medición

¿Qué mide?

Que cercanos se encuentran los puntos alrededor de una línea recta que indique la tendencia general.

Coeficiente de correlación de Spearman

Disponemos de n pares de observaciones (X1, Y1), ..., (Xn, Yn). Las variables pueden ser
numéricas o categóricas ordinales.

¿Cómo se calcula el coeficiente?

Se ordenan los valores de cada variable por separado y se reemplaza cada observación por la posición (rango) que ésta ocupa en la muestra ordenada.

Características

Como el coeficiente de correlación de Spearman varía entre −1 y 1.

Mide la fuerza de la correlación entre las dos variables.

No hace supuestos sobre la forma de la relación entre las dos variables.

¿Cuándo usarlo?

Cuando las variables tienen una relación creciente o decreciente pero no necesariamente lineal.

Cuando hay datos influyentes.

Cuando la forma de la nube de puntos no es elipsoidal.

Gráfico de dispersión (Scatter Plot)

¿Qué es?^

Gráfico muy simple y útil para estudiar relaciones entre dos variables cuantitativas

Se dibuja un sistema de coordenadas cartesianas en el que se representan los valores que
toman las dos variables para cada sujeto

La nube resultante de puntos permite evaluar si existe relación entre las dos variables o si no hay relación aparente

Para interpretar un gráfico de dispersión debe mirarse el patrón general que siguen los
puntos.

Intereses al estudiar la relación entre dos variables cuantitativas

Existencia de asociación entre las mismas

Estudio de la forma de la relación

Fuerza de la asociación

Predecir una variable a partir de la otra usando el modelo propuesto(REGRESIÓN)

Modelos

Modelo matemático

Función matemática que propone la forma de
relación entre la variable dependiente (Y) y la o las variables independientes.

La función más simple para la relación entre dos variables es la función lineal

Modelo determinístico

En condiciones ideales el modelo permite predecir sin error el valor de la variable dependiente.

La función más simple para la relación entre dos variables es la función lineal

Modelo estadístico

Permite incorporar un componente aleatorio en la relación.

La función más simple para la relación entre dos variables es la función lineal