Medidas estadísticas bivariantes de regresión y correlación

Correlación

Concepto

Sirve para medir la naturaleza y grado de relación o covarianza de las variables.

Objetivo

Medir la relación entre una variable dependiente y una variable independiente.

Análisis

Dos variable cualitativas.

Variable dependiente y variable independiente para referirse a las mediciones.

Tipos

Correlación positiva

Se da cuando hay una relación proporcional entre ambas variables.

Correlación negativa

Se produce cuando el comportamiento de una variable es diferente a la otra.

Correlación nula

No existe algún tipo de comportamiento entre ambas variables.

Características

Se puede expresar mediante un diagrama de dispersión.

La correlación no distingue entre variables respuesta

Las coordenadas de los ejes cartesianos se toman las dos variables.

Cuanto mayor sea la razón de correlación mayor será la potencia de X a la hora de explicar el valor que toma Y.

El coeficiente de determinación lineal simple, se denomina así, por ser una particularización de la razón de correlación.

Se usa para entender si la relación es positiva o negativa.

Regresión

Concepto

Relaciona una ecuación con una variable de criterio con una o más variables de predicción.

Objetivo

Construir una función que permita estimar el valor futuro, de la variable estudiada.

Análisis

Simple

Cuando se usa sólo una variable de predicción.

Múltiple

Si se utilizan dos o más variable.

Tipos

Tipo I

Se asigna a cada valor de la variable explicativa la media de la variable explicada condicionada.

Estimaciones de Y para los valores de X contenidos en la distribución de frecuencias.

Tipo II

La función y = f(x) o y = f(x1, x2, …, xp) que liga la variable explicada con la explicativa tiene forma paramétrica

Proporciona estimaciones de Y para cualquier valor de X, esté contenido en la distribución o no.

Así, la regresión (y correlación) será lineal cuando tal función sea una recta, un plano o un hiperplano.

En caso contrario, la regresión (y correlación) será no lineal.

Características

La regresión de una variable sobre otra(s) no proporciona el valor real de la primera.

Si la variable explicativa es cualitativa, la regresión de tipo I sólo tiene sentido cuando dicha variable presenta un número predeterminado de niveles.

Permite calcular una esperanza promedio condicional.

La estimación de la muestra de la varianza alrededor de la recta de regresión se relaciona con la suma de los errores al cuadrado

Erros estándar de estimación

Desviación estándar de la regresión

Valor absoluto de la variación en la variable de criterio, que se deja sin explicación.

No cuenta en la ecuación de regresión ajustada.

Coeficiente

De pendiente

Requiere de errores con distribución normal para elaborar inferencias estadísticas acerca de los coeficientes de regresión.

Muestras repetidas de la población de territorios y se calcula un valor de β̂1 para cada muestra

De determinación

Denota la proporción relativa de la variación total en la variable de criterio.

Puede explicarse mediante la ecuación de regresión ajustada.

El error estándar del estimado al cuadrado, dividido entre la varianza de la muestra de la variable de criterio

Correlación

Designa la fuerza de la relación lineal entre las variables de criterio y predictivas.

Los datos de la muestra es un estimado del parámetro de la población original p.

La correlación positiva perfecta

Aumento dado de X determina con exactitud otro de Y.

Tiene coeficiente +1.

La correlación negativa perfecta

Incremento de X determina exactamente una disminución de Y.

Produce un coeficiente –1.