Regresión y Correlación

La relación entre las variables es lineal

Dada una relación entre dos variables x y y, la relación es lineal si la razón de cambio es constante. I.e., siempre que x aumenta en 1, y siempre aumenta en la misma constante.

Los errores en la medición de las variables explicativas son independientes entre sí.

tienen varianza constante. (Homocedasticidad) Los errores tienen una esperanza matemática igual a cero (los errores de una misma magnitud y distinto signo son equiprobables).

Los errores tienen varianza constante.

La homocedasticidad es una característica de un modelo de regresión lineal que implica que la varianza de los errores es constante a lo largo del tiempo.

Los errores tienen una esperanza matemática igual a cero (los errores de una misma magnitud y distinto signo son equiprobables).

El error total es la suma de todos los errores

El error total es la suma de todos los errores.

es igual a la suma de estos tres tipos de errores. Aún cuando el error total se pueda minimizar, es imposible eliminarlo del todo debido a que el error de escala siempre está presente. Por lo tanto, el error total no tiende a cero sino a cierto valor constante.

Correlación lineal

Tipos de correlación

Correlación directa

se da cuando al aumentar una de las variables la otra aumenta. La recta correspondiente a la nube de puntos de la distribución es una recta creciente. La correlación inversa se da cuando al aumentar una de las variables la otra disminuye.

Correlación inversa

se da cuando al aumentar una de las variables la otra disminuye. La recta correspondiente a la nube de puntos de la distribución es una recta decreciente.

Correlación nula.

se da cuando no hay dependencia de ningún tipo entre las variables. En este caso se dice que las variables son incorreladas y la nube de puntos tiene una forma redondeada

Grado de correlación

Correlación fuerte

entre dos variables se considera fuerte si el valor absoluto de r es mayor que 0,75 . Sin embargo, la definición de una correlación «fuerte» puede variar de un campo a otro.

Correlación débil

cuando una variable aumenta, la otra tiende a disminuir, pero de manera débil o poco confiable. La correlación entre dos variables se considera débil si el valor absoluto de r está entre 0,25 y 0,5. Sin embargo, la definición de una correlación «débil» puede variar de un campo a otro

Correlación nula

se da cuando no hay dependencia de ningún tipo entre las variables. En este caso se dice que las variables son incorreladas y la nube de puntos tiene una forma redondeada.

Tipos de modelos de regresión lineal

Regresión lineal simple

La regresión lineal simple consiste en generar un modelo de regresión (ecuación de una recta) que permita explicar la relación lineal que existe entre dos variables. A la variable dependiente o respuesta se le identifica como Y y a la variable predictora o independiente como X.

Regresión lineal múltiple

Un modelo de regresión lineal múltiple es un modelo estadístico versátil para evaluar las relaciones entre un destino continuo y los predictores. Los predictores pueden ser campos continuos, categóricos o derivados, de modo que las relaciones no lineales también estén soportadas.