Regresión y Correlación
Tipos de modelos de regresión lineal
Regresión lineal múltiple
Un modelo de regresión lineal múltiple es un modelo estadístico versátil para evaluar las relaciones entre un destino continuo y los predictores. Los predictores pueden ser campos continuos, categóricos o derivados, de modo que las relaciones no lineales también estén soportadas.
Regresión lineal simple
La regresión lineal simple consiste en generar un modelo de regresión (ecuación de una recta) que permita explicar la relación lineal que existe entre dos variables. A la variable dependiente o respuesta se le identifica como Y y a la variable predictora o independiente como X.
Correlación lineal
Grado de correlación
Correlación nula
se da cuando no hay dependencia de ningún tipo entre las variables. En este caso se dice que las variables son incorreladas y la nube de puntos tiene una forma redondeada.
Correlación débil
cuando una variable aumenta, la otra tiende a disminuir, pero de manera débil o poco confiable. La correlación entre dos variables se considera débil si el valor absoluto de r está entre 0,25 y 0,5. Sin embargo, la definición de una correlación «débil» puede variar de un campo a otro
Correlación fuerte
entre dos variables se considera fuerte si el valor absoluto de r es mayor que 0,75 . Sin embargo, la definición de una correlación «fuerte» puede variar de un campo a otro.
Tipos de correlación
Correlación nula.
se da cuando no hay dependencia de ningún tipo entre las variables. En este caso se dice que las variables son incorreladas y la nube de puntos tiene una forma redondeada
Correlación inversa
se da cuando al aumentar una de las variables la otra disminuye. La recta correspondiente a la nube de puntos de la distribución es una recta decreciente.
Correlación directa
se da cuando al aumentar una de las variables la otra aumenta. La recta correspondiente a la nube de puntos de la distribución es una recta creciente. La correlación inversa se da cuando al aumentar una de las variables la otra disminuye.
El error total es la suma de todos los errores.
es igual a la suma de estos tres tipos de errores. Aún cuando el error total se pueda minimizar, es imposible eliminarlo del todo debido a que el error de escala siempre está presente. Por lo tanto, el error total no tiende a cero sino a cierto valor constante.
Los errores tienen una esperanza matemática igual a cero (los errores de una misma magnitud y distinto signo son equiprobables).
El error total es la suma de todos los errores
Los errores tienen varianza constante.
La homocedasticidad es una característica de un modelo de regresión lineal que implica que la varianza de los errores es constante a lo largo del tiempo.
Los errores en la medición de las variables explicativas son independientes entre sí.
tienen varianza constante. (Homocedasticidad) Los errores tienen una esperanza matemática igual a cero (los errores de una misma magnitud y distinto signo son equiprobables).
La relación entre las variables es lineal
Dada una relación entre dos variables x y y, la relación es lineal si la razón de cambio es constante. I.e., siempre que x aumenta en 1, y siempre aumenta en la misma constante.