Correlación y Regresión Líneal

El coeficiente de correlación mide la fuerza de la asociación lineal entre dos variables.

Las dos variables deben estar al menos en la escala de medición del intervalo

El coeficiente de correlación varía desde: 1.00 hasta 1.00.

Si la correlación entre dos variables es 0, no hay asociación entre ellas.

Un valor de 1.00 indica una correlación positiva perfecta, y uno de: 1.00 indica una correlación negativa perfecta .

Un signo positivo indica que hay una relación directa entre las variables, y un signo negativo, quehay una relación inversa

Se designa con la letra
r, y se determina mediante la siguiente ecuación:

Con la siguiente ecuación se determina si la correlación en la población es distinta de 0

El error estándar de estimación mide la variación alrededor de la recta de regresión

Está en las mismas unidades que la variable dependiente

Se basa en las desviaciones al cuadrado de la recta de regresión.

Los valores pequeños indican que los puntos se concentran estrechamente en la recta de regre-sión

Se calcula utilizando la siguiente fórmula

La inferencia respecto de la regresión lineal se basa en las siguientes suposiciones.
Para un valor dado de X , los valores de Y están normalmente distribuidos respecto de la rectade regresión.
La desviación estándar de cada una de las distribuciones normales es la misma para todos los valores de
X,y se estima mediante el error estándar de estimación.
Las desviaciones de la recta de regresión son independientes, sin un patrón debido al tamaño ola dirección

La recta de regresión de mínimos cuadrados es de la forma

Y es el valor estimado de Y
para un valor seleccionado de X
.a es la constante o intersección. 1 a Es el valor de cuando a b es la pendiente de la recta ajustada X es el valor de la variable independiente

La recta de regresión de mínimos cuadrados es de la forma^

En el análisis de regresión, se estima una variable con base en otra variable.

La variable que se estima es la variable dependiente

La variable con la cual se hace la estimación es la variable independiente

En el caso de una ecuación de regresión, se prueba la pendiente para saber su significancia

Probamos la hipótesis de que la pendiente de la recta en la población es 0

Al probar la hipótesis nula con respecto a la pendiente, el estadístico de prueba es
n-2 grados de libertad

El coeficiente de determinación es la fracción de la variación de una variable dependiente que se explica por la variación de la variable independiente.
Varía de 0 a 1.0.
Es el cuadrado del coeficiente de correlación.
Se calcula a partir de la siguiente fórmula:

Un diagrama de dispersión es una herramienta gráfica para representar la relación entre dos varia-bles.

La variable independiente se representa a escala en el eje
X,
y es la variable que se emplea comoestimador

La variable dependiente se representa a escala en el eje
Y,
y es la variable que se debe estimar