Inferencia estadística
¿Qué es la inferencia estadística?
Se ocupa de tomar decisiones o hacer predicciones acerca de parámetros, las medidas numéricas descriptivas que caracterizan a una población
Métodos para hacer inferencias
Estimación: estimar o predecir el valor del parámetro
Prueba de hipótesis: tomar una decisión acerca del valor de un parámetro, con base en alguna idea preconcebida acerca de cuál podría ser su valor
Tipos de estimadores
Un estimador es una regla, generalmente expresada como fórmula, que nos dice cómo calcular una estimación basada en información de la muestra
Estimación puntual: Con base en datos muestrales, se calcula un solo número para estimar el parámetro poblacional. El número resultante se denomina "estimación puntual"
Estimación de intervalo: Con base en los datos muestrales, dos números se calculan para formar un intervalo dentro del cual se espera esté el parámetro. La regla se denomina "estimador de intervalo" y el par de números resultantes "estimación de intervalo o intervalo de confianza"
Estimación puntual
Existen varias estadísticas que podrían usarse como estimadores puntuales para un parámetro poblacional. Para determinar cual es mejor, se necesita saber como se comporta el estimador en muestreo repetido, descrito por su distribución muestral.
Las distribuciones muestrales dan información que se puede usar para seleccionar el mejor estimador
La distribución muestral del estimador puntual debe estar centrada sobre el valor verdadero del parámetro que se estimará
Se dice que un estimador de un parámetro es insesgado si la media de su distribución es igual al valor verdadero del parámetro. En caso contrario está sesgado.
Subtopic
La dispersión de la distribución muestral debe ser tan pequeña como sea posible
Error de estimación
La distancia entre una estimación y el parámetro estimado
Estimación de intervalo
Es una regla para calcular dos números (a y b) para crear un intervalo del que usted esté bastante seguro que contiene el parámetro de interés
Coeficiente de confianza
La probabilidad de que un intervalo de confianza contenga el parámetro estimado
Un buen intervalo de confianza tiene dos características deseables:
Es tan angosto como es posible. Cuanto más angosto sea el intervalo, más exactamente se habrá localizado el parámetro estimado
Tiene un coeficiente de confianza grande, cercano a 1. Cuanto mayo sea el coeficiente de confianza, es más probable que el intervalo contenga el parámetro estimado
Estimación de la diferencia entre dos medias poblacionales
La diferencia entre dos medias muestrales daría la máxima información acerca de la diferencia real entre dos medias poblacionales
La media de (x1-x2) y el error estándar es:
. /r1^2 r2^2
SE=√------ + ------
n1 n2
Estimación de la diferencia entre dos proporciones binomiales
Una simple extensión de la estimación de una proporción binomial p es la estimación de diferencia entre dos proporciones binomiales
Prueba de hipótesis acerca de parámetros poblacionales
Una inferencia estadística comprende la estimación de un parámetro poblacional o tomar decisiones acerca del valor del parámetro
Prueba estadística de hipótesis
Formada por cinco partes
1- La hipótesis nula, denotada por H0
2- La hipótesis alternativa, denotada por Ha
3- El estadístico de prueba y su valor p
4- La región de rechazo
5- La conclusión
Las dos hipótesis en competencia son la hipótesis alternativa Ha, generalmente la que el investigador desea apoyar, y la hipótesis nula H0, una contradicción de la hipótesis alternativa
El investigador estadístico siempre empieza por suponer que la hipótesis nula H0 es verdadera. El investigador utiliza entonces los datos muestrales para decidir si la evidencia está a favor de Ha más que de H0 y saca una de dos conclusiones
Rechaza H0 y concluye que Ha es verdadera
Acepta H0 como verdadera
Un error tipo I para una prueba estadística es el error de rechazar la hipótesis nula cuando es verdadera. El nivel de significancia para una prueba estadística de hipótesis es:
a=P(error tipoI)=P(rechazar falsamente H0)=P(rechazar H0 cuando es verdadera)
a= el máximo riesgo tolerable de rechazar incorrectamente H0
Prueba de muestra grande acerca de una media poblacional
Considere una muestra aleatoria de n mediciones sacadas de una población que tiene una media de M y una desviación estándar r. Se desea probar una hipótesis de la forma
H0 : M = M0
Donde M0 es algún valor hipotético para M, contra una hipótesis alternativa de una cola
Ha : M > M0
La media muestral X es la mejor estimación del valor real de M
Los valores de x que son extremadamente grandes implicarían que M es mayor que lo hipotético. En consecuencia, debe rechazarse H0 si x es demasiado grande
Definiendo demasiado grande como estar a demasiadas desviaciones estándar de M0
Como la distribución muestral de la media muestral x es aproximadamente normal cuando n es grande, el número de desviaciones estándar a las que x está desde M0 se pueden medir usando el estadístico estandarizado de prueba
z= (x-M0)/(s raíz de n)
Para evitar ambigüedades en las conclusiones, algunos experimentadores prefieren usar un nivel de significancia variable llamada valor p para la prueba
El valor p o nivel de significancia de un estadístico de prueba es el valor más pequeño de a para el cual H0 se puede rechazar. Es el riesgo real de cometer un error tipo I, si H0 es rechazada con base en el valor observado del estadístico de prueba. El valor p mide la fuerza de la evidencia contra H0
Un valor p pequeño indica que el valor observado del estadístico de prueba se encuentra alejado del valor hipotético de M. H0 es falsa y debe ser rechazada
Si el valor p es menor o igual a un nivel de significancia a asignado previamente, entonces la hipótesis nula es rechazada y se puede informar que los resultados son estadísticamente significativos al nivel a
Tipos de errores
Error tipo I para una prueba estadística ocurre si se rechaza la hipótesis nula cuando es verdadera. La probabilidad de cometer un error tipo I se denota por el símbolo a
Error tipo II para una prueba estadística ocurre si se acepta la hipótesis nula cuando es falsa y alguna hipótesis alternativa es verdadera. La probabilidad de cometer un error tipo II se denota por el simbolo B
La potencia de una prueba estadística
Esta dada como 1-B = P(rechazar H0 cuando Ha es verd) mide la capacidad de a prueba para funcionar como se requiere.
La cantidad (1-B) se denomina potencia de la prueba debido a que mide la probabilidad de tomar la acción que deseamos que ocurra, esto es, rechazar la hipótesis nula cuando es falsa y Ha es verdadera
Una gráfica de (1-B) la probabilidad de rechazar H0 cuando en realidad H0 es falsa, como una función del valor verdadera del parámetro de interés se denomina curva de potencia para la prueba estadística.
Inferencias sobre dos varianzas de población
La distribución F
Tiene dos parámetros, denotados por v1 (número de grados de libertad del numerador) y v2 (número de grados de libertad del denominador) v1 y v2 son enteros positivos
F=(x1/v1)/(x2/v2)
Intervalo de confianza para r1/r2
Se basa en el reemplaso de F en el enunciado de probabilidad
P(F1-a/v1v2 <F<Fa/2v1v2) = 1 - a
Con variable F y al manipular las desigualdades para aislar r1`^2/ r2^2. Se obtiene un intervalo para r1/r2 al tomar la raíz cuadra de cada límite