Categorii: Tot - distribución - desviación - hipótesis - significancia

realizată de Monik Reyes 7 ani în urmă

954

MUESTRAS PEQUEÑAS Y MUESTRAS GRANDES

La comparación entre muestras pequeñas y grandes es esencial en estudios estadísticos. Un ejemplo claro es el análisis del consumo energético de aspiradoras realizado por el Instituto Eléctrico Edison.

MUESTRAS PEQUEÑAS Y MUESTRAS GRANDES

MUESTRAS PEQUEÑAS Y MUESTRAS GRANDES

MUESTRAS GRANDES

Bajo ciertas condiciones de regularidad, es posible construir intervalos de confianza asintóticos de una manera bastante general. Si suponemos que un parámetro θ tiene una estimación máximo verosímil θ*, la distribución asintótica del estimador, bajo condiciones generales de regularidad, es Normal, de media el valor verdadero del parámetro θ y varianza igual a la cota de Cramér-Rao σ2(θ*). Bajo las suposiciones anteriores, es posible construir un intervalo de confianza asintótico y con nivel de confianza (1 − α) · 100 % a partir de donde los valores de zα/2 se calculan a partir de la distribución N(0, 1) de forma que P(|Z| > zα/2) = α. Es decir, se utiliza como estadístico pivote
Prueba de dos extremos para las medias Es cuando el nivel de significancia (zona de rechazo) abarca los dos extremos o colas de la campana de Gauss.
EJEMPLO El fabricante de una llanta especial para camiones afirma que la duración media de la parte rodante de agarre es de 60,000 mi. La desviación estándar de los millajes es de 5,000 mi. Una empresa de transportes compró 48 llantas y halló que la duración media para sus vehículos fue de 59,500 mi. ¿Es la experiencia distinta de la expresada por el fabricante al nivel de significación de 0.05?  = 60,000 mi  = 5,000 mi Datos: n = 48 llantas = 59,500 mi  = 0.05

Las hipótesis se expresan de la siguiente manera: H0 :  = 60,000 mi La duración de las llantas es de 60,000 millas H1 :   60,000 mi La duración de las llantas es distinta a 60,000 millas Primero, vamos a calcular el error estándar de la media y para ello emplearemos la expresión del error estándar:

La media muestral se ubica dentro de la zona de aceptación, por lo que podemos decir que la hipótesis nula es verdadera, pero vamos a verificar está aseveración por medio de la expresión siguiente. Entonces la media muestral se ubica en -0.693 y se confirma que cae en la zona de aceptación. Concluimos que la duración media de las llantas es muy cercana a la que afirma el fabricante de 60,000 millas, con un nivel de significancia de 0.05.

Recurrimos a las tablas de la distribución normal y en ellas localizamos 0.475, que se ubica en un valor de Z = 1.96 En el tercer paso, vamos a determinar los límites superior e inferior de confianza para el intervalo de la media poblacional ya que se trata de una prueba de dos extremos. Sustituyendo valores en ella, se tiene: Lc = 60,000  1.96 (721.69) Ls = 60,000 + 1,414.51 Ls = 61,414.51 millas. Li = 60,000 – 1,414.51 Li = 58,585.49 millas Entonces la media de la población fluctúa entre 58,585.49 y 61,414.51 millas en un nivel de confianza del 95%.

MUESTRAS PEQUEÑAS (teoria exacta del muestreo)

DISTRIBUCION "t DE STUDENT" Supóngase que se toma una muestra de una población normal con media y varianza . Si es el promedio de las n observaciones que contiene la muestra aleatoria, entonces la distribución es una distribución normal estándar. Supóngase que la varianza de la población 2 es desconocida. ¿Qué sucede con la distribución de esta estadística si se reemplaza por s? La distribución t proporciona la respuesta a esta pregunta. La media y la varianza de la distribución t son = 0 y para >2, respectivamente. La siguiente figura presenta la gráfica de varias distribuciones t. La apariencia general de la distribución t es similar a la de la distribución normal estándar: ambas son simétricas y unimodales, y el valor máximo de la ordenada se alcanza en la media = 0. Sin embargo, la distribución t tiene colas más amplias que la normal; esto es, la probabilidad de las colas es mayor que en la distribución normal. A medida que el número de grados de libertad tiende a infinito, la forma límite de la distribución t es la distribución normal estándar.
Propiedades de las distribuciones t Cada curva t tiene forma de campana con centro en 0. Cada curva t, está más dispersa que la curva normal estándar z. A medida que aumenta, la dispersión de la curva t correspondiente disminuye. A medida que , la secuencia de curvas t se aproxima a la curva normal estándar, por lo que la curva z recibe a veces el nombre de curva t con gl =
A la teoría de pequeñas muestras también se le llama teoría exacta del muestreo, ya que también la podemos utilizar con muestras aleatorias de tamaño grande. Para definir grados de libertad se hará referencia a la varianza muestral: Esta fórmula está basada en n-1 grados de libertad (degrees of freedom). Esta terminología resulta del hecho de que si bien s2 está basada en n cantidades . . . , éstas suman cero, así que especificar los valores de cualquier n-1 de las cantidades determina el valor restante. Por ejemplo, si n=4 y ; y , entonces automáticamente tenemos , así que sólo tres de los cuatro valores de están libremente determinamos 3 grados de libertad. Entonces, en esta unidad la fórmula de grados de libertad será n-1 y su simbología
Ejemplos: 1. El Instituto Eléctrico Edison publica cifras del número anual de Kilowatt-hora que gastan varios aparatos eléctrodomésticos. Se afirma que una aspiradora gasta un promedio de 46 kilowatt-hora al año. Si una muestra aleatoria de 12 hogares que se incluye en un estudio indica que las aspiradoras gastan un promedio de 42 kilowatt-hora al año con una desviación estándar de 11.9 kilowatt-hora, ¿esto sugiere con un nivel de significancia de 0.05 que las aspiradoras gastan, en promedio, menos de 46 kilowatt-hora anualmente? Suponga que la población de kilowatt-hora es normal.
Decisión y justificación : Como –1.16 > -1.796, por lo tanto no se rechaza Ho y se concluye con un nivel de significancia del 0.05 que el número promedio de kilowatt-hora que g astan al año las aspiradoras no es significativamente menor que 46.
2. Prueba de hipótesis Ho; μ = 46 kilowatt-hora H1; μ < 46 kilowatt-hora 3. Valores críticos tc para 0.95 (α = 0.05) con 11 grados de libertad 4. Regla de decisión: Si t ≥ -1.796 No se rechaza Ho Si t < -1.796 Se rechaza Ho
Solución: 1. Datos: μ= 46 kilowatt-hora s= 11.9 kilowatt-hora x= 42 kilowatt-hora n = 12 α = 0.05
Si de una población Normal con media u y desviación estándar o se extrae una muestra de tamaño n, entonces el estadístico es:  Que se distribuye como una t de Student con n-1 grados de libertad. 20 𝑡 = 𝑋 − 𝜇 𝑆 𝑛
INTERVALO DE CONFIANZA PARA ; CON DESCONOCIDA Si y s son la media y la desviación estándar de una muestra aleatoria de una población normal con varianza , desconocida, un intervalo de confianza de ()100% para es: donde /2 es el valor t con = n-1 grados de libertad, que deja un área de /2 a la derecha. Se hace una distinción entre los casos de conocida y desconocida al calcular las estimaciones del intervalo de confianza. Se debe enfatizar que para el primer caso se utiliza el teorema del límite central, mientras que para desconocida se hace uso de la distribución muestral de la variable aleatoria t. Sin embargo, el uso de la distribución t se basa en la premisa de que el muestreo se realiza de una distribución normal. En tanto que la distribución tenga forma aproximada de campana, los intervalos de confianza se pueden calcular cuando la varianza se desconoce mediante el uso de la distribución t y se puede esperar buenos resultados. Con mucha frecuencia los estadísticos recomiendan que aun cuando la normalidad no se pueda suponer, con desconocida y n30, s puede reemplazar a y se puede utilizar el intervalo de confianza: Por lo general éste se denomina como un intervalo de confianza de muestra grande. La justificación yace sólo en la presunción de que con una muestra grande como 30, s estará muy cerca de la real y de esta manera el teorema del límite central sigue valiendo. Se debe hacer énfasis en que esto es solo una aproximación y que la calidad de este enfoque mejora a medida que el tamaño de la muestra crece más.
Se utiliza muestras pequeñas cuando la distribución de donde proviene la muestra tenga un comportamiento normal, cuando los tamaños de las muestras fueran mayores o iguales a 30.