door Marttha Irachetta 3 jaren geleden
206
Meer zoals dit
tipos
momento 4
Constituye la base de un índice de curtosis
momento 3
Constituye la base de un índice de asimetría
momento 2
- Es el numerador de la fórmula de la varianza
momento 1
-Vale cero (las desviaciones de la media suman cero)
El momento de orden (r) respecto a la media
momento respecto a la media
Detectar valores repetitivos o muy diferentes
herramientas exploratorias
detectar posibles anomalías
herramientas descriptivas
caracterización apropiada de los datos
por gráficos
Histograma
parecido al gráfico de barras, Histograma pero con las barras juntas
formar intervalos agrupando unos pocos valores consecutivos
el plano definido por dos ejes cartesianos.
Polígono de frecuencias
A partir de la unión de con una línea los puntos medios de los bordes superiores de cada barra del histograma
Diagrama de caja
formarse una idea muy rápida sobre las tres propiedades esenciale
centro
forma
dispersión
Diagrama de tallo y hojas
comprobar si existen valores que se repiten mucho o valores que no aparecen
curtosis
A grado de apuntamiento.
forma de su distribución de frecuencias/probabilidad
asimetría
A la forma en que los datos se distribuyen por encima y por debajo del centro
Las distribuciones a cada lado del centro tienen la misma forma
Donde la dispersión
Es baja
La mayoría de los valores se encuentran próximos al centro
Es alta
La mayoría de los valores se encuentran alejados del centro
Precisar si el centro de una distribución es o no un buen representante del resto de valores
Medir a traves de estadisticos
¿Cuáles son?
Comparación entre estadísticos de dispersión
Desviación típica un estadístico no resistente pero servicial
Funciona de mejor forma al pasar de la fase descriptiva a la inferencial.
El estadístico más resistente es la mediana de las desviaciones
Las amplitudes son el total
Intercuartil basada en la distancia entre 2 valores
La desviación promedio basada en las distancias al centro de la distribución
Amplitud sensible a casos anómalos
Ser concretos en lo que se desea conocer
25% de datos desechados
La dispersión siempre es positiva
Baja, media o alta pero nunca negativa
No se altera cuando sufre suma o resta pero si cuando se multiplica o divide
La varianza no es realmente útil
Coeficiente de variación
CV: Desviación típica / media
Se define como el cociente o la división entre la desviación típica y la media.
Se usa para comparar la variabilidad o dispersión de datos con diferentes unidades de medida
Es una medida de dispersión relativa.
3. Varianza y desviación típica
Desviación típica
la raíz cuadrada de la varianza
La raíz cuadrada de la medida de los cuadrados de las puntuaciones de desviación
SY= √ (ΣYi - Y)2/ (n - 1)
SY = √ Σyi2/ (n - 1)
denominador se está utilizando n - 1
desviación típica insesgada.
Varianza
no permite formarse una idea acertada del grado de dispersión de una variable.
Que las distancias a la media están elevadas al cuadrado
Intentar medir la distancia física entre dos puntos utilizando una medida de superficie en lugar de una medida de longitud.
El promedio de las desviaciones cuadráticas de la media, es decir, el promedio de las desviaciones de la media elevadas al cuadrado.
comparar entre sí distintos grupos y saber en cuál de ellos hay mayor dispersión
S2Y(n) = (ΣYi - Y)2/n
S2Y(n) = Σyi2/n
El subíndice n indica el valor del denominador
Varianza muestral
un valor muestral que tiende a ser menor que el valor poblacional.
simplemente restando 1 al tamaño muestral en el denominador
varianza insesgada o también puede encontrarse con el nombre de cuasivarianza.
un programa informático como el SPSS
Que se obtiene es la varianza insesgada.
S2Y
S2Y(n) = ΣYi2/n - 1
Varianza poblacional
El subíndice Y identifica a la variable.
2. Desviaciones promedio
Media de las desviaciones
Las desviaciones se toman en valor absoluto y su suma se divide por el número de puntuaciones
La desviación promedio:
La desviación que una puntuación experimenta respecto de la media de su distribución.
el grado de dispersión de esa puntuación.
La suma de todas las desviaciones de un conjunto de datos
la dispersión total del conjunto
1. Amplitudes
amplitud intercuartil
AIQ = Q3 - Q1
AIQ
En la distancia existente entre los cuartiles primero y tercero
amplitud total
AT
En calcular la diferencia entre el valor más grande (Y máx) y el más pequeño (Y mín).
rango, recorrido o amplitud
AT= Ymáx - Ymin