Organizador parte 2. Capítulo 4 Análisis descriptivo de variables cuantitativas.
Medidas universales
Medidas de dispersión
El grado de parecido entre los datos en el sentido de concentración o alejamiento entre ellos.
Medir a traves de estadisticos
¿Cuáles son?
1. Amplitudes
amplitud total
AT= Ymáx - Ymin
En calcular la diferencia
entre el valor más grande (Y máx) y el más pequeño (Y mín).
rango,
recorrido o amplitud
AT
amplitud intercuartil
En la distancia existente
entre los cuartiles primero y tercero
AIQ
AIQ = Q3 - Q1
2. Desviaciones promedio
La desviación que una puntuación experimenta respecto de la media de su distribución.
el grado de dispersión de esa puntuación.
La suma de todas las desviaciones de un conjunto de datos
la dispersión total del conjunto
Media de las desviaciones
Las desviaciones se toman en valor absoluto y su suma se divide por el número de puntuaciones
La desviación promedio:
3. Varianza y desviación típica
Varianza
El promedio de las desviaciones cuadráticas de la media, es decir, el promedio de las desviaciones de la media elevadas al cuadrado.
S2Y(n) = (ΣYi - Y)2/n
S2Y(n) = Σyi2/n
El subíndice Y identifica a la variable.
El subíndice n indica el valor del denominador
Varianza poblacional
Varianza muestral
un valor muestral que
tiende a ser menor que el valor poblacional.
simplemente restando 1
al tamaño muestral en el denominador
varianza insesgada o también puede encontrarse con el nombre de cuasivarianza.
S2Y(n) = (ΣYi - Y)2/n
S2Y(n) = ΣYi2/n - 1
un programa informático como el SPSS
Que se obtiene es la varianza insesgada.
S2Y
comparar entre sí distintos grupos y saber en cuál de ellos hay mayor dispersión
no permite formarse una idea acertada del grado de dispersión de una variable.
Que las distancias a la media están elevadas al cuadrado
Intentar medir la distancia física entre dos puntos utilizando una medida de superficie en lugar de una medida de longitud.
Desviación típica
la raíz cuadrada de la varianza
La raíz cuadrada de la medida de los cuadrados de las puntuaciones de desviación
SY= √ (ΣYi - Y)2/ (n - 1)
SY = √ Σyi2/ (n - 1)
denominador se está utilizando n - 1
desviación típica insesgada.
Coeficiente de variación
Es una medida de dispersión relativa.
Se usa para comparar la variabilidad o dispersión de datos con diferentes unidades de medida
Se define como el cociente o la división entre la desviación típica y la media.
CV: Desviación típica / media
Comparación entre
estadísticos de dispersión
La dispersión siempre es positiva
Baja, media o alta pero nunca negativa
No se altera cuando sufre suma o resta
pero si cuando se multiplica o divide
La varianza no es realmente útil
Las amplitudes son el total
Intercuartil basada en la distancia entre 2 valores
La desviación promedio basada en las
distancias al centro de la distribución
Amplitud sensible a casos anómalos
Ser concretos en lo que se desea
conocer
25% de datos desechados
Desviación típica un estadístico no resistente pero servicial
Funciona de mejor forma al pasar de la fase descriptiva a la inferencial.
El estadístico más resistente es la mediana de las desviaciones
Precisar si el centro de una distribución es o no un buen representante del resto de valores
Donde la dispersión
Es alta
La mayoría de los valores se
encuentran alejados del centro
Es baja
La mayoría de los valores se
encuentran próximos al centro
Formas de distribución
valorar dos características
asimetría
A la forma en que los datos se distribuyen por encima y por debajo del centro
Las distribuciones a cada lado del
centro tienen la misma forma
curtosis
A grado de apuntamiento.
forma de su distribución de
frecuencias/probabilidad
Gráficos para variables
cuantitativas
por gráficos
Diagrama de tallo y hojas
comprobar si existen valores que se repiten mucho o valores que no aparecen
Diagrama de caja
formarse una idea muy rápida sobre las tres propiedades esenciale
centro
dispersión
forma
Polígono de
frecuencias
A partir de la unión de con una línea los puntos medios de los bordes superiores de cada barra del histograma
Histograma
parecido al gráfico de barras,
Histograma pero con las barras juntas
el plano definido por dos ejes cartesianos.
formar intervalos agrupando unos pocos valores consecutivos
análisis descriptivo y exploratorio
herramientas
descriptivas
caracterización
apropiada de los datos
herramientas
exploratorias
detectar posibles anomalías
En la tendencia central y de dispersión
Detectar valores repetitivos o muy diferentes
índices de asimetría y curtosis
momento respecto a la
media
El momento de orden (r) respecto
a la media
tipos
momento 1
-Vale cero
(las desviaciones de la media suman cero)
momento 2
- Es el numerador de la fórmula de la varianza
momento 3
Constituye la base de un índice de asimetría
momento 4
Constituye la base de un índice de curtosis