medidas de tendencia central y de variabilidad

MEDIDAS DE TENDENCIA CENTRAL

Las distribuciones de los datos
pueden adoptar varias formas. En algunas distribuciones los datos tienden a agruparse más en una
parte de la distribución que en otra

para esto encontramos Dos características son de particular importancia para los
responsables de tomar decisiones: la tendencia central y la dispersión

M E DIDAS DE V ARIA B I L IDAD

Dispersión: L a dispersión se refiere a la extensión de los datos, es decir al grado en que las
observaciones se distribuyen(o se separan).

Existe otras dos características de los conjuntos de datos que proporcionan información útil: el

sesgo y la curtosis.

sesgo: Las curvas que representan un conjunto de datos pueden ser simétricas o
sesgadas

curtosis: Nos da una idea de la agudeza (o lo plano) de la distribución de frecuencias.
Una curva normal (es el patrón con el que se compara la curtosis de otras curvas) tiene curtosis 0.
Esta curva se llama mesocúrtica

MEDIDAS DE DISPERSIÓN
Las medidas de dispersión son útiles porque:
Nos proporcionan información adicional que nos permite juzgar la confiabilidad de nuestra medida

de tendencia central. Si los datos están muy dispersos la posición central es menos representativa de

los datos, como un todo, que cuando estos se agrupan más estrechamente alrededor de la media.

RANGO:
Es la diferencia entre el mayor y el menor de los valores
Observados

VARIANZA Y DESVIACIÓN ESTÁNDAR

Las descripciones más comprensibles de la dispersión son aquellas que tratan con la desviación
promedio con respecto a alguna medida de tendencia central. Veremos dos medidas que nos dan una

distancia promedio con respecto a la media de la distribución: varianza y desviación estándar.

DESVIACIÓN ESTÁNDAR DE LA POBLACIÓN:

Es la raíz cuadrada de la varianza

Aplicación de la desviación estándar poblacional

La desviación estándar nos permite determinar, con un buen grado de precisión, dónde están
localizados los valores de una distribución de frecuencias con relación a la media.

El coeficiente de variación es una medida relativa de dispersión que expresa a la desviación
estándar como un porcentaje de la media

El percentil p es un valor tal que por lo menos p porciento de las observaciones son menores o
iguales que este valor y por lo menos (100-p) por ciento de las restantes son mayores o iguales que
ese valor.

MEDIDAS DE TENDENCIA CENTRAL: Moda, mediana y media

Moda:
es el valor que más se repite en un conjunto de datos.

Cálculo de la moda para datos agrupados
Si los datos están agrupados en una distribución de frecuencias, se selecciona el intervalo de clase


que tiene mayor frecuencia llamado clase modal

VENTAJAS Y DESVENTAJAS DE LA MODA

Se puede utilizar para datos cualitativos nominales u ordinales y para datos
cuantitativos

No se ve afectada por los valores extremos

Se puede utilizar cuando la distribución de frecuencias tenga clases abiertas

Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, se dice que

no tiene moda

Mediana:

es el valor que divide al conjunto ordenado de datos, en dos subconjuntos
con la misma cantidad de elementos. La mitad de los datos son menores que la

mediana y la otra mitad son mayores

Número impar de datos: La mediana es el dato que está en la posición

n +1\2

Número par de datos: Es el promedio entre los dos datos centrales

Cálculo de la mediana para datos agrupados
Si los datos están agrupados en una distribución de frecuencias, se selecciona el intervalo de
clase que contiene a la mediana llamado clase mediana. Para ello, debemos determinar la frecuencia

acumulada absoluta que contenga al elemento número

n + 1\2

VENTAJAS Y DESVENTAJAS DE LA MEDIANA

Se puede utilizar para datos cualitativos ordinales y para datos cuantitativos No se ve afectada por los valores extremos. Esta es la propiedad más importante que
tiene.
v Se puede utilizar cuando la distribución de frecuencias tiene clases abiertas, a menos

que la mediana caiga en una de las clases abiertas

Media o media aritmética:

Es el promedio de los datos

Cálculo de la media para datos no agrupados Cuando calculamos la
media de la población, dividimos por la cantidad de datos de la población N y cuando se calcula la
media muestral por n

Cálculo de la media para datos agrupados

Para calcular la media para datos agrupados, primero calculamos el punto medio de cada clase
(marca de clase mi

). Después multiplicamos cada punto medio por la frecuencia absoluta de cada

intervalo

VENTAJAS Y DESVENTAJAS DE LA MEDIA
v Se trata de un concepto familiar e intuitivamente claro
v Cada conjunto de datos tiene una media y es única

v Es útil para llevar a cabo procedimientos estadísticos como la comparación de medias

de varios conjuntos de datos. En estadística inferencial es la medida de tendencia

central que tiene mejores propiedades