Medidas de Estadística Univariantes Informa el centro de la distribución
de la muestra o población estadística.
Medidas de Dispersión
Las medidas de dispersión son parámetros estadísticos que nos informan sobre la variabilidad de los datos, es decir, si la distribución de los datos es más o menos homogénea y por tanto nos dan una medida sobre la representatividad de los parámetros de centralización (moda, mediana o media)
Coeficiente de variación que se expresa tanto de forma decimal como en tanto por ciento, y nos expresaría la desviación típica como porcentaje con respecto a la media.
Desviación Típica: Definimos la desviación típica como la raíz cuadrada de la varianza.
Varianza: transformar los valores negativos en positivos es elevando al cuadrado.
Por tanto, la varianza va a ser la media del cuadrado de la distancia de los valores de los datos a la media.
Desviación media: Es la media de la distancia de los valores de los datos (en valor absoluto) a la media.
El uso del valor absoluto es para evitar que se anulen distancias negativas con distancias positivas, lo que daría como resultado que la desviación media sea cero para cualquier distribución de datos.
Rango: Es la diferencia entre el mayor valor de los datos y el menor.
Re = Max {xi} - Min {xi}
Medidas de Tendencia Central
Moda
se representa Mo dentro de una distribución,y expresa el valor de la variable con la mayor frecuencia o la más repetida.
Mediana
Ordena la distribución de frecuencia de menor a mayor, se identifica por Me, es un valor del recorrido de la variable que deja el mismo número de observaciones a su izquierda a su derecha.
Distribución de frecuencia de valores agrupados.
se define clase mediana o intervalo mediano, cuando el # de dato es impar es el intervalo que contiene al dato central, si es par los datos pertenecen a un mismo intervalo se determinan con la sgte formula.
Distribución de frecuencia de valores sin agrupar
Presenta si el # de datos es impar se halla con las siguiente formula: N +1/ 2 y cuando es par se utiliza formula N /2
Media
Es el valor promedio de un
conjunto de datos numéricos
Calcula la suma del conjunto
de valores dividida entre el número total de valores.Formula es:
Medidas de Posición
Percentil
Datos no agrupados Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes fórmulas:
Para los percentiles, cuando n es par: A*n / 10 cuando n es impar A( n+ 1 ) / 100
Datos Agrupados formula Pk=Lk+ k(n/100)-fk/fk *C . k= 1,2,3,... 99
Donde:
Lk = Límite real inferior de la clase del decil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
Son ciertos números que dividen la sucesión de datos ordenados en cien partes porcentualmente iguales. Estos son los 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Los percentiles (P1, P2,... P99), leídos primer percentil,..., percentil 99.
Deciles
Datos no agrupados
formula es: Si se tienen una serie de valores X1, X2, X3 ... Xn, cuando n es par A*n/10, cuando n es impar A ( n+1)/ 10. donde A es numero de decil.
Datos agrupadoS se calcula con la formula Dk=Lk+ k(n/10)-fk/fk *C . k= 1,2,3,... 9
Donde:
Lk = Límite real inferior de la clase del decil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
Son ciertos números que dividen la sucesión de datos ordenados en diez partes porcentualmente iguales,Los deciles se denotan D1, D2,..., D9, que se leen primer decil, segundo decil, etc.
Cuartil
Para datos No agrupados. Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes fórmulas: Q1= cuando n es par 1*n / 4 cuando n es impar 1(n + 1) / 4 Q3= cuando n es par 3*n / 4 cuando n es impar 3(n + 1) / 4
Q3= Es el menor valor que es mayor que tres cuartas partes de los datos, es decir aquel valor de la variable que supera al 75% y es superado por el 25% de las observaciones, su formula es la siguiente. Q2=Li+ p-fa-1/f1 *ICP=3n/4
Q2= Es idéntico o similar a la mediana, Q2 = Md, es el menor valor que es mayor que la mitad de los datos, es decir el 50% de las observaciones son mayores que la mediana y el 50% son menores, su formula es la siguiente. Q2=Li+ p-fa-1/f1 *ICP=2n/4
Q1= Es el valor menor de una cuarta parte de los datos observados su formula individual: Q1=Li+ p-fa-1/f1 *ICP=n/4
En datos Agrupados la formula para el calculo de los cuartiles general es el siguiente: Qk=Lk+ k(n/4)-fk/fk *C . k= 1,2,3
Donde:
Lk = Límite real inferior de la clase del cuartil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del cuartil k.
fk = Frecuencia de la clase del cuartil k
c = Longitud del intervalo de la clase del cuartil k
Son tres valores que dividen al conjunto de datos ordenados en cuatro partes % iguales.