MEDIDAS DE POSICIÒN
Se distinguen entre
Medidas de tendencia central
Media aritmètica
Es la suma de todos los valores de la variable divididos por el nùmero total de observaciones.
Se denota por (X), que es la media.
Esta medida sòlo se puede calcular si la variable estadìstica objeto de estudio es de naturaleza cuantitativa.
El valor que toma la media debe estar siempre incluido entre el valor mìnimo y màximo del dominio de la variable analizada.
Al analizar cada elemento, el producto xi ni, la suma corresponde con el numerador de la expresiòn de la media, que se obtiene al dividir por el nùmeo total de observaciones (N), en este caso N=4.
Ejemplo
La media de estos empleados, se encuentra comprendida entre el mìnimo valor de la variable (x1=14) y el màximo (x3=16).
La media aritmètica puede utilizarse si los datos con los que se trabaja son de naturaleza aditiva, es decir, que al sumar todos los valores, estos representen el total de la poblaciòn.
Por ejemplo: Las variables aditivas son; el nùmero de empleados, la renta, el salario, etc. Mientras que las no aditivas son; tipos de interès, valocidad, rentabilidad, etc.
Media armònica, que se denota por Mh
Se define como
Siendo
Si las frecuencias son unitarias ( ni=1 ∀ i)
Para calcular la media armònica suele utilizarse que la inversa de la media armònica es la media aritmètica de los valores inversos de la variable, esto es:
Media geomètrica
Es empleada cuando las variables son de naturaleza multiplicativa en el sentido de que los intereses generan nuevos intereses o cuando el incremento salarial se efectùa sobre el anterior y no sobre como fijo, se denota por Mg y se define como:
Cuando las frecuencias son unitarias (ni=1∀ ).
A la hora de calcular la media geomètrica suele utilizarse que el logaritmo de la media geomètrica que es igual a la media aritmetica de los logaritmos de los valores de la variable, esto es:
Mediana
Ordenada la distribuciòn de frecuencias de menor a mayor.
La mediana se denota por Me.
Es un valor del recorrido de la variable que deja el mismo nùmero de observaciones tanto a su izquierda como a su derecha.
Para el calculo de la mediana es necesario distinguir entre distribuciones de frecuencias de valores sin agrupar y agrupados, pero hay que tener presente que la mediana es el vlaor de la variable alq ue corresponde una frecuencia acumulada igual a N/2.
Valores sin agrupar
Valores agrupados
Distribuciones de frecuencias unitarias
Cuando el nùmero de observaciones es Impar, el valor de la mediana coincidirà con el valor xi (Me=xi) a la derecha e izquierda el mismo nùmero de observaciones.
Ejemplo:
Una variable estadìstica X toma los siguientes 7 valores distintos:
Determinar la mediana
El valor de la variable xi= 6 deja el mismo nùmero de observaciones, un total de 3 a cada lado.
Entonces, la mediana es:
El valor de la variable que deja el mismo nùmero de observaciones a ambos lados, la mediana, se sitùa entre 5 y 6 asì:
Cuando el nùmero de observaciones es Par, entonces el valor de la mediana se obtendrà como media del valor (4).
Por ejemplo:
Distribuciones de frcuencias no unitarias.
Cuando la distribuciòn de frecuencias es no unitarias, se suele utilizar el siguiente criterio para determinar el valor de la mediana.
Ni la primera frecuencia absoluta acumualada igual o superior a N/2, entonces:
Ejemplo:
Obtener la mediana en la siguiente distribuciòn de frecuencias
El valor de la variable que contiene frecuencia acumulada de 4 es x2 = 3,con N2=5.
Por tanto, como; entonces, Me=x2 → Me =2.
Distribuciòn de frecuencias agrupadas.
Hay menos interès, pues actualmente no se suele trabajar con datos agrupados, dado que la informatica permite manejar informaciòn sin necesidad de perder parte de ella en agrupaciones.
Primero se obtiene el llamado intervalo mediano, cuya freceucnia absoluta acumulada Ni alcacnza o sobrepasa N/2
Es decir:
Para precisar el valor de la variable que corresponde a la mediana, y la frecuencia correspondiente al intervalo y se atribuye uniformemente y por reparto proporcional se obtiene el valor buscado.
Determinar el intervalo mediano.
Para saber en què intervalo estarà la mediana lo primero es insertar una columna que represente la frecuencia absoluta acumulada (Ni), tal y como se refleja en la siguiente tabla:
La mediana es el valor de la variable que acumula.
Esta esta contenidoa en el intervalo¨[16, 20[,que es el intervalo mediano:
Moda
La moda es una distribuciòn, se denota por Mo, representa el valor de la variable con mayor frecuencia. No tiene por què ser ùnica.
Si hay dos o màs valores de la variable que tienen la misma freceucnia, siendo esta la mayor, se estarà ante una distribuciòn multimodal (Bimodal, dos modas; trimodal, tres modas;etc).
Al igual que como se procede en la mediana para determinar la moda debe distinguirse entre distribuciones de valores sin agrupar y agrupados.
Distribuciones de frecuencias de valores sin agrupar.
Segùn la definiciòn de la moda, hay que fijarse en cuàl de la variable que màs se repite, el de mayor frecuencia.
Ejemplo:
Se ha preguntado a 15 estudiantes por el nùmero de horas semanales dedicadas al estudio, recogièndose sus respuestas en la siguiente distribuciòn de frecuencias.
Obtener la moda del nùmero de horas de estudio. La moda es 5 (Mo=5), puesto que el valor de la variable con mayor frecuencia. Un total de 8 estudiantes dedican 5 horas a estudiar siendo sus respuestas:
Finalmente, la moda del nùmero de horas de estudio, se obtiene dado que todos los valores de la variable se considerarìan modas pues ni=1 ∀ i.
Distribuciones de frecuencias de valores agrupados.
Cuando se trabaja con valores agrupados en intervalos, lo màs sencillo para determinar el valor modal consiste en dibujar el histograma.
La moda estarà contenida en el intervalo de mayor altura, al que se denomina intervalo modal.
Ejemplo:
Obtener el intervalo modal de la distribuciòn de frecuencias.
Pero, para determinar el intervalo modal se añade a un acolumna que recoja la altura (hi) asociada a cada intervalo. en este caso, Todos los intervalos tienen la misma amplitud (ci=4), por lo que el intervalo de mayor frecuencia serà el que tenga mayor altura, por tanto, el intervalo modal: Pero existen casos en los que sin necesidad de realizar ningùn càlculo, es posible aproximar el valor que toma la moda en el intervalo modal, es decir, si los intervalos anterior, y posterior al intervalo modal tienen la misma altura, la moda coincidirà con la marca de clase. En cambio, si el intervalo posterior al modal es de mayor altura que el anterior.
Siguiendo el criterio de aproximar el vlaor de la moda en proporciòn a las alturas de los rectàngulosdel histogrma anterior y posterior al modal, se utiliza la sigueinte expresiòn:
Amplitud (Ci).
Altura ( hi).
Medidas de tendencia no central
Cuantiles.
Ordenados de menor a mayor los valores de la variable y dado un entero positivo K, las familias de cuantiles seràn valores del recorrido de la variable que dividiràn la distribuciòn en K, partes, conteniendo cada una de ellas la misma proorciòn de observaciones.
Las familias de Cuantiles màs utilizadas son aquellas que dividen la distribuciòn de frecuencias en cuatro, diez, y cien partes.
Cuartiles ( K=4)
Son tres valores (C s, S= 1,2,3) del recorrido que dividen la distribuciòn en 4 partes, conteniendo cada una de ellas el 25% de los datos observados.
Dèciles ( k=10).
Son nueve valores del recorrido (Ds, S=1,2,..., 9) que dividen la distribuciòn en 10 partes de tal forma que cada una de ellas contendrà el 10 % de los datos observados.
Percentiles (K=100).
Son noventa y nueve valores del recorrido (P s, S=1,2,...,99) que dividen la distribuciòn en 100 partes, conteniendo cada una de ellas el 1% de los datos observados.
En genera, (Para cualquier valor de K): Una familia de cuantiles de orden s= 1,2,...,(K-1), se identificarà como los (K-1) valores del recorrido de la variable.
Que dividiràn en K partes la distribuciòn de la variable conteniedno, cada una de ellas, una proporciòn de valores de:
Aunque anàlogamente, podemos identificar los dèciles y percentiles como cuantiles en general:
Para obtener el procedimiento de càlculo es analogo al estudiado en el caso de la mediana, es decir, suponiendo datos sin agrupar:
Donde Qs/k es el cuantil (cuantil, decil/ 0 percentil) que se quiere calcular y que acumularà una proporciòn de. Pero si la distribuciòn de frecuencias es de valores agrupados se determinarà el intervalo cuantìlico, es decir, aquel que contiene el cuantil que se quiere obtener.