Medidas Estadísticas Univariantes
Medidas de Tendencia Central
Media
La media es la medida de tendencia central que se obtiene sumando todos los valores de un conjunto de datos y dividiendo el resultado por el número total de valores.
Sensible a todos los valores en el conjunto de datos.
Puede ser afectada por valores atípicos o extremos.
Se utiliza comúnmente para describir el "promedio" de un conjunto de datos.
Media Aritmética: Se calcula sumando todos los valores y dividiendo por el número de valores.
Utilizada en finanzas, estadísticas económicas, puntuaciones académicas, etc.
Media Aritmética: La más común, se utiliza para datos cuantitativos.
Media Ponderada: Asigna pesos a diferentes valores antes de calcular la media.
Media Geométrica: Útil para datos que crecen de manera exponencial.
Mediana
La mediana es el valor central en un conjunto de datos ordenados de manera ascendente o descendente. Divide el conjunto de datos en dos partes iguales.
No se ve afectada por valores extremos.
Útil cuando los datos están sesgados o tienen valores atípicos.
No utiliza todos los valores del conjunto de datos, solo el valor central.
Mediana Simple: Selecciona el valor medio después de ordenar los datos.
Mediana Simple: Para conjuntos de datos impares, es el valor central.
Mediana Ponderada: Considera pesos en los valores antes de calcular la mediana.
Empleada en estadísticas de ingresos, para describir la posición central sin verse afectada por valores extremos.
Moda
La moda es el valor que ocurre con mayor frecuencia en un conjunto de datos.
Puede haber una o más modas, o incluso ninguna.
No es sensible a valores extremos.
Aplicable a datos cualitativos y cuantitativos.
Moda Simple: Valor más frecuente en el conjunto de datos.
Moda Simple: Unimodal, bimodal, multimodal, o sin moda.
Se utiliza en marketing, investigación de mercado y en la moda para identificar preferencias o tendencias dominantes.
Medidas de Posición
Cuartiles
Son tres valores que dividen un conjunto de datos ordenado en cuatro partes iguales. Los cuartiles comunes son el primer cuartil (Q1), la mediana (Q2) y el tercer cuartil (Q3).
Representan Posiciones Relativas: Permiten dividir un conjunto de datos en partes proporcionales.
Se calculan ordenando los datos y seleccionando los valores específicos que representan las posiciones relativas.
Primer Cuartil (Q1): 25% de los datos por debajo.
Mediana (Q2): 50% de los datos por debajo.
Tercer Cuartil (Q3): 75% de los datos por debajo.
Análisis de Distribución de Datos: Ayudan a entender cómo se distribuyen los datos en un conjunto.
Deciles
Son nueve valores que dividen un conjunto de datos ordenado en diez partes iguales. El primer decil (D1), el quinto decil (D5) y el noveno decil (D9) son ejemplos comunes.
Ayudan a Identificar la Dispersión: Proporcionan información sobre la dispersión de los datos.
Se calculan ordenando los datos y seleccionando los valores específicos que representan las posiciones relativas.
Primer Decil (D1): 10% de los datos por debajo.
Quinto Decil (D5): 50% de los datos por debajo (equivale a la mediana).
Noveno Decil (D9): 90% de los datos por debajo.
Comparación de Conjuntos: Facilitan la comparación de conjuntos de datos en términos de posición y dispersión.
Percentiles
Son 99 valores que dividen un conjunto de datos ordenado en 100 partes iguales. El percentil p indica que p por ciento de los datos son iguales o inferiores a ese valor.
Robustos: Menos sensibles a valores extremos que la media.
Se calculan ordenando los datos y seleccionando los valores específicos que representan las posiciones relativas.
Percentil P: P% de los datos por debajo.
Evaluación de Rendimiento: Se utilizan en campos como la evaluación académica para clasificar el rendimiento de los estudiantes en percentiles.
Medidas de Apuntamiento
Curtosis
La curtosis es una medida estadística que cuantifica la forma de la distribución de un conjunto de datos, específicamente la forma y la altura de sus colas en comparación con la distribución normal.
Distribución Normal: Una curtosis de cero indica una distribución normal.
Colas de la Distribución: Curtosis positiva (leptocúrtica) significa colas más pesadas, mientras que curtosis negativa (platicúrtica) significa colas más ligeras.
Importancia Relativa: La curtosis se refiere a la concentración de valores en las colas, no en el cuerpo de la distribución.
La curtosis se mide mediante el coeficiente de curtosis, siendo cero para una distribución normal. Se puede expresar como curtosis positiva o negativa.
Curtosis Positiva (Leptocúrtica): Colas más pesadas y distribución más concentrada.
Curtosis Negativa (Platicúrtica): Colas más ligeras y distribución menos concentrada.
Medidas de Asimetría
Las medidas de asimetría cuantifican la falta de simetría en una distribución de datos, es decir, la tendencia de la distribución a inclinarse hacia un lado.
Simetría: Una distribución simétrica tiene una asimetría igual a cero.
Dirección de la Cola: La asimetría positiva indica una cola más larga a la derecha, mientras que la asimetría negativa indica una cola más larga a la izquierda.
La asimetría se mide mediante coeficientes de asimetría, como el coeficiente de asimetría de Pearson o el coeficiente de asimetría de Fisher.
Asimetría Positiva (Derecha): Cola más larga a la derecha.
Asimetría Negativa (Izquierda): Cola más larga a la izquierda.
Análisis de Riesgo Financiero: La asimetría puede proporcionar información sobre la distribución de rendimientos.
Investigación de Mercado: Evaluar la asimetría de datos de ventas o ingresos.
Biología y Medicina: En estudios sobre el tamaño de órganos, donde la asimetría puede indicar posibles problemas de desarrollo.
Medidas de Dispersión
Rango
El rango es la diferencia entre el valor máximo y el valor mínimo en un conjunto de datos.
Proporciona una medida simple de la amplitud total de los datos.
Sensible a valores atípicos.
Se calcula restando el valor mínimo del valor máximo.
Rango simple: Diferencia entre el máximo y el mínimo.
Ofrece una visión rápida de la variabilidad total de un conjunto de datos.
Varianza
La varianza es una medida de dispersión que indica cuán dispersos están los valores de un conjunto de datos respecto a la media.
Sensible a valores atípicos.
Mide la variabilidad total de los datos.
Se calcula como la media de los cuadrados de las diferencias entre cada valor y la media.
Varianza poblacional.
Varianza muestral (ajustada por grados de libertad).
Utilizada en estadística y análisis de datos para evaluar la dispersión de los valores respecto a la media.
Desviación Típica
La desviación típica es simplemente la raíz cuadrada de la varianza. Proporciona una medida más interpretable de la dispersión.
Expresa la dispersión en las mismas unidades que los datos originales.
Más comúnmente usada y fácil de interpretar que la varianza.
Se obtiene tomando la raíz cuadrada de la varianza.
Desviación típica poblacional.
Desviación típica muestral (ajustada por grados de libertad).
Ampliamente utilizada en estadística y análisis de datos para describir la dispersión de un conjunto de datos.
Coeficiente de Variación
El coeficiente de variación es una medida relativa de la dispersión que compara la desviación típica con la media, expresada como un porcentaje.
Permite comparar la variabilidad entre conjuntos de datos con diferentes unidades o escalas.
Es útil cuando se desea evaluar la variabilidad en relación con el tamaño medio de los valores.
Se calcula dividiendo la desviación típica entre la media y multiplicando por 100 para expresarlo como porcentaje.
Coeficiente de variación poblacional.
Coeficiente de variación muestral (ajustada por grados de libertad).
Principalmente utilizado en la comparación de la variabilidad relativa entre conjuntos de datos con diferentes escalas.